Vai al contenuto

Come funziona

Il sistema interviene in due momenti distinti: prima dell'invio della domanda a NotebookLM e dopo la ricezione della risposta. L'utente non deve fare nulla di diverso dal solito, entrambi gli interventi avvengono dietro le quinte.

Il flusso in tre fasi

Ogni interazione attraversa tre fasi.

  • Fase 1: strutturazione della domanda. L'utente pone una domanda in modo naturale. Claude legge le linee guida contenute nella descrizione del tool ask_question, che specificano come strutturare la richiesta. Sulla base di queste istruzioni Claude trasforma la domanda aggiungendo un formato di output tematico, un formato di citazione, un segnale di completezza e un segnaposto per le informazioni mancanti.

  • Fase 2: transito. Il server MCP riceve la domanda strutturata da Claude e la passa a NotebookLM senza modifiche. NotebookLM elabora la richiesta consultando i documenti caricati nel notebook selezionato e restituisce una risposta ancorata alle fonti.

  • Fase 3: controllo della risposta. La risposta di NotebookLM torna a Claude attraverso il server MCP. Prima che Claude la presenti all'utente, intervengono due meccanismi di controllo. Il primo è un promemoria di completezza, aggiunto automaticamente dal server a ogni risposta, che spinge Claude a confrontare la risposta ricevuta con la domanda originale dell'utente e a fare ulteriori domande a NotebookLM se qualcosa manca o non è chiaro. Il secondo sono le istruzioni di presentazione fedele, contenute nelle stesse linee guida lette nella fase 1, che indicano a Claude di presentare la risposta senza aggiungere conoscenze esterne o "miglioramenti".

Cosa succede in andata: la strutturazione

In un test condotto sui sette manuali ufficiali di DaVinci Resolve 20, caricati in un notebook NotebookLM, è stata fatta volutamente una richiesta generica:

Elenca le funzionalità basate su AI di DaVinci Resolve.

Claude ha trasformato questa domanda semplice in un prompt strutturato simile a questo:

Elenca le funzionalità basate su AI di DaVinci Resolve.

Organizza la risposta per argomenti tematici.
Cerca di coprire tutti gli aspetti trattati nei documenti.
Per ogni argomento:
- ARGOMENTO: [titolo identificativo]
- DESCRIZIONE: [sintesi con contesto, collegando le informazioni
  tra documenti diversi]
- EVIDENZE: "citazione diretta" [Fonte: documento]

Se un argomento appare in più documenti, mostra le evidenze
da ciascuno.
Se non presente nei documenti: [NON PRESENTE NEI DOCUMENTI]

L'utente non ha scritto nulla di tutto questo. La strutturazione è stata automatica, la domanda originale è stata preservata tale e quale, ma Claude ha aggiunto un formato di output strutturato, il formato delle citazioni e le istruzioni per le informazioni mancanti. Il risultato è stato un catalogo organizzato delle funzionalità AI con citazioni dirette dalla documentazione.

I tipi di domanda riconosciuti

Claude adatta la struttura del prompt in base al tipo di domanda rilevato. L'approccio è orientato al task, ogni tipo di domanda ha un pattern specifico che si concentra sulla struttura dell'output e sui riferimenti incrociati tra documenti.

  • Confronto: organizza la risposta per punti di confronto con somiglianze, differenze e riferimenti incrociati tra documenti diversi.

  • Elenco: organizza per argomenti tematici con descrizione e citazioni. Se lo stesso elemento appare in più documenti, mostra tutte le occorrenze e le eventuali discrepanze.

  • Analisi: organizza per argomenti tematici con sintesi e connessioni tra documenti diversi.

  • Spiegazione: struttura la risposta partendo dal concetto base con citazioni di supporto, esempi dai documenti, concetti correlati e limitazioni note.

  • Estrazione: è il tipo predefinito per tutte le altre domande, organizza per argomenti tematici con descrizioni, citazioni e riferimenti incrociati tra fonti.

Cosa succede al ritorno: il valore aggiunto di Claude

A questo punto ci si potrebbe chiedere se la strutturazione produce già una risposta ben organizzata e ancorata alle fonti, perché non mostrare direttamente la risposta di NotebookLM?

Perché Claude al ritorno non è un passacarte. È nella fase di ritorno che le capacità di Claude diventano un vantaggio concreto rispetto all'uso diretto di NotebookLM, a patto che queste capacità vengano incanalate nella direzione giusta. Ciò che Claude aggiunge è la qualità della presentazione, della sintesi e della ricerca attiva, non conoscenze esterne.

Ricerca attiva

Ogni risposta di NotebookLM, prima di arrivare a Claude, viene arricchita dal server con un promemoria nascosto. Questo promemoria chiede a Claude di fermarsi e valutare se la risposta copre effettivamente tutto ciò che l'utente ha chiesto, se c'è qualcosa di poco chiaro o incompleto, se qualcosa manca. Claude può fare autonomamente un'altra domanda a NotebookLM nella stessa sessione, senza che l'utente debba intervenire.

In pratica, una singola domanda dell'utente può generare due o tre interrogazioni successive a NotebookLM, ciascuna più mirata della precedente, prima che Claude presenti una risposta completa. L'utente vede solo il risultato finale.

Sintesi e organizzazione

Claude può rielaborare le informazioni ricevute con le proprie capacità comunicative, dal sintetizzare risposte lunghe al riorganizzare i contenuti in una struttura più chiara, fino all'evidenziare i punti chiave. Soprattutto, può combinare i risultati di interrogazioni a notebook diversi in un'unica analisi coerente, una capacità che NotebookLM da solo non offre perché lavora sempre su un notebook alla volta.

Il vincolo di fedeltà

Queste capacità vengono incanalate da un vincolo preciso, Claude non aggiunge conoscenze che non provengono dai documenti. Le linee guida di strutturazione contengono istruzioni esplicite per la fase di ritorno che costringono Claude alla presentazione fedele del contenuto documentale. Se un'informazione non è presente nei documenti, la risposta lo dichiara con il segnaposto [NON PRESENTE NEI DOCUMENTI], invece di colmare il vuoto con conoscenze generali.

Il vincolo riguarda il contenuto, non la forma. Claude può e deve usare le proprie capacità di organizzazione e sintesi, ma il materiale su cui lavora resta esclusivamente quello proveniente dai documenti. Come descritto in questo articolo sull'accesso esterno ai notebook, più l'output è articolato più il rischio di contaminazione aumenta, e il vincolo di fedeltà è il meccanismo che lo previene.

Il supporto multilingue

Il sistema funziona con qualsiasi lingua supportata da Claude. Le istruzioni di strutturazione guidano Claude ad adattare le etichette e i vincoli alla lingua della conversazione, senza configurazione specifica. Ad esempio "TOPIC/DESCRIPTION/EVIDENCE" diventa "ARGOMENTO/DESCRIZIONE/EVIDENZE" in italiano, e "[NOT FOUND IN DOCUMENTS]" diventa "[NON PRESENTE NEI DOCUMENTI]".

Il sistema è stato testato in modo approfondito con l'italiano.

Coerenza linguistica

Per risultati ottimali è consigliabile mantenere la stessa lingua per tutta la conversazione. Cambiare lingua durante la sessione potrebbe produrre risultati di strutturazione imprevedibili.

Verificare cosa succede dietro le quinte

NotebookLM salva le chat, il che significa che è possibile aprire il notebook direttamente su notebooklm.google.com per vedere il prompt strutturato inviato da Claude, con la risposta originale di NotebookLM con tutti i link di riferimento interni.

Questo meccanismo di trasparenza permette di verificare che la strutturazione sia stata applicata correttamente e di confrontare la risposta originale con la presentazione fatta da Claude.

Sotto il cofano

L'architettura del sistema si basa su una divisione precisa dei ruoli. Le istruzioni di strutturazione — quali pattern usare, come formattare le citazioni, come gestire le informazioni mancanti — sono definite nel codice del server MCP, all'interno della descrizione del tool ask_question. Quando Claude Desktop carica il server, legge queste istruzioni e le applica. La strutturazione vera e propria avviene quindi in Claude, che funge da client, ma seguendo regole scritte dal server. Il server MCP non tocca le domande che transitano verso NotebookLM perché è l'intermediario trasparente.

Questa scelta progettuale ha diversi vantaggi. Il supporto multilingue è automatico in quanto Claude gestisce nativamente qualsiasi lingua. La logica di strutturazione può essere aggiornata modificando un singolo file nel codice del server, senza intervenire su Claude. E il sistema si adatta al contesto della conversazione senza bisogno di template fissi per ogni lingua o tipo di domanda.

Il controllo al ritorno opera su due livelli distinti e complementari. Il primo è una costante nel codice del server (FOLLOW_UP_REMINDER) che viene concatenata a ogni risposta di NotebookLM prima di restituirla a Claude, spingendolo a verificare la completezza e a fare domande aggiuntive se necessario. Il secondo è la sezione "Response Handling" nelle linee guida di strutturazione, che istruisce Claude sulla presentazione fedele. La separazione tra i due livelli è intenzionale, il controllo di completezza agisce anche se le linee guida vengono modificate, e viceversa.

Rispetto alla versione originale del server, che gestiva la strutturazione lato server con template per ogni lingua e diverse modalità di enhancement, il fork ha semplificato l'architettura spostando la logica di strutturazione nella descrizione del tool. Questo ha eliminato centinaia di righe di codice (template multilingua, rilevamento della lingua, wrapping delle risposte) a favore di un approccio più leggero e manutenibile.

Una nota tecnica, NotebookLM non gestisce bene le linee decorative nei prompt. Sequenze di caratteri all'inizio della richiesta come === o --- causano timeout. Le istruzioni di strutturazione specificano di usare solo intestazioni in testo semplice, evitando ogni tipografia decorativa.