La forza delle regole¶
Il capitolo 2 ha introdotto due dimensioni della prevalenza fra livelli di configurazione, la gerarchia e la forza, ed ha esposto la prima in dettaglio. La prevalenza gerarchica orienta correttamente la maggior parte delle scelte di configurazione, perché copre i casi in cui le regole in conflitto sono formulate con intensità di pari livello. Per questo motivo i capitoli successivi hanno lavorato a parità di forza, assumendo che le regole fossero scritte con la stessa intensità e che la prevalenza fosse decisa dalla sola posizione del livello.
Esiste però una seconda dimensione, anticipata dal capitolo 2 e già incontrata con il caso della lingua nel capitolo 4. Quando le istruzioni in conflitto sono formulate con intensità diverse, la più forte può prevalere anche se sta in un livello meno specifico. La forza di un'istruzione, intesa come intensità della formulazione e capacità di resistere nel contesto della conversazione, è una variabile autonoma rispetto alla gerarchia. Nei casi in cui le due dimensioni convergono, cioè quando la regola scritta nel livello più specifico è anche la più forte, il risultato è quello che la sola regola gerarchica avrebbe previsto. Nel caso opposto il risultato può essere diverso.
Il capitolo descrive i fattori che determinano la forza di un'istruzione, le situazioni in cui la forza ribalta la prevalenza gerarchica, e le indicazioni pratiche per scrivere regole con la forza adeguata al loro scopo. I fattori che concorrono alla forza sono di due tipi. Quattro stanno nella formulazione stessa della regola, e la prima sezione del capitolo li tratta uno per uno. Un quinto fattore sta fuori dalla regola configurata, e riguarda il modo in cui l'utente si comporta nelle proprie richieste in chat, ed è trattato più avanti nella sezione Scrivere regole forti dove serve. Il capitolo chiude con un caso operativo che mostra concretamente come applicare quanto detto, e con un riassunto che fa da chiusura del manuale.
I fattori interni alla formulazione¶
La forza di un'istruzione non è una qualità unica, ma il risultato della combinazione di alcuni elementi della sua formulazione. Quattro fattori, in particolare, fanno la differenza fra una regola che resiste al contesto e una che si lascia diluire.
-
Formulazione imperativa. Una regola formulata come comando preciso ha più forza di una espressa come preferenza. «Rispondi in inglese» è più forte di «possibilmente rispondi in inglese» o di «preferisco l'inglese». L'imperativo non lascia spazio interpretativo, la preferenza sì. Non significa che ogni regola debba essere un imperativo, perché molte preferenze sono effettivamente preferenze e vanno scritte come tali. Significa che, quando l'utente vuole un certo comportamento in modo non negoziabile, la formulazione imperativa è la scelta corretta.
-
Specificità lessicale. Le parole nette portano più forza delle parole vaghe. «Mai usare emoji» è più forte di «evitare l'uso di emoji». «Sempre in italiano» è più forte di «generalmente in italiano». Gli avverbi assoluti come mai, sempre, solo, esclusivamente tracciano un confine netto. Gli avverbi temperati come generalmente, di solito, in genere lo sfumano. La scelta dipende da quanto si vuole che la regola sia stretta. Per le regole che devono valere senza eccezioni, la specificità lessicale è il modo più diretto di renderle tali.
-
Estensione esplicita ai casi-limite. Una regola che anticipa come comportarsi nei casi in cui qualcosa potrebbe far cambiare idea a Claude è più forte di una regola muta sulle eccezioni. «Rispondi in inglese» lascia aperto cosa fare quando l'utente scrive in italiano. «Rispondi sempre in inglese, anche se l'utente scrive in italiano» chiude esplicitamente quel caso. Anticipare i casi-limite è un fattore di forza perché elimina lo spazio interpretativo in cui Claude potrebbe inclinare verso una soluzione diversa basata sul contesto.
-
Richiamo. Una regola scritta una volta in un solo punto è più debole di una regola che torna in più punti della configurazione, eventualmente con formulazioni complementari. Il richiamo agisce su due fronti. Da un lato segnala che la regola è importante, e Claude lo percepisce nella composizione del prompt. Dall'altro copre meglio i casi in cui un punto del prompt potrebbe essere letto in modo meno attento, perché un altro punto richiama lo stesso contenuto. Ha però un costo, perché ogni ripetizione occupa spazio nel prompt e può confliggere con altre regole simili. Va usato con misura, solo per le regole che davvero richiedono di essere portate due volte all'attenzione.
I quattro fattori agiscono in combinazione. Una regola formulata come imperativo, con avverbi assoluti, estesa esplicitamente al caso-limite più frequente, e richiamata in un secondo punto della configurazione, è una regola con la massima forza che si possa darle. Non significa che vada sempre scritta così, perché la maggior parte delle regole non ha bisogno di tutta questa forza. Significa che, quando una regola deve davvero tenere, questi sono gli strumenti per costruirla.
Quando la forza ribalta la gerarchia¶
La regola gerarchica vista al capitolo 2 dice che, a parità di forza, prevale il livello più specifico. La regola di un progetto vince sulla regola corrispondente delle generali, quella di uno stile vince sulla regola di un livello sottostante, quella di una chat vince su tutte. Questa regola copre la maggior parte dei casi reali, perché in genere chi configura il proprio sistema scrive con uno stile coerente fra livelli, e le differenze di forza fra una regola e l'altra sono piccole o nulle.
Quando però le forze sono significativamente diverse, la regola gerarchica può non bastare a prevedere il comportamento. Tre scenari rendono chiaro il punto.
-
Convergenza. Forza e gerarchia vanno nella stessa direzione, perché la regola scritta nel livello più specifico è anche quella formulata con più intensità. Il vincitore è chiaro, e non c'è ambiguità da risolvere. È lo scenario più frequente quando l'utente cura la propria configurazione, perché la regola specifica viene scritta apposta per un contesto, e per quel contesto la si scrive con la dovuta nettezza.
-
Divergenza marginale. La regola gerarchicamente più specifica è formulata con un po' meno forza di quella corrispondente nel livello superiore. Per esempio, nelle generali c'è una regola netta, nel progetto c'è una formulazione un po' più morbida sullo stesso punto. La prevalenza gerarchica regge. La regola di progetto, anche se formulata in modo meno enfatico, vince comunque, perché la differenza di forza non è sufficiente a ribaltare la specificità del livello. Le sfumature di formulazione contano, ma fino a un certo punto.
-
Ribaltamento. La regola gerarchicamente meno specifica è formulata con forza notevolmente maggiore di quella corrispondente nel livello più specifico. Per esempio, nelle generali c'è una regola scritta come imperativo, con avverbi assoluti, estesa esplicitamente ai casi-limite, e richiamata in più punti. Nel progetto c'è una regola morbida che prova a discostarsene, oppure è espressa in modo minimale. La regola delle generali può prevalere anche se è gerarchicamente meno specifica, perché la differenza di forza compensa e supera la differenza di specificità. È il caso in cui la dimensione della forza ribalta la prevalenza gerarchica.
Va detto che il ribaltamento è una tendenza, non un meccanismo deterministico. Claude non applica una regola di calcolo per stabilire quale fattore vinca. La prevalenza è una proprietà della composizione del prompt di sistema, e la composizione del prompt include sia la specificità del livello sia l'intensità della formulazione. In presenza di differenze marcate di forza, la più forte tende a prevalere. In presenza di differenze marginali, la più specifica continua a vincere. Fra i due estremi c'è una zona di incertezza, in cui il comportamento può essere meno prevedibile.
L'implicazione pratica è una sola. Quando si vuole che una regola specifica prevalga effettivamente su una corrispondente regola del livello superiore, la specificità deve essere accompagnata da una forza almeno comparabile. Una regola morbida nel livello specifico, opposta a una regola netta nel livello generale, è uno squilibrio che, dal punto di vista del comportamento osservato, può non avere l'esito atteso.
Scrivere regole forti dove serve¶
Tutto quanto detto fin qui suggerisce una pratica disciplinata, non un uso indiscriminato. Scrivere regole forti ovunque non rende la configurazione più efficace, la rende più pesante. Una configurazione in cui ogni regola è formulata con imperativi, avverbi assoluti ed estensioni esplicite finisce per appesantire il prompt di sistema con segnali che competono fra loro. Tutto sembra urgente, e in effetti nulla lo è.
La pratica utile è opposta. Il default va tenuto leggero, con formulazioni piane che esprimono la regola nella sua forma essenziale. La forza si aggiunge selettivamente, dove serve, e per ragioni precise.
Tre indicazioni operative aiutano a capire dove serve.
-
Le regole su elementi sensibili al contesto. Lingua, tono, registro, formato di risposta, lunghezza. Sono gli aspetti su cui Claude tende a bilanciare l'istruzione configurata con i segnali della conversazione. Per queste regole la forza serve quasi sempre, perché il contesto della chat può spingere in direzioni diverse da quanto previsto. La formulazione netta con estensione esplicita ai casi-limite è la scelta corretta.
-
Le regole non negoziabili per il proprio lavoro. Convenzioni redazionali di una testata, regole metodologiche di un progetto critico, divieti specifici legati a un cliente. Sono regole che, se cedono, producono un output non utilizzabile. Per queste regole la forza è un investimento ragionevole, perché il costo di un fallimento occasionale è alto.
-
Le regole che si è già visto Claude faticare a tenere. La pratica nel tempo mostra dove le formulazioni piane non bastano. Quando si nota che un certo comportamento non viene tenuto in modo affidabile, il primo intervento è rinforzare la formulazione, non aggiungere nuove regole. Una regola scritta una volta sola, in modo morbido, in un livello qualunque, è spesso la causa del problema. La soluzione è riformularla nei termini visti nella prima sezione di questo capitolo.
Per tutte le altre regole, la formulazione semplice basta. Una preferenza espressa come preferenza, un suggerimento di stile come suggerimento, una linea di metodo come linea di metodo. Sono regole che vivono bene anche senza enfasi, perché Claude le legge nel prompt insieme alle altre, e le applica quando il contesto le richiede.
C'è infine un fattore di rinforzo che non sta nella formulazione della regola, ma nel comportamento dell'utente. È stato anticipato al capitolo 4 nella sezione Le regole di prevalenza alla prova del contesto, e vale la pena richiamarlo qui come componente della forza. Una regola che richiede a Claude un certo comportamento risulta più forte quando l'utente, nelle sue richieste in chat, agisce come se la regola fosse già operativa. Se la regola di un progetto richiede l'inglese, scrivere in inglese nelle proprie richieste a Claude rinforza la regola, perché allinea il contesto della conversazione con la regola configurata. L'incoerenza fra istruzione e comportamento dell'utente è essa stessa un segnale che indebolisce la regola, indipendentemente da come è formulata.
Un caso operativo verificato¶
Il capitolo 4 ha presentato il caso della lingua da usare. La configurazione era italiano nelle generali, inglese nel progetto, utente che scrive in italiano nelle chat di quel progetto.
La regola di progetto da cui si partiva era, nella sua forma minima, «rispondi in inglese». L'imperativo c'è, la lingua è indicata, ma il caso-limite del messaggio in italiano resta aperto. Per Claude, fra un'istruzione del prompt di sistema che richiede l'inglese e un messaggio dell'utente scritto in italiano, lo spazio interpretativo basta a far prevalere il contesto.
La riformulazione opera su due dei quattro fattori visti nella prima sezione. La formulazione imperativa era già presente nella regola originale, e il richiamo non si applica al caso, perché la regola sta in un solo punto della configurazione e non c'è ragione di duplicarla altrove. I due fattori da aggiungere sono la specificità lessicale e l'estensione esplicita al caso-limite.
-
Specificità lessicale. All'imperativo si aggiunge un avverbio assoluto. «Rispondi sempre in inglese» è più forte di «rispondi in inglese». Il sempre segnala che la regola non ha eccezioni di contesto.
-
Estensione esplicita al caso-limite. Va dichiarata la condizione in cui Claude tenderebbe a discostarsi, e va detto cosa fare in quella condizione. «Rispondi sempre in inglese, anche se l'utente scrive in italiano» copre esplicitamente il caso che produce la deriva. Lo spazio interpretativo si chiude.
A questi fattori si aggiunge, secondo quanto visto nella terza sezione, la coerenza del comportamento dell'utente. Scrivere in inglese nelle proprie richieste a Claude dentro le chat di quel progetto allinea il contesto della conversazione con la regola configurata. Anche una regola formulata bene fatica a tenere quando l'utente, in chat, si comporta come se la regola non valesse.
Applicati insieme, questi elementi riducono significativamente la probabilità che il comportamento di Claude in quel progetto si discosti dall'inglese, anche quando arrivano messaggi in italiano. La probabilità non è azzerata, e questo è coerente con quanto detto nella seconda sezione. La prevalenza è una tendenza, non un calcolo deterministico. Una regola scritta con la forza necessaria vince nei casi normali, ma può cedere in situazioni particolari. Sono casi marginali, e la pratica nel tempo mostra che la riformulazione descritta tiene nella stragrande maggioranza delle conversazioni reali.
## In sintesi
Cinque principi riassumono quanto detto nel capitolo, e chiudono il quadro del manuale.
1. La prevalenza fra livelli ha due dimensioni. La prima è la gerarchia, descritta al capitolo 2, che a parità di forza fa vincere il livello più specifico. La seconda è la forza dell'istruzione, intesa come intensità della formulazione e capacità di resistere al contesto della conversazione.
2. Quattro fattori determinano la forza di una regola, e si combinano fra loro. Sono la formulazione imperativa, la specificità lessicale, l'estensione esplicita ai casi-limite, il richiamo della regola in più punti della configurazione.
3. Quando le forze sono di pari livello, la gerarchia decide. Quando una regola gerarchicamente meno specifica è formulata con forza notevolmente maggiore di una più specifica, la prima può prevalere. È il caso in cui la dimensione della forza ribalta la prevalenza gerarchica.
4. La pratica corretta è tenere leggera la formulazione di default e aggiungere forza selettivamente. Le regole su elementi sensibili al contesto, quelle non negoziabili e quelle che Claude ha già faticato a tenere meritano forza. Le altre stanno bene nella forma piana.
5. Anche il comportamento dell'utente in chat funge da rinforzo. La coerenza fra istruzione configurata e modo di scrivere nelle proprie richieste aumenta la forza effettiva della regola, indipendentemente dalla sua formulazione testuale.
Il manuale si chiude qui, dopo aver presentato i livelli di configurazione, le loro regole di composizione, le altre fonti che concorrono al comportamento, e le due dimensioni della prevalenza che orientano la scelta delle regole. L'impressione complessiva è che la configurazione di Claude non è un'operazione di compilazione, ma una pratica di disciplina che si costruisce nel tempo. È una pratica che richiede la stessa cura che si dedica a un proprio metodo di lavoro.
Le regole scritte una volta sola e dimenticate poco dopo contano poco. Quelle scritte con attenzione, rilette periodicamente, adattate man mano che il proprio lavoro evolve, fanno la differenza. La pulizia della configurazione, la consapevolezza delle altre fonti che vi si affiancano, l'attenzione alla forza dove serve e alla leggerezza dove basta sono gli strumenti di chi vuole usare Claude in modo affidabile su lavori che richiedono continuità.