
«Contesto al posto del controllo. Parte del mio lavoro è assicurarmi che le persone abbiano il contesto che serve per fare bene il loro lavoro.»
Elizabeth Stone, CTO di Netflix
●↑
Questo è il metodo che gli ingegneri usano per ottenere risultati affidabili dai modelli, ispirato al lavoro di Andrej Karpathy.
Due parole su di lui, perché la sua storia è il motivo per cui vale la pena ascoltarlo.
Chi è Karpathy (skippa se lo conosci)
Karpathy nasce in Slovacchia nel 1986. A quindici anni emigra con la famiglia in Canada. A Toronto finisce nelle aule di Geoffrey Hinton, il pioniere delle reti neurali, e capisce che quella sarà la sua strada. A Stanford, durante il dottorato, crea il primo corso di deep learning dell’università e lo insegna lui stesso: diventa uno dei corsi più frequentati del campus. E per capire quanto fossero brave le macchine a riconoscere le immagini, gareggia contro di loro, a occhio, foto per foto, per misurare dove arriva un essere umano.
È tra i fondatori di OpenAI, l’azienda che creerà ChatGPT. E per cinque anni guida l’AI di Tesla, dove il suo team sviluppa la guida autonoma.
Nel 2024 poteva lavorare dove voleva ma lui fonda una scuola, Eureka Labs, e pubblica lezioni gratuite su YouTube da cui milioni di persone hanno imparato come funzionano questi modelli.
E, mossa delle mosse, da quest’anno ha accettato di lavorare in Anthropic.
Ecco perché lo ascolto. Ha costruito questi sistemi, li ha messi su milioni di auto, ha passato anni a insegnarli a chiunque, gratis. Quando uno così ti spiega come lavora, conviene prendere appunti.
L’ho guardato due volte perché a metà video c’è una cosa molto interessante: gli ingegneri hanno appena riscoperto, a modo loro, quello che chi lavora per obiettivi sa da anni.
Karpathy propone un metodo a tre livelli per lavorare con l’AI senza ottenere risposte ridicole. Perché le risposte ridicole arrivano, e quando arrivano c’è sempre qualcuno che si fa bello su LinkedIn postando lo screenshot. Peccato che quello screenshot non dimostri che l’AI è stupida. Dimostra che chi lo pubblica non ha ancora capito con cosa sta parlando.
Tre livelli per prompt strategici
Livello 1: formulare bene la richiesta iniziale del prompt
L’AI è brillante ma non conosce la tua azienda. Tutto quello che ottieni dipende da come scrivi la richiesta iniziale del prompt.
Hai presente l’esempio dell’autolavaggio? Se chiedi “devo lavare la macchina, l’autolavaggio è a 50 metri, vado a piedi o in auto?” I modelli più avanzati rispondono di andare a piedi, perché è vicino.
Ho rifatto il test con Claude, Gemini, Grok e ChatGPT mentre scrivevo questa nota, e sembra il bug sia stato risolto.
Perché tutti sbagliavano in modo così clamoroso? Perché l’AI è fortissima su quello che si può misurare e calcolare, e anche se deducibile per un umano, l’unica metrica che le è stata passata è la distanza, e tutto il ragionamento gira attorno a quel numero.
Il contesto ovvio della tua vita e della tua azienda, l’AI non lo conosce e soprattutto non sa di non conoscerlo. Quel contesto ce l’hai solo tu: o lo devi scrivere nella richiesta, o per la macchina non esiste.
Infatti tutte le volte che chiedi “crea un report”, stai scrivendo un prompt dello stesso livello di quello dell’autolavaggio.
Creare un report non è un obiettivo. L’obiettivo è la decisione che quel report deve guidare.
Rileggi quella frase.
È lo stesso errore che (forse) fai anche tu con le persone.
Se aprissi la tua lista delle cose da fare scommetto che trovi qualcosa del genere:
- Scrivere mail follow up
- Call con il cliente
- Presentazione domani
Scritti così, questi task hanno senso solo per te che li hai scritti, e solo oggi: tra tre giorni non saprai di che si tratta. Non puoi passarli a un collega, a un fornitore, a un’AI. Restano attaccati a te.
In MAKE PROGRESS® esiste uno strumento nato esattamente per questo problema: i Micro OKR. Prendi il task e lo riscrivi con dentro tre cose: cosa serve di preciso, un numero, e cosa significa finito bene.
Guarda la differenza:
- “Scrivere mail follow up” diventa “ottenere conferma per il prossimo passo {descrivi in cosa consiste} dal cliente entro oggi alle 18”
- “Call con il cliente” diventa “roadmap del progetto approvata dal cliente durante la call di giovedì”
- “Presentazione domani” diventa “presentazione di 10 slide con i 3 scenari di prezzo, approvata dal team, pronta per domani alle 9”
Stesso lavoro. Parole diverse. Ma ora chiunque legge capisce cosa fare, quanto lavoro serve e quando può dire di averlo finito. E «finito» non può essere un’opinione.
Questa è la lingua franca dell’esecuzione. La capisce il collega e la capisce la persona entrata ieri. E la capisce anche l’AI: un Micro OKR è già una richiesta scritta bene, senza bisogno di corsi sui prompt.
Livello 2: spiega come auto-verificare il risultato
Karpathy usa questa metafora che mi piace molto: quando lavoriamo con l’AI non stiamo costruendo animali a cui basta alzare la voce per fargli fare quello che serve, stiamo evocando fantasmi.
Un animale, e noi lo siamo, impara vivendo nel mondo. Ha fame, ha ambizioni. Se dici a una persona brava “diventa esperta di questo tema in due settimane”, in qualche modo si arrangia, perché qualcosa dentro la spinge. Un fantasma no.
Un modello AI riesegue, molto velocemente, tutto quello che l’umanità ha scritto, un’imitazione statistica. Non vive nel mondo e non vuole niente. Incoraggiarlo, minacciarlo o scrivergli “fallo meglio” non cambia il risultato.
E se gli manca un’informazione, la inventa, con sicurezza assoluta perché altrimenti il suo ragionamento si rompe.
Capire questa differenza cambia il modo di lavorare: un animale lo motivi, un fantasma invece devi verificare che esista, come facevano i Ghostbusters.
Per farlo devi decidere prima cosa significa “risultato buono” e controllarlo con dati veri, non con delle sensazioni.
Ora torna ai tre Micro OKR di prima e nota una cosa: la verifica è già scritta dentro, nelle parole stesse.
- “Conferma dal cliente entro oggi alle 18”: alle 18:01 apri la posta. La conferma c’è o non c’è.
- “Roadmap approvata durante la call di giovedì”: giovedì sera la roadmap è approvata o non lo è. Non serve chiedere “com’è andata la call?”.
- “10 slide, 3 scenari di prezzo, approvata dal team”: conti le slide, conti gli scenari, chiedi al team. Tre controlli che chiunque fa in un minuto.
Quando scrivi un task così hai già costruito il come verificarlo prima di iniziare.
“Scrivere mail follow up” invece non si può verificare perché qualsiasi email va bene. E sai cosa succede? Rischi di inviarla davvero!
Se nel prompt c’è scritto cosa significa finito bene, l’AI ha un criterio contro cui controllare il proprio lavoro prima di consegnartelo. Non è un passaggio in più che fai dopo ma è il modo in cui scrivi la richiesta.
Livello 3: costruisci l’ambiente dove avviene il lavoro
Richiesta e verifica hanno bisogno di uno spazio di lavoro che migliora nel tempo, invece di ripartire da zero a ogni conversazione.
Gli ingegneri lo risolvono così: scrivono le regole in un documento che l’AI legge prima di iniziare. Ordinano i documenti in cartelle con una struttura chiara, prevedibile e standard. Trasformano i compiti che si ripetono in manuali operativi (skills). E dividono le azioni in tre categorie: fai sempre, chiedi prima, non fare mai.
Riconosci qualcosa?
È un sistema operativo vero e proprio.
La tua azienda ce l’ha?
Esiste una strategia scritta dove tutti possono leggerla, con poche priorità misurabili, procedure per non risolvere mai lo stesso problema due volte, un appuntamento a settimana per guardare i numeri e correggere la rotta?
Questo è MAKE PROGRESS® (infatti ho copiato il paragrafo dal mio libro)
I Micro OKR ora sono più utili che mai.
Approfondisci questi concetti nella newsletter originale.
Una persona che scrive così i task migliora subito il suo lavoro. Ma perché un’intera azienda parli quella lingua serve un metodo: chi decide le priorità, ogni quanto si guardano i numeri, dove vivono strategia e procedure.
I Micro OKR sono la lingua . MAKE PROGRESS® è la grammatica che la fa funzionare in azienda.
Questo metodo per scrivere i prompt è solo l’ultimo miglio, quello in cui parli con la macchina per andare più veloce.
Prima vengono la strategia chiara, i numeri scelti bene, il sistema che li tiene insieme.
Senza tutto questo l’AI ti dice di andare a piedi all’autolavaggio su quasi tutti i task. Solo che non te ne accorgi perché entrambi non conoscete la strategia!
Un esercizio da 120 secondi.
Apri la tua lista e prendi i primi 5 task. Conta quanti contengono un numero e la definizione di “concluso con successo”. Poi riscrivine uno come Micro OKR e passalo a qualcuno, o a un’AI, senza aggiungere spiegazioni.
Immagina la stessa cosa fatta su tutta l’azienda: priorità scritte e misurabili, verifiche decise prima di iniziare, procedure e dati nello stesso posto. E un’AI che legge tutto questo prima di risponderti.
Quanto cambierebbe la qualità di quello che producete? Non la quantità, proprio la qualità.
È esattamente quello che mostriamo domani.
Ne parliamo il 17 giugno alle 12:00
Alle 12:00, webinar gratuito Leadership Aumentata. Niente elenco di strumenti: come costruire i tre livelli che vengono prima di qualsiasi AI, strategia, verifica, sistema.
Leadership Aumentata™ – Strategia Aziendale con AI e OKR
Ci vediamo lì, ho tanto altro da raccontarti!
ALWAYS MAKE PROGRESS ●↑
Antonio
Il video che ha ispirato questa newsletter
Questa edizione nasce da «Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan», la conversazione tra Andrej Karpathy (tra i fondatori di OpenAI, cinque anni alla guida dell’AI di Tesla, oggi in Anthropic) e Stephanie Zhan, pubblicata ad aprile 2026.
Karpathy spiega perché il vibe coding non basta e cosa serve per passare all’agentic engineering: specifiche precise, verifica dei risultati, un ambiente di lavoro che migliora a ogni ciclo. Sono gli stessi tre livelli che in questo articolo ho tradotto in Micro OKR e MAKE PROGRESS® per chi fa strategia, anche senza scrivere una riga di codice.
