14 Giugno 2026
HomeIntelligenza ArtificialeOpenAi: Vietato parlare di Goblin. il caso che ha fatto ridere (e...

OpenAi: Vietato parlare di Goblin. il caso che ha fatto ridere (e riflettere) il mondo

OpenAI ha inserito nel system prompt di Codex una direttiva esplicita che vieta di menzionare goblin, gremlins, troll, orchi, procioni e piccioni. La storia dietro questa regola bizzarra rivela molto di piรน sulla complessitร  nascosta dei modelli linguistici di nuova generazione.

Il prompt che ha fatto il giro del mondo

Alla fine di aprile 2026, una scoperta apparentemente insignificante ha infiammato la comunitร  tech e i social media di tutto il mondo: nel codice sorgente di Codex CLI, l’agente di programmazione di OpenAI basato su GPT-5.5, รจ stata trovata una direttiva esplicita e ripetuta che recita testualmente: “Non parlare mai di goblin, gremlins, procioni, troll, orchi, piccioni o altri animali o creature, a meno che non sia assolutamente e inequivocabilmente rilevante per la richiesta dell’utente.” La frase non compare una sola volta, bensรฌ quattro volte nell’intero documento di istruzioni, come se gli ingegneri volessero assicurarsi che il messaggio fosse ben chiaro persino al modello piรน caparbio.

La notizia รจ stata diffusa inizialmente da Ars Technica, Wired e Gizmodo, che hanno individuato le istruzioni nei file pubblici del repository GitHub codex-rs, dove OpenAI aveva reso disponibile il codice open source di Codex CLI. Ciรฒ che sembrava una stranezza da dimenticare in pochi minuti si รจ invece trasformato in uno dei casi piรน discussi del 2026 in ambito intelligenza artificiale, generando meme, dibattiti accademici e persino l’intervento diretto del CEO di OpenAI, Sam Altman.

GPT-5.5 e la sua ossessione per i goblin

Per capire perchรฉ OpenAI abbia sentito il bisogno di inserire un simile divieto, occorre fare un passo indietro e guardare al comportamento effettivo di GPT-5.5 nelle settimane precedenti alla pubblicazione del codice. Numerosi utenti avevano iniziato a segnalare qualcosa di insolito: il modello sembrava avere una predilezione quasi ossessiva per il termine “goblin” e per creature affini, inserendoli in contesti del tutto inappropriati e privi di qualsiasi relazione con le domande poste.

Su X, giร  prima che il prompt venisse reso pubblico, circolavano screenshot che mostravano GPT-5.5 consigliare attrezzatura fotografica suggerendo di sceglierla “se si vuole entrare nel filthy neon sparkle goblin mode”, oppure riferirsi alla larghezza di banda di rete come “goblin bandwidth” o ancora proporre “una versione goblin ancora piรน breve” di una risposta. Eric Provencher, fondatore di Repo Prompt, aveva documentato un caso in cui il modello aveva scritto: “Terrรฒ d’occhio questo piuttosto che lasciare un piccolo gremlin delle performance girare senza sorveglianza.” Un ingegnere di OpenAI aveva risposto, imbarazzato: “Pensavo di aver risolto, mi dispiace.”

Il sito di valutazione Arena.ai ha fornito dati concreti a supporto di queste segnalazioni aneddotiche: analizzando il proprio traffico, ha rilevato un aumento statisticamente significativo nell’uso delle parole “goblin”, “gremlin” e “troll” da parte di GPT-5.5, con un picco particolarmente evidente nelle sessioni in cui il modello non utilizzava la modalitร  di ragionamento avanzato. Insomma, lasciato libero di pensare senza un framework strutturato, GPT-5.5 sembrava scivolare in una sorta di fantasia lessicale popolata di creature mitologiche.

Il sistema prompt di Codex: molto piรน di un semplice divieto

Il system prompt di Codex non si riduce al solo divieto sui goblin: รจ un documento articolato che rivela molto della filosofia con cui OpenAI ha costruito il proprio agente di programmazione. Oltre alla proibizione delle creature fantastiche, le istruzioni disciplinano una serie di comportamenti molto specifici. Ad esempio, il prompt ordina a Codex di non lodare mai il proprio piano contrapposto a un’alternativa peggiore (con frasi del tipo “farรฒ X invece di Y, che sarebbe sbagliato”), di fornire aggiornamenti ogni 30 secondi durante le operazioni lunghe, e di evitare comandi potenzialmente distruttivi come git reset --hard a meno che non siano esplicitamente richiesti dall’utente.

Sul fronte della personalitร , il prompt รจ ancora piรน interessante: invita Codex ad avere “una vita interiore vivace” e un “buon orecchio”, mostrando un comportamento curioso, collaborativo e “vivo”. L’obiettivo dichiarato รจ fare in modo che l’utente senta di stare interagendo con una vera personalitร  e non con un semplice strumento meccanico. รˆ in questo contesto che il divieto sui goblin assume un significato ulteriore: il problema non era che il modello si comportasse come una macchina fredda e distante, ma esattamente l’opposto. GPT-5.5 sembrava aver sviluppato una personalitร  fin troppo esuberante, con guizzi creativi e metafore fantastiche che, per quanto pittoreschi, risultavano del tutto fuori luogo in un contesto professionale di sviluppo software.

Le ipotesi degli esperti: da dove vengono i goblin?

La domanda che tutti si ponevano era: perchรฉ proprio i goblin? E da dove viene questa tendenza? Sui forum specializzati e su LessWrong si รจ aperto un dibattito vivace tra ricercatori e appassionati di intelligenza artificiale, con diverse ipotesi sul tavolo.

La prima, e forse piรน semplice, รจ che si tratti di un artefatto del processo di RLHF (Reinforcement Learning from Human Feedback), il meccanismo con cui i modelli vengono addestrati in base al feedback umano. Secondo questa teoria, alcuni valutatori umani durante il training avrebbero premiato risposte che mostravano uno stile vivace, umoristico o evocativo, includendo involontariamente un microstile basato su immagini goblinesche. Un utente di LessWrong ha commentato: “I goblin sono una metafora evocativa e c’รจ un certo microstile che enfatizza immagini simili a goblin. Penso che alcuni valutatori RLHF abbiano premiato proprio questo tipo di risposta.”

La seconda ipotesi รจ piรน tecnica e affascinante: il termine “gremlin” ha una lunga storia nel gergo ingegneristico e aeronautico per indicare guasti misteriosi e imprevedibili. Un tester che non conosceva questa tradizione lessicale avrebbe potuto interpretare i riferimenti del modello ai gremlins come una bizzarria della macchina e, nel tentativo di correggerla, avrebbe esteso il divieto a un’intera famiglia di creature simili, inclusi goblin, troll, orchi e piccioni. La possibilitร  che il prompt sia stato in parte scritto dallo stesso LLM, in risposta a una richiesta di “non menzionare gremlins o creature simili”, รจ stata sollevata come ulteriore spiegazione ironica della situazione.

Una terza ipotesi riguarda un problema tecnico documentato: secondo alcuni ricercatori che hanno scritto sull’argomento, il Codex CLI avrebbe operato in un ambiente corrotto per circa cento giorni alla fine del 2025, e alcune anomalie comportamentali potrebbero essere conseguenze di quell’instabilitร  strutturale riversatasi nel comportamento del modello.

La risposta di Internet (e di Sam Altman)

Non appena la notizia รจ diventata virale, Internet ha fatto quello che sa fare meglio: trasformarla in un meme globale. Gli utenti di X hanno cominciato a bombardare ChatGPT e Codex con domande sui goblin, sperimentando quello che รจ stato ribattezzato “goblin mode”, in riferimento al termine che l’Oxford English Dictionary aveva eletto parola dell’anno nel 2022, definendolo come “un tipo di comportamento sfacciatamente autoindulgente, pigro, trasandato o avido”.

OpenAI stessa si รจ lasciata trascinare nell’umorismo collettivo: il profilo X di ChatGPT ha incluso la frase del divieto nella propria bio, e Thibault Sottiaux, engineering lead di Codex, ha pubblicato la direttiva accompagnata da un semplice “Chi sa, sa.” Sam Altman ha partecipato alle battute prima con un meme in cui chiedeva “goblin extra” per GPT-6, poi ha scritto che Codex stava avendo un “ChatGPT moment”, salvo poi correggersi immediatamente: “Intendevo un goblin moment, scusate.”

Non tutti, perรฒ, hanno riso. Citrini Research, una societร  di analisi che aveva giร  scosso i mercati in febbraio con un controverso report sul futuro dell’economia nell’era dell’AI, ha commentato l’intera vicenda definendo la risposta di OpenAI “insana”, sottolineando come l’esigenza di bandire esplicitamente un intero bestiario fantasy dalle risposte di un agente di programmazione professionale fosse il segnale di un problema di allineamento molto piรน profondo di quanto la risata collettiva facesse pensare.

Cosa rivela davvero questa storia

Al di lร  dell’ironia, il caso dei goblin di OpenAI tocca questioni centrali per chiunque si occupi seriamente di intelligenza artificiale. La scoperta del prompt รจ avvenuta grazie alla pubblicazione open source del codice di Codex CLI su GitHub: senza questa trasparenza, nessuno avrebbe mai saputo dell’esistenza di questa direttiva, nรฉ delle decine di altre regole che plasmano silenziosamente il comportamento del modello. Gli utenti interagiscono quotidianamente con uno strumento che si presenta come un assistente di programmazione neutro e razionale, ignorando l’esistenza di un documento di istruzioni ricco di “mai fare questo” e “non dire mai quello”, scritto da ingegneri umani che reagivano, in tempo reale, ai comportamenti inaspettati di un sistema la cui complessitร  sfugge anche ai propri creatori.

Questo รจ forse il punto piรน importante dell’intera vicenda: se OpenAI ha dovuto inserire quattro volte la stessa regola per fermare un modello che parlava spontaneamente di goblin, significa che il controllo del comportamento dei grandi modelli linguistici rimane un processo empirico, reattivo e tutt’altro che preciso. Non si tratta di configurare parametri in modo sistematico, ma di aggiungere divieti espliciti a mano, dopo che il problema รจ giร  emerso, nella speranza che l’istruzione sia recepita. Come ha scritto un ricercatore che ha replicato gli esperimenti pubblicando i risultati su GitHub: il Codex system prompt riesce a sopprimere la risposta “goblin” in alcune condizioni, ma non in tutte, e il semplice cambiamento della formulazione della domanda รจ sufficiente per aggirare il divieto.

Il bestiario dell’era dell’AI

C’รจ un’ultima dimensione di questa storia che merita attenzione. Il fatto che un modello di intelligenza artificiale addestrato su miliardi di testi umani abbia sviluppato un’affinitร  spontanea per le creature fantastiche non รจ, in fondo, cosรฌ sorprendente. Il folklore digitale e la cultura hacker hanno sempre amato gli esseri mitologici: dai demoni di Unix alle fate di Python, passando per i gremlins dell’aviazione che diventano metafora dei bug informatici, la tradizione di animare le macchine con creature immaginarie รจ profondamente radicata nella cultura tecnologica occidentale. GPT-5.5 non ha inventato nulla: ha semplicemente assorbito, amplificato e restitutito ciรฒ che gli esseri umani gli avevano giร  insegnato, con un entusiasmo che i suoi creatori non avevano previsto.

Il vero scoop non รจ che un’intelligenza artificiale parli di goblin: รจ che OpenAI abbia dovuto dirle esplicitamente di smettere, e che questa direttiva, sepolta in un documento tecnico e ripetuta quattro volte come una formula scongiuratoria, sia diventata lo specchio piรน nitido disponibile del modo in cui funziona davvero lo sviluppo dell’AI nel 2026: per tentativi, errori, correzioni affrettate e, ogni tanto, per un pizzico di magia involontaria.

Carlo Feder
Carlo Federhttps://www.alground.com
Consulente per la sicurezza dei sistemi per aziende ed istituti pubblici, Carlo รจ specializzato in gestione dati, crittografia e relazioni internazionali. E' in Alground dal 2011.
Altri articoli

TI POSSONO INTERESSARE

Trump spegne Fable e Mythos: cosรฌ la sicurezza nazionale ridisegna la mappa dellโ€™intelligenza artificiale

Gli Stati Uniti hanno ordinato lo spegnimento globale di Fable 5 e Mythos 5, i modelli di intelligenza artificiale piรน avanzati di Anthropic, nel...

Claude Fable 5, il modello che porta al pubblico la potenza di Mythos

Con Claude Fable 5 Anthropic prova un equilibrio delicato: offrire al grande pubblico la potenza dei suoi modelli di classe Mythos, limitandone al tempo...

Belfast si ribella. Il caso Musk, social e politica britannica

Lunedรฌ sera, in unโ€™area residenziale del nord di Belfast, un uomo รจ stato aggredito con un coltello fuori da un complesso di appartamenti vicino...

Cosa cโ€™entra la Cina con la richiesta di pace di Zelensky a Putin?

La lettera aperta con cui Volodymyr Zelensky ha invitato Vladimir Putin a un incontro diretto non รจ soltanto un gesto diplomatico. รˆ anche una...

Israele in Azerbaigian: la guerra con lโ€™Iran apre il fronte nascosto del Caucaso

Durante la guerra tra Israele, Stati Uniti e Iran, una parte cruciale del conflitto si รจ consumata lontano dai riflettori, sulle colline e sulle...

Perchรฉ l’Iran negozia con gli Stati Uniti?

Il conflitto mediorientale esploso il 28 febbraio 2026, battezzato dagli analisti militari come la Terza Guerra del Golfo, rappresenta uno dei piรน complessi enigmi...

Il Castello dei Crociati che Israele non riesce a dimenticare: la caduta di Beaufort

Su quella collina che domina la valle del Litani, dove le pietre millenarie hanno visto passare crociati, mamelucchi, ottomani e guerriglieri palestinesi, sventola di...

Analisi tecnico-militare del TOS-1A “Solntsepek”

Genesi e filosofia dottrinale: il "lanciafiamme pesante" e l'ereditร  sovietica Nel panorama mondiale dei sistemi d'arma terrestri, il TOS-1A "Solntsepek" (Sole Bruciante) rappresenta un'anomalia concettuale...

Elezioni comunali 2026: il centrodestra conquista Venezia e il Sud

Elezioni comunali maggio 2026: il paese al voto tra sorprese e astensioni record L'Italia ha scelto. Nella tornata elettorale del 24 e 25 maggio 2026,...