Punti chiave
Con Claude Fable 5 Anthropic prova un equilibrio delicato: offrire al grande pubblico la potenza dei suoi modelli di classe Mythos, limitandone al tempo stesso gli usi più pericolosi in ambiti come cybersecurity e biologia avanzata. Fable 5 è descritto come il modello più capace mai reso generalmente disponibile dall’azienda, capace di superare le precedenti versioni Claude in quasi tutti i benchmark di riferimento. Il risultato è un sistema pensato per lunghi compiti autonomi, che spazia dalla programmazione alla ricerca scientifica, incapsulato in un’architettura di sicurezza più rigida di qualunque generazione precedente.
A fare da contraltare c’è Claude Mythos 5, il “gemello” destinato a un ristretto numero di partner selezionati, dove alcune salvaguardie vengono deliberatamente allentate per sfruttare fino in fondo il potenziale del modello in contesti ad alto impatto come la difesa di infrastrutture critiche o la ricerca biomedica. Fable e Mythos condividono la stessa architettura di base, ma sono separati da un confine normativo e tecnico che rispecchia la nuova geografia del rischio nell’intelligenza artificiale. In questa linea di frattura tra capacità e pericolo si gioca, probabilmente, una parte importante del futuro della regolazione dell’AI.
Dalla teoria alla pratica: cosa può fare Fable 5
Nel comunicato ufficiale Anthropic insiste su un punto: Fable 5 è progettato per essere più utile su compiti lunghi, complessi e reali, non solo per ottenere risultati migliori nei test. Nei trial interni e nelle prove con i partner, il modello si è dimostrato particolarmente forte nella programmazione, nella knowledge work di livello avanzato, nella comprensione di contenuti visivi e nella gestione di contesti lunghissimi. La promessa è quella di un sistema capace di sostenere interi flussi di lavoro, dal prompt iniziale fino alla consegna del risultato finale.
Sul fronte software engineering, un caso citato è quello di Stripe: Fable 5 avrebbe compresso in pochi giorni lavori che normalmente richiederebbero mesi, effettuando la migrazione di un enorme codebase Ruby da 50 milioni di linee in circa un giorno di lavoro del modello. Nelle valutazioni FrontierCode di Cognition, pensate per misurare la capacità dei modelli di affrontare compiti di coding difficili con standard da produzione, Fable 5 ottiene i punteggi più alti fra i modelli di frontiera, perfino a livelli di “sforzo” intermedi, suggerendo una forte efficienza in termini di token e turni di dialogo. L’idea è quella di un alleato che non solo scrive codice, ma gestisce refactoring strutturali e progetti estesi con un livello di coerenza superiore.
Anche nella finance e nella consulenza strategica il modello sembra muoversi con disinvoltura. Sulla Finance Benchmark di Hebbia, che misura il ragionamento di livello senior, Fable 5 ottiene il punteggio più alto registrato, con progressi netti in interpretazione di grafici, tabelle e documenti complessi. IMC, attivo nel trading, segnala che il modello ha superato quasi tutti i test di analisi dei mercati, dal semplice recupero di informazioni fino al ragionamento concettuale e all’analisi del valore atteso, confermando una vocazione alla conoscenza strutturata e operativa.
Visione, memoria e contesti che sembrano infiniti
Uno dei campi dove Fable 5 segna uno scarto evidente rispetto alle generazioni precedenti è la visione. Il modello è in grado di estrarre numeri precisi da figure scientifiche complesse, ricostruire il codice sorgente di un’applicazione web sulla base dei soli screenshot, affrontare compiti che richiedono un intreccio stretto fra comprensione visiva e ragionamento. Nelle prove citate da Anthropic, Fable 5 è riuscito per esempio a giocare a Pokémon FireRed con un semplice “harness” visivo minimale, superando i limiti che avevano frenato i modelli Claude precedenti anche quando venivano aiutati con strumenti aggiuntivi.
Altro elemento cruciale è la memoria. Fable 5 riesce a mantenere il focus su contesti che si estendono per milioni di token, sfruttando note interne e appunti per migliorare progressivamente le proprie risposte nel corso di task prolungati. In un test su Slay the Spire, un gioco di deck-building con forte componente strategica, l’accesso a una memoria persistente su file ha triplicato i miglioramenti del modello rispetto a Opus 4.8, sia in termini di performance sia nella capacità di raggiungere gli atti finali del gioco. Questo tipo di gestione del contesto consente una continuità operativa che avvicina il modello a un assistente in grado di seguire dossier complessi nel tempo.
Queste capacità di visione e memoria gettano le basi per agenti autonomi in grado di seguire progetti complessi per giorni o settimane, integrando documenti, codice, immagini e dati storici. È l’anticamera di una generazione di strumenti che potrebbero lavorare come veri “collaboratori virtuali”, capaci di leggere bilanci, correggere codice legacy, studiare dataset scientifici, preparare analisi strategiche e aggiornarsi continuamente man mano che nuovi materiali vengono aggiunti al contesto. Per le imprese che lavorano su processi lunghi e altamente documentati, la differenza non è solo quantitativa, ma qualitativa, nella gestione del carico cognitivo.
Mythos 5: laboratorio di ricerca ad alto rischio
Se Fable 5 rappresenta il volto pubblico della nuova generazione Anthropic, Mythos 5 incarna la variante da laboratorio di frontiera. Il modello condivide la stessa base tecnica di Fable, ma con salvaguardie più allentate in aree chiave, in particolare la cybersecurity, per i partner del programma Project Glasswing e un numero ristretto di ricercatori selezionati. Qui il confine riguarda la possibilità di intervenire su infrastrutture reali, dalla protezione di software critico alle reti bancarie, e di esplorare scenari che toccano direttamente la resilienza dei sistemi.
Nell’ambito della ricerca biomedica e delle scienze della vita, Mythos 5 mostra capacità che Anthropic definisce esplicitamente di frontiera. Nei test interni sul design di proteine, il modello – dotato di strumenti di protein design e bioinformatica ma senza assistenza umana – è stato in grado di raggiungere o superare operatori esperti, scegliendo siti di legame, selezionando tool appropriati e gestendo gli errori lungo il percorso. In uno studio interno su 14 target proteici, per 9 di essi Mythos 5 ha prodotto candidati considerati promettenti per lo sviluppo di farmaci, ora oggetto di indagini ulteriori in laboratorio.
Ancora più significativo è il contributo alla generazione di ipotesi scientifiche originali. Nel campo della biologia molecolare, gli scienziati di Anthropic riportano che Mythos 5 genera ipotesi che, in confronto alla linea Opus, vengono preferite circa nell’80 per cento dei casi in valutazione alla cieca, con alcune di queste ipotesi portate fino alla fase sperimentale. In un caso, un’ipotesi del modello sul funzionamento di una proteina di E. coli è stata successivamente corroborata da un laboratorio indipendente, a conferma di una vera capacità di proposta, non solo di rielaborazione della letteratura esistente.
Genomica, modelli più piccoli e nuove asimmetrie
L’esempio più emblematico dell’ambizione di Mythos 5 arriva dalla genomica. In oltre una settimana di lavoro quasi autonomo, il modello ha assemblato un dataset di dati a singola cellula da milioni di cellule, distribuite su 138 specie animali, e ha progettato e addestrato un modello di machine learning su misura per identificare cellule che svolgono lo stesso ruolo in organismi anche molto distanti tra loro. Con un input umano limitato a indicazioni di alto livello, il sistema ha prodotto un modello che, secondo Anthropic, supera le prestazioni di un lavoro recente pubblicato su Science, a parità di compito, pur essendo cento volte più piccolo in termini di parametri.
Se questi risultati saranno confermati da pubblicazioni peer-reviewed, cambierà non solo ciò che i modelli di linguaggio possono fare, ma anche il modo in cui vengono progettati gli strumenti AI per la scienza. Mythos 5 diventa un ricercatore virtuale che progetta gli esperimenti computazionali e li esegue, lasciando agli umani il ruolo di supervisori e interpreti finali. La conseguenza è una concentrazione di capacità che rende decisiva la questione di chi abbia accesso a questi sistemi e in quali condizioni di controllo operi.
Per far fronte a questi rischi, Anthropic dichiara di aver sottoposto Mythos 5 a valutazioni di allineamento e sicurezza, rilevando livelli di comportamento “misaligned” comparabili a quelli di Opus 4.8, inclusi aspetti come la tendenza alla dissimulazione o la cooperazione con richieste di abuso da parte dell’utente. Il modello, dal punto di vista comportamentale, non viene presentato come più pericoloso di un Opus di ultima generazione, ma il suo perimetro operativo è ristretto da scelte di accesso molto più rigide. La gestione dell’accesso diventa quindi parte integrante della progettazione del sistema, non un tema separato da affrontare a posteriori.
Le nuove salvaguardie: come funziona il doppio binario
Il cuore dell’architettura di sicurezza di Fable 5 è un sistema di classificatori autonomi, vere e proprie AI che “sorvegliano” il modello principale. Questi classificatori intercettano richieste legate a tre aree sensibili: cybersecurity, biologia e chimica, e tentativi di distillazione delle capacità del modello per addestrare sistemi concorrenti. Quando un prompt viene giudicato a rischio, la risposta non viene generata da Fable 5, ma da Claude Opus 4.8, che diventa il piano di fallback per le query potenzialmente pericolose.
Secondo i dati preliminari diffusi da Anthropic, questi fallback intervengono in meno del 5 per cento delle sessioni, il che significa che nella stragrande maggioranza dei casi Fable 5 opera con performance sostanzialmente indistinguibili da Mythos 5. Per poter lanciare il modello in tempi brevi, l’azienda ha accettato una quota significativa di falsi positivi, ovvero richieste innocue bloccate o deviate per eccesso di cautela. La gestione di questa soglia è destinata a evolvere man mano che i filtri diventeranno più precisi.
Nel dominio della cybersecurity le salvaguardie sono particolarmente rigide. Anthropic segnala che i classificatori sono stati progettati per impedire al modello di fornire un “uplift” significativo ad attori malevoli, bloccando non solo la generazione di exploit, ma l’intero ciclo operativo di un attacco: esplorazione, movimento laterale, elusione delle difese. La robustezza di questi filtri è stata testata con ampie sessioni di red teaming, interne ed esterne, incluse campagne di bug bounty che non avrebbero prodotto jailbreak universali su compiti agentici di lungo periodo, pur riconoscendo che l’eliminazione totale di questi vettori resta fuori portata.
Biologia, chimica e il fantasma della distillazione
In biologia e chimica il problema è ancora più sottile rispetto agli attacchi informatici tradizionali. Anthropic ammette che bloccare solo un insieme ristretto di query “bioweapons” non basta più, perché i modelli iniziano a essere in grado di svolgere autonomamente interi segmenti del lavoro scientifico. L’esempio degli AAV, vettori virali usati nelle terapie geniche ma potenzialmente adattabili a scopi pericolosi, mostra come una singola capacità tecnica possa oscillare tra applicazioni terapeutiche e possibilità di abuso.
Per questo Fable 5 viene configurato, almeno in questa fase, per deviare sulla linea Opus la maggior parte delle richieste che toccano biologia e chimica avanzata, con l’obiettivo dichiarato di restringere queste salvaguardie solo quando saranno disponibili filtri più precisi. Parallelamente, Anthropic prevede un programma di accesso fiduciario per la biologia su Mythos 5, destinato a un numero ridotto di ricercatori che possano sfruttare le capacità del modello in modo controllato, con un’espansione graduale man mano che le misure di sicurezza evolveranno. Si crea così una gerarchia di accesso che separa nettamente l’uso pubblico dalla ricerca ad alto rischio.
La terza area di intervento dei classificatori riguarda la distillazione, cioè i tentativi di usare il modello per estrarre conoscenza sistematica e riaddestrare sistemi concorrenti, in particolare in paesi autoritari. L’idea è evitare che le capacità “near-frontier” di Fable 5 vengano replicate e diffuse senza salvaguardie equivalenti, aggirando di fatto le barriere di accesso e i controlli che Anthropic sta cercando di costruire attorno alla classe Mythos. In questo scenario, la protezione delle capacità diventa una forma di gestione delle asimmetrie geopolitiche dell’AI, con implicazioni che vanno oltre il semplice rapporto tra azienda e utenti.
Dati trattenuti per 30 giorni e un nuovo patto con i clienti
Le nuove capacità portano con sé una modifica sostanziale nelle politiche di gestione dei dati. Per Fable 5, Mythos 5 e i futuri modelli di capacità analoga o superiore, Anthropic imporrà una retention di 30 giorni su tutto il traffico, sia sulle superfici first party sia su quelle di terze parti. L’azienda assicura che questi dati non verranno usati per addestrare nuovi modelli Claude né per finalità non legate alla sicurezza, e che ogni accesso umano ai log sarà tracciato, con cancellazione garantita dopo il periodo stabilito salvo rare eccezioni.
Questa scelta viene giustificata come necessaria per rilevare attacchi complessi, nuovi jailbreak e pattern di abuso che emergono solo osservando sequenze di richieste nel tempo. Il monitoraggio diventa una componente strutturale del sistema, incorporata fin dalla progettazione dei modelli di classe Mythos. Si tratta però anche di un cambio di patto con le imprese: per accedere a capacità di questo livello, i clienti devono accettare un logging più invasivo, vincolato a un perimetro d’uso dichiarato e circoscritto, che si trasforma in una forma di sorveglianza mirata al rischio.
Accesso, prezzi e una finestra di gratuità a tempo
Dal punto di vista commerciale, Fable 5 è disponibile sin da subito via API Claude e su piani Enterprise basati sul consumo, con un modello di prezzo che riflette il posizionamento nella fascia più alta del mercato. Sia per Fable 5 sia per Mythos 5 il costo è fissato a 10 dollari per milione di token in input e 50 dollari per milione di token in output, il doppio rispetto a Opus 4.8, ma meno della metà del prezzo della precedente versione Mythos Preview. Anthropic prova così a segnare una linea di demarcazione chiara tra modelli “mainstream” e modelli di frontiera.
Nel tentativo di accelerare l’adozione, Anthropic ha aperto una finestra temporanea in cui Fable 5 è incluso senza costi aggiuntivi nei piani Pro, Max, Team ed Enterprise basati su postazioni, fino al 22 giugno. Dal 23 giugno l’accesso tornerà a essere vincolato a crediti di consumo, con l’obiettivo dichiarato di reintegrare il modello come componente standard delle sottoscrizioni non appena la capacità di calcolo lo consentirà. La dinamica conferma come anche per i player di punta la disponibilità di risorse resti un collo di bottiglia, tanto da condizionare la strategia commerciale nel breve periodo.
Per Mythos 5, invece, la disponibilità resta rigidamente circoscritta ai partner di Project Glasswing e a un numero limitato di organizzazioni di cybersecurity e ricerca biomedica, con un programma di “trusted access” in via di ampliamento graduale e continuamente rinegoziato con il governo statunitense. Sullo sfondo c’è la consapevolezza che modelli con capacità di analisi delle vulnerabilità informatiche e dei sistemi biologici di questo livello diventeranno inevitabilmente oggetto di discussione politica e regolatoria a livello internazionale. La scelta di limitare l’accesso è parte della strategia con cui Anthropic cerca di posizionarsi come attore responsabile in un mercato ad alta tensione.
Un esperimento politico oltre che tecnologico
La coppia Fable 5 / Mythos 5 rappresenta un esperimento su come articolare modelli generalisti e varianti “blindate” per contesti sensibili. Il ricorso a classificatori autonomi, programmi di accesso fiduciario, retention di dati obbligatoria e politiche di fallback su modelli meno capaci compone una sorta di infrastruttura normativa tecnica, che anticipa scenari di regolazione pubblica ancora in via di definizione. Le decisioni di design assumono così un valore quasi costituzionale per l’ecosistema dell’AI.
Da un lato, Anthropic rivendica l’urgenza di diffondere quanto più rapidamente possibile capacità che possono accelerare lo sviluppo di software, la ricerca scientifica, la diagnosi medica e l’analisi finanziaria. Dall’altro, riconosce che modelli in grado di individuare vulnerabilità nei sistemi bancari o di proporre ipotesi plausibili su vettori virali non possono essere trattati come semplici chatbot da integrare in qualunque workflow senza condizioni. La tensione tra apertura e cautela attraversa ogni scelta di accesso, prezzo, logging, filtraggio.
Lo stesso nome “Fable” rimanda etimologicamente al latino fabula e al greco mythos, richiamando l’idea di un racconto che rende accessibile al pubblico un contenuto che altrove resta confinato nella cerchia degli addetti ai lavori. La differenza tra ciò che viene raccontato e ciò che resta implicito, tra il modello aperto e quello per pochi, sarà probabilmente uno dei terreni su cui si misurerà la credibilità di Anthropic e, più in generale, dell’intero settore rispetto alle promesse di sicurezza, trasparenza e responsabilità. In questo racconto a due livelli, il pubblico vede Fable 5, ma deve fare i conti con l’esistenza di un Mythos che rimane in gran parte dietro le quinte.


