17 Giugno 2026
HomeAttualitร Intelligenza Artificiale. Cosa vuol dire GPT

Intelligenza Artificiale. Cosa vuol dire GPT

I trasformatori generativi pre-addestrati, conosciuti come GPT, sono modelli di linguaggio di grandi dimensioni che rappresentano un importante sviluppo nell’intelligenza artificiale generativa. Nel 2018, l’organizzazione americana di intelligenza artificiale OpenAI ha introdotto il primo GPT. Questi modelli, basati su reti neurali artificiali con un’architettura chiamata “trasformatore”, vengono pre-addestrati su vasti set di dati di testo non etichettato. Questo addestramento permette loro di generare nuovi contenuti che somigliano a quelli prodotti dagli esseri umani.

A partire dal 2023, la maggior parte dei modelli di linguaggio di grandi dimensioni presenta queste caratteristiche avanzate e sono spesso indicati con il termine generico “GPT”. OpenAI ha rilasciato diversi modelli GPT di base che hanno avuto un notevole impatto. Questi modelli sono stati numerati in sequenza, ad esempio “GPT-3” e “GPT-4”, e ciascuno di essi รจ stato piรน potente del precedente grazie all’aumento delle dimensioni e dell’addestramento.

Questi modelli GPT sono diventati la base per la creazione di sistemi GPT piรน specifici per diverse attivitร . Ad esempio, sono stati sviluppati modelli ottimizzati per seguire istruzioni e alimentare servizi di chatbot come ChatGPT. Inoltre, altre organizzazioni hanno sviluppato i loro modelli GPT basati su questa tecnologia. EleutherAI ha creato una serie di modelli ispirati al GPT-3, mentre Cerebras ha recentemente sviluppato una serie di sette modelli.

Inoltre, molte aziende di diversi settori hanno adattato i modelli GPT alle loro specifiche esigenze. Salesforce ha creato “EinsteinGPT” per il CRM, mentre Bloomberg ha sviluppato “BloombergGPT” per il settore finanziario. Questi modelli specifici per attivitร  permettono alle aziende di sfruttare le capacitร  dei trasformatori generativi pre-addestrati nel loro campo di competenza.

In sintesi, i modelli GPT sono una potente tecnologia di intelligenza artificiale che utilizza reti neurali per generare contenuti linguistici. Grazie al loro addestramento su grandi quantitร  di dati di testo, possono creare testi che sembrano essere stati scritti da esseri umani. Questi modelli sono diventati un punto di riferimento nel campo dell’intelligenza artificiale generativa e sono stati adattati a diverse attivitร  e settori, offrendo nuove opportunitร  e possibilitร  in vari campi.

L’evoluzione del pretraining generativo

In precedenza, il pretraining generativo (GP) era un concetto consolidato nelle applicazioni di apprendimento automatico. Tuttavia, l’architettura del trasformatore, che รจ alla base dei moderni modelli di linguaggio di grandi dimensioni, non era disponibile fino al 2017, quando รจ stata inventata da un dipendente di Google. Questo sviluppo ha aperto la strada a modelli come BERT nel 2018 e XLNet nel 2019, che erano trasformatori preaddestrati (PT), ma non erano progettati per essere generativi (erano “solo encoder”).

Nel 2018, OpenAI ha introdotto il primo sistema di trasformatore generativo preaddestrato (GPT) con il suo articolo intitolato “Migliorare la comprensione del linguaggio grazie al pre-addestramento generativo”. Prima dell’introduzione degli approcci basati sui trasformatori, i modelli di elaborazione del linguaggio naturale (NLP) neurali con le migliori prestazioni facevano ampio uso dell’apprendimento supervisionato su grandi quantitร  di dati etichettati manualmente. Tuttavia, questa dipendenza dall’apprendimento supervisionato limitava l’utilizzo di tali modelli su set di dati non ben annotati e richiedeva anche un addestramento estremamente costoso in termini di tempo per modelli linguistici di grandi dimensioni.

OpenAI ha adottato un approccio semi-supervisionato per realizzare un sistema generativo su larga scala, che รจ stato il primo a utilizzare un modello di trasformatore. Questo approccio comprendeva due fasi: una fase di “pretraining” generativa non supervisionata per impostare i parametri iniziali utilizzando l’obiettivo di modellazione del linguaggio e una fase di “regolazione fine” discriminativa supervisionata per adattare tali parametri a una specifica attivitร  di destinazione. Questo approccio ha permesso di sfruttare al meglio i vantaggi del pretraining generativo e dell’adattamento supervisionato per creare modelli linguistici potenti e scalabili.

Altri modelli GPT simili

Altri modelli di questo tipo includono PaLM di Google, che รจ un ampio modello di base che รจ stato paragonato a GPT-3. รˆ stato reso recentemente disponibile agli sviluppatori attraverso un’API. Inoltre, c’รจ GPT-JT di Together, che รจ considerato l’alternativa open source con prestazioni piรน simili a GPT-3 ed รจ derivato dai precedenti modelli GPT open source. Meta AI, precedentemente conosciuta come Facebook, ha sviluppato un modello di linguaggio di grandi dimensioni basato sul trasformatore generativo chiamato LLaMA.

I modelli GPT di base possono anche essere utilizzati con modalitร  diverse rispetto al solo testo, sia per l’input che per l’output. Ad esempio, GPT-4 รจ un modello di linguaggio di grandi dimensioni multimodale in grado di elaborare sia input di testo che immagini, anche se il suo output รจ limitato al testo. Inoltre, ci sono modelli basati su trasformatori generativi che vengono utilizzati per tecnologie di conversione testo-immagine come la diffusione e la decodifica parallela. Questi modelli possono fungere da modelli di base visivi (VFM) per lo sviluppo di sistemi che lavorano con le immagini.

Modelli specifici per attivitร  particolari

Un modello GPT di base puรฒ essere adattato ulteriormente per creare sistemi piรน specifici e mirati a compiti o domini tematici particolari. Questo adattamento puรฒ coinvolgere una fase di messa a punto aggiuntiva rispetto al modello di base, cosรฌ come alcune forme di ingegneria specifica per il compito.

Un esempio significativo di ciรฒ รจ la messa a punto dei modelli per seguire le istruzioni. Questo รจ un compito piรน specifico rispetto a un modello di base generico. OpenAI ha introdotto “InstructGPT”, una serie di modelli appositamente addestrati per seguire le istruzioni. Questi modelli sono stati messi a punto utilizzando una combinazione di addestramento supervisionato e apprendimento di rinforzo dal feedback umano su modelli di linguaggio GPT-3 di base. I vantaggi di questi modelli ottimizzati includono una maggiore precisione, una minore presenza di sentimenti negativi o tossici e un migliore allineamento con le esigenze degli utenti. OpenAI ha quindi iniziato a utilizzare InstructGPT come base per i suoi servizi API. Altri modelli ottimizzati per le istruzioni sono stati rilasciati da altre organizzazioni, inclusa una versione completamente aperta.

Un altro tipo di modelli specifici per attivitร  sono i chatbot, che sono in grado di impegnarsi in conversazioni simili a quelle umane. OpenAI ha lanciato ChatGPT, un’interfaccia di chat online alimentata da un modello linguistico appositamente ottimizzato per le istruzioni. Questo modello รจ stato addestrato utilizzando un approccio di apprendimento di rinforzo dal feedback umano, con istruttori umani che fornivano conversazioni in cui interpretavano sia l’utente che l’intelligenza artificiale. Altri importanti chatbot includono Bing Chat di Microsoft, che utilizza GPT-4 di OpenAI come parte di una collaborazione piรน ampia tra le due aziende, e il chatbot concorrente di Google Bard, inizialmente basato sulla famiglia di modelli linguistici LaMDA, con l’intenzione di passare a PaLM.

Un altro compito per cui i modelli GPT possono essere utilizzati รจ la generazione di istruzioni per sรฉ stessi, come lo sviluppo di una serie di prompt per raggiungere un obiettivo piรน generale stabilito da un utente umano. Questo รจ noto come agente AI, e in particolare come agente ricorsivo, poichรฉ utilizza i risultati delle sue precedenti autoistruzioni per formare i prompt successivi. Un esempio notevole di ciรฒ รจ stato Auto-GPT, che utilizza i modelli GPT di OpenAI, e da allora sono stati sviluppati anche altri modelli simili.

Alex Trizio
Alex Triziohttps://www.alground.com
Da sempre appassionato di informatica e nuove tecnologie. Si avvicina al mondo dellโ€™open source e partecipa attivamente allo sviluppo del sistema operativo Linux, approfondendo sempre di piรน il settore di sviluppo e ingegneria software, collaborando con aziende statunitensi. Contemporaneamente, avvia e amplia studi sulla comunicazione e sul comportamento sociale e della comunicazione non verbale. Questi progetti lo portano a lunghe collaborazioni allโ€™estero, tra USA e Israele, dove approfondisce le interazioni fra software ed essere umano, che sfociano nella specializzazione in intelligenza artificiale. I molti viaggi in Medio Oriente aumentano la passione per la politica e la geopolitica internazionale. Nel 2004, osserva lo sviluppo dei social network e di una nuova fase del citizen journalism, e si rende conto che le aziende necessitano di nuovi metodi per veicolare i contenuti. Questo mix di elevate competenze si sposa perfettamente con il progetto di Web Reputation della madre, Brunilde Trizio. Ora Alessandro รจ Amministratore e Direttore strategico del Gruppo Trizio.
Altri articoli

TI POSSONO INTERESSARE

Patto migratorio o remigrazione? Le nuove norme

L'Europa chiude le porte: come il Patto Migratorio del 2026 sta riscrivendo le regole dell'asilo e del rimpatrio Nell'arco di pochi mesi, l'Unione Europea ha...

Trump spegne Fable e Mythos: cosรฌ la sicurezza nazionale ridisegna la mappa dellโ€™intelligenza artificiale

Gli Stati Uniti hanno ordinato lo spegnimento globale di Fable 5 e Mythos 5, i modelli di intelligenza artificiale piรน avanzati di Anthropic, nel...

Claude Fable 5, il modello che porta al pubblico la potenza di Mythos

Con Claude Fable 5 Anthropic prova un equilibrio delicato: offrire al grande pubblico la potenza dei suoi modelli di classe Mythos, limitandone al tempo...

Belfast si ribella. Il caso Musk, social e politica britannica

Lunedรฌ sera, in unโ€™area residenziale del nord di Belfast, un uomo รจ stato aggredito con un coltello fuori da un complesso di appartamenti vicino...

Cosa cโ€™entra la Cina con la richiesta di pace di Zelensky a Putin?

La lettera aperta con cui Volodymyr Zelensky ha invitato Vladimir Putin a un incontro diretto non รจ soltanto un gesto diplomatico. รˆ anche una...

Israele in Azerbaigian: la guerra con lโ€™Iran apre il fronte nascosto del Caucaso

Durante la guerra tra Israele, Stati Uniti e Iran, una parte cruciale del conflitto si รจ consumata lontano dai riflettori, sulle colline e sulle...

Perchรฉ l’Iran negozia con gli Stati Uniti?

Il conflitto mediorientale esploso il 28 febbraio 2026, battezzato dagli analisti militari come la Terza Guerra del Golfo, rappresenta uno dei piรน complessi enigmi...

Il Castello dei Crociati che Israele non riesce a dimenticare: la caduta di Beaufort

Su quella collina che domina la valle del Litani, dove le pietre millenarie hanno visto passare crociati, mamelucchi, ottomani e guerriglieri palestinesi, sventola di...

Analisi tecnico-militare del TOS-1A “Solntsepek”

Genesi e filosofia dottrinale: il "lanciafiamme pesante" e l'ereditร  sovietica Nel panorama mondiale dei sistemi d'arma terrestri, il TOS-1A "Solntsepek" (Sole Bruciante) rappresenta un'anomalia concettuale...