di Francesco Pungitore*
Google Gemini 1.5 rappresenta un passo avanti significativo nel campo dell'intelligenza artificiale. Cambia radicalmente, infatti, il modo in cui interagiamo con le macchine grazie alla sua capacità di elaborare contesti estesi fino a 1 milione di “token”. Il modello è stato rilasciato in uso, al momento, solo per un ristretto gruppo di esperti. Ma le demo che circolano in Rete lo presentano come uno strumento avanzatissimo, ponendo al contempo un forte accento su sicurezza ed etica.
I token
Google Gemini 1.5 eleva, quindi, l'intelligenza artificiale a un nuovo livello (altissimo), grazie alla sua eccezionale capacità di analizzare video, audio e testi di grandi dimensioni. Questo modello utilizza “token” per interpretare i dati: in termini semplici, un “token” può essere una parola, un carattere o un pezzo di informazione che aiuta il modello a comprendere il contesto. Immaginate ogni “token” come un pezzetto di un puzzle; Gemini 1.5 può gestire fino a un milione di questi pezzi contemporaneamente, permettendo un'analisi profonda e una comprensione del linguaggio e dei contenuti multimedia senza precedenti.
Capacità sorprendenti
Nelle recenti dimostrazioni di DeepMind, Gemini Pro 1.5 ha mostrato capacità sorprendenti, come analizzare una trascrizione di 402 pagine dell'Apollo 11, estraendo passaggi umoristici come gli astronauti che attribuivano ritardi di comunicazione a pause per spuntini. In un'altra prova, ha risposto a domande su scene di film di Buster Keaton, superando le limitazioni dei modelli precedenti che gestivano testi e video più brevi. Queste evoluzioni promettono nuove applicazioni, con Gemini Pro 1.5 che processa enormi quantità di dati in una sola volta, evidenziando l'innovazione nel campo IA.
L’AGI
Gemini 1.5 rappresenta un significativo progresso verso l'Intelligenza Artificiale Generale (AGI), evidenziando una capacità senza precedenti di comprendere il contesto e di adottare prospettive generalizzate nell'analisi dei dati. Questo modello dimostra quanto la frontiera dell'AGI sia vicina e come la competizione tra le grandi aziende tecnologiche stia avanzando decisamente su questo percorso, segnando una nuova era nella ricerca sull'intelligenza artificiale. La mossa di Google con Gemini 1.5, dunque, mette in evidenza l'accelerazione nella corsa all'innovazione nel campo dell'intelligenza artificiale. Questo solleva interrogativi su come OpenAI risponderà, specialmente con le voci che circondano il potenziale lancio imminente di ChatGPT-5.
Conclusioni
Il futuro dell'intelligenza artificiale si prospetta come un orizzonte di possibilità illimitate, che promette di trasformare profondamente ogni aspetto della nostra esistenza. La direzione verso l'Intelligenza Artificiale Generale (AGI) suggerisce un avvicinamento a sistemi capaci di ragionamento, apprendimento e adattamento comparabili a quelli umani, aprendo la strada a soluzioni innovative per sfide complesse in medicina, ingegneria, scienza e oltre. Tuttavia, questo progresso porta con sé questioni etiche e filosofiche significative, richiedendo una riflessione approfondita sull'impatto dell'IA sulla società, il lavoro, la privacy e l'autonomia individuale. La collaborazione internazionale, la governance e le linee guida etiche saranno cruciali per affrontare i cambiamenti imminenti, garantendo che l'intelligenza artificiale si sviluppi in modo responsabile e positivo per l'umanità nel suo insieme.
*giornalista professionista, docente di Filosofia, Storia, Scienze Umane e Tecniche di Comunicazione con Perfezionamento post-laurea in Tecnologie per l’Insegnamento e Master in Comunicazione Digitale. Direttore Tecnico dell’Osservatorio Nazionale Minori e Intelligenza Artificiale