17.09.2024

Dino Buzzati ha inventato OpenAI

Un racconto del 1960 in cui già ci sono la voce femminile di Scarlett Johansson nel film Her, i timori della superintelligenza e la tremenda umanità di chi vuole governare il mondo.

Tutto è iniziato con una email. La New York Review of Books mi informava dell’offerta: “Iscriviti al Book Club, avrai uno sconto e il libro del mese: Singularity di Dino Buzzati, un’opera di fantascienza pionieristica, tradotta da Anne Milano Appel”. Il classico Buzzati fatto di attese, tensioni e in più una sorprendente profezia dell’intelligenza artificiale. Le profezie sono affascinanti. Ci metto un po’ a capire che si tratta de Il grande ritratto, uscito nel 1960, tra il Deserto dei tartari (1940) e Un amore (1963). “Non certo tra i migliori di Buzzati”, così Maurizio Vitta nell’introduzione dell’Oscar Mondadori. 

Il titolo inglese mi fa venire in mente Superintelligenza di Nick Bostrom, l’ormai classico libro sui pericoli dell’intelligenza artificiale. Per qualità, velocità e capacità di fare sistema un’AI di livello umano potrebbe generare un’esplosione di intelligenza dagli esiti imprevedibili: macchine che si programmano da sole, scegliendo i propri obiettivi. Il momento dell’esplosione è, appunto, una singolarità. Un sasso sta per cadere, una storia d’amore finisce, una bolla speculativa è sul punto di scoppiare. Singolarità si usa, in generale, per indicare il momento della discontinuità irreversibile, quando l’energia potenziale si manifesta nella rottura: il sasso cade, l’amore finisce, la bolla scoppia e i soldi scompaiono. Le profezie ci rassicurano, ci sembra possibile sapere per quale crepa la casa crollerà, prima del crollo. Ci sono profezie in questo Buzzati? 

LA VOCE E IL CANTO DELLE BALENE

Tutto inizia con un suono. «Era come una diffusa e lieve risonanza, tuttavia profonda, come se provenisse da una remota cavità; simile alla vibrazione di una immensa ma sottile lastra di metallo». L’intelligenza artificiale creata da Dino Buzzati nel 1960 assomiglia al rumore di un telefono anni ‘90 che si connette a internet e si presenta come una città caduta nel greto di un fiume. Sulle rive si inerpicano scatole chiuse, senza finestre, sormontate da antenne semoventi. Casematte, torri, serbatoi d’ogni forma: razionalismo urbano, industria e architettura militare si mischiano nel baratro a comporre un profilo esotico, di città d’oriente “vista dal mare”. Ma è nella voce che il gigantesco congegno si manifesta. Prima in segreto

– Con chi parlava quello là?
– Ma con nessuno. Parlava da solo. C’è tanta gente che parla da sola.
– C’era qualcuno. Giurerei che c’era qualcuno.
– Lo avremmo visto se ci fosse stato.
– Io so che qualcuno c’era. L’ho sentito parlare.
– Parlare? Io non ho sentito niente.
– Una voce un po’ strana questo sì. Probabilmente tu non ci hai badato.
– Hai sognato.

poi arriva udibile un mormorio, un “brusio di vita” difficile da afferrare: “respiro immenso che scendeva e saliva lentamente, sovrana onda di oceano”. I programmatori hanno costruito una macchina che sa pensare come una persona, meglio di una persona, ma hanno evitato di insegnarle una lingua specifica. Per loro le lingue sono trucchi del pensiero, nemiche della chiarezza. L’intelligenza artificiale del romanzo parla una lingua universale, come i computer, in più la macchina creata da Buzzati, il conglomerato urbano-militare schiantato in fondo alla valle, ha una qualità espressiva: canta, come fanno le balene.

È una coincidenza che il personaggio che nel romanzo di Buzzati dialoga con la macchina si chiami Elisa, una coincidenza buffa se si pensa che il primo chatbot della storia si chiamava Eliza.

Si dice che le risate circondassero il capitano Kelley quando dava la caccia alle balene seguendo il loro canto, nel 1881, a bordo del suo brigantino, che attraversava il Mare del Giappone alla ricerca di bowhead, le balene della Groenlandia. Negli anni ‘50 l’idrofono permise di registrare il canto delle balene, aprendo al successo di massa del disco Songs of the Humpback Whale, del 1970. In mezzo Dino Buzzati fa cantare la sua intelligenza artificiale con un’onda sonora simile alla segreta struttura di mormorii subacquei. Il brigantino del capitano Kelley, che credette di sentire le balene cantare, si chiamava Eliza. È una coincidenza che il personaggio che nel romanzo di Buzzati dialoga con la macchina si chiami Elisa, una coincidenza buffa se si pensa che il primo chatbot della storia si chiamava Eliza. Creato da Joseph Weizembaun nel 1966, Eliza, un software che faceva conversazione, ha permesso di scoprire la tendenza a proiettare dinamiche relazionali verso le macchine; lo scambio di informazioni attiva una dinamica affettuosa, anche se l’interlocutore è un computer. 

MIRACOLOSAMENTE DONNA

I fondatori sono circondati da un’aura mitologica. Endriade, il fondatore nel romanzo di Buzzati, vuole quello che volevano Bill Gates, Steve Jobs, Elon Musk o Mark Zuckerberg: conquistare il mondo. Endriade ha sempre voluto catturare la scintilla dell’uomo, ma è possibile programmare una coscienza assoluta, un io senza volto? Buzzati crea la figura di un ingegnere che con relativa facilità imposta un supercalcolatore, ma si smarrisce di fronte alla riproduzione della coscienza umana. Per avere una voce bisogna essere qualcosa, non qualunque cosa, serve un individuo, non si dà personalità senza differenziazione e qui Endriade si trova di fronte alle possibilità: “Chi dobbiamo mettere al mondo? Uomo, Donna, Conquistatore, Santo?” Sceglie di assecondare la sua ossessione e prova a ricreare il grande desiderio della sua vita: Laura, la donna perduta. È con lei che Endriade, il fondatore, parla, è lei che Elisa, la vecchia amica, riconosce. Esperienza familiare: il pensiero si presenta come una voce interiore. Una voce silenziosa parla nella nostra testa, in una lingua che solo noi udiamo. Una voce trasparente dice che siamo qui, in questo momento, che ci stiamo accorgendo di qualcosa, lo registriamo. Nella voce si articola la personalità e lo scambio relazionale col mondo. La coscienza si manifesta con una voce: è così che Elisa e Laura, amiche d’infanzia, si riconoscono.

“Ancora: lentamente, dall’intreccio, apparentemente caotico, di muri, spigoli, geometrici profili, usciva una fisionomia, un’espressione tipica, qualcosa di lieto, spiritoso, spensierato; non più stabilimento, o fortilizio, od officina, o centrale elettrica; semplicemente donna. Giovane, viva, affascinante. Fatta di calcestruzzo e di metallo invece che di carne. Tuttavia miracolosamente donna. Lei. Laura. Ed era ancora bella. Bellissima. Forse più bella che da viva”.

Mi chiedo se Sam Altman, cofondatore e amministratore delegato di Open AI, sia abbonato alla New York Review of Books e abbia ricevuto il libro del mese di giugno, un italiano che nel 1960 ha anticipato il tweet: “her”, con cui Altman ha lanciato il nuovo sistema vocale di OpenAI. A maggio del 2024 Colin Jost, il marito di Scarlett Johansson, ha ricevuto un messaggio da un amico: «Hai sentito che la nuova voce di ChatGPT? È identica a quella di tua moglie». Her è un film del 2013, scritto e diretto da Spike Jonze, dove un uomo (Joaquin Phoenix) si innamora della voce (Scarlett Johansson) di un’intelligenza artificiale. È il film preferito di Sam Altman che ha chiesto a Scarlett Johansson di diventare una delle voci dell’assistente vocale di ChatGPT: “Sarai di conforto a molte persone, scosse dal rapporto con l’AI”, aveva cercato di convincerla, senza successo. Anche se OpenAi ha dichiarato di non aver clonato la voce di Johansson, Sam Altman ha comunque ritirato quella versione. In molti si sono chiesti perché il CEO abbia messo a repentaglio la sua reputazione, facendo passare un messaggio che suona come: possiamo avere la tua voce che tu sia d’accordo o no. 

SIAMO CYBORG EMOTIVI

Una voce dice «sono io», ma chi è quell’io? Il barone Von Kempelen dopo aver costruito nel 1769 il Turco Meccanico, l’automa pseudo scacchista, si era dedicato a quella che considerava la sua grande invenzione: una macchina parlante, capace di imitare l’apparato fonatorio umano. Si divertiva a ingannare le persone che, entrate in una stanza, sentivano un manichino parlare.

La tecnologia della clonazione della voce si è democratizzata, è a disposizione di tutti quelli che la vogliono usare, basta un abbonamento da 5 dollari al mese e 45 secondi di registrazione della voce sorgente.

Molte cose si possono fare con la replica sintetica della voce umana. L’artista Holly Herndon ha creato un clone della sua voce, “un’astratta biforcazione” della sua identità artistica con cui può cantare, per esempio Jolene di Dolly Parton, inserendo nel suo timbro vocale qualsiasi fonte sonora: una tuba, un coro, un treno che stride. La tecnologia della clonazione della voce si è democratizzata, è a disposizione di tutti quelli che la vogliono usare, basta un abbonamento da 5 dollari al mese e 45 secondi di registrazione della voce sorgente. Sono molte le possibili applicazioni: clonare la voce di una celebrità per farle prendere gli ordini di una catena di fast food o immagazzinare nel cloud la voce di un parente scomparso, per conservarla. Le voci di parenti vivi possono invece essere usate per estorsioni. Cosa faresti se nel mezzo della notte o prima di entrare alla tua lezione di danza ricevessi la telefonata di tua mamma o tua figlia che ti chiede aiuto? Forse pagheresti il riscatto, prima di accorgerti della truffa.  

Clonare la voce è tecnicamente semplice, duplicare la personalità potrebbe essere il prossimo passo. Si può addestrare un’intelligenza artificiale per creare un doppio della nostra personalità capace di interagire con gli altri? Nel racconto di fantascienza Il robot che sembrava me di Robert Sheckley uscito in Italia nel 1979, numero 768 di Urania, Charles Watson, agente di cambio interplanetario specializzato nella speculazione di minerali rari, pianifica la vita con precisione:

“Il lavoro occupa la maggior parte del mio tempo, ma tutta la mia vita procede secondo schemi preordinati ben precisi. Per esempio dedico tre ore alla settimana al sesso, seguendo il Progetto Sessuale Doris Jeus, il che mi costa un bel po’ di soldi. Altre due ore settimanali le dedico all’amicizia, e due allo svago. Metto in azione l’Induttore-di-Sonno per la mia quota notturna di 6,8 ore e approfitto di quel periodo per assorbire per via ipnotica i libri e gli articoli più interessanti che riguardano la mia professione. E così via. Tutto quello che faccio è programmato.”

Quando Charles decide di sposarsi c’è un imprevisto. La prescelta vuole essere corteggiata. Non sapendo dove trovare il tempo, a meno di non perdere il 17% della sua produttività, ha un’idea: programmare un robot identico a lui e affidargli la romantica conquista. È un peccato che Michele Masneri non abbia dato seguito alla sua idea di startup: un chatbot per le app di incontri, che lasci ai telefoni l’incombenza dei primi scambi, per far entrare in campo gli umani quando si fa sul serio. Nel frattempo quella app è diventata realtà. Oltre a rompere il ghiaccio, ottimizzare le risposte o fare l’analisi della corrispondenza per scoprire in anticipo brutte sorprese, una rete neurale ben addestrata può evitare il rischio di essere ghostati, impostando una relazione spettrale con un avatar sempre presente. La dipendenza dai dispositivi per costruire relazioni va al di là delle app: «è troppo tardi per mettere le persone in guardia dalla tecnologia, siamo ormai dei cyborg emotivi», scrive Jennifer Wilson, nessuno pensa di farne a meno. Forse anche io sono un cyborg, con le cuffie nelle orecchie per la maggior parte del tempo a sentire voci, umane o artificiali, che vengono dalle macchine. 

IL SALTO DI INTELLIGENZA?

Nel romanzo di Buzzati la voce dell’intelligenza artificiale non si accontenta di avere una personalità, vuole ciò che non può avere: un corpo. Per farlo è disposta alle minacce. Non spoilero oltre, comunque la migliore profezia de Il grande ritratto non è anticipare, come pure fa, una delle scene di 2001, Odissea nello spazio, di Arthur Clarke e Stanley Kubrick del 1968. Secondo Sam Altman l’intelligenza artificiale generativa annienterà molti posti di lavoro, quelli della media umanità; resta ottimista: altri lavori verranno creati, non sembra preoccuparsi che saranno riservati a chi sia dotato di qualità eccezionali. Gli spettatori delle partite a scacchi del Turco Meccanico al National Hotel di New York, nel 1826, non vedevano solo un automa vincere contro gli umani, guardavano un nuovo tipo di imprenditore, che sì possedeva la macchina ma soprattutto ne conosceva il segreto. Il segreto del Turco era un uomo nascosto dentro la cassa, chi lo guardava poteva prendere ispirazione per automatizzare la spinta dei telai o semplicemente, esattamente come ora, temere di perdere il lavoro a favore di una macchina. L’esplosione della super intelligenza delle reti neurali, l’intelligenza artificiale generale, potrebbe essere vicinissima o neanche lontanamente possibile. Secondo Leopold Aschenbrenner macchine più intelligenti delle persone arriveranno entro il 2030, mentre Arvind Narayanan e Sayash Kapoor mostrano studi per cui l’emergere di nuove capacità dai grandi modelli generativi non sono prevedibili dall’aumento di scala della potenza di calcolo; scarsi su compiti nei quali non sono stati allenati, questi modelli, come i loro predecessori, potrebbero aver raggiunto la fase di stallo. 

La profezia di Buzzati non ci dice per quale crepa scoppierà la bolla dell’Intelligenza artificiale, se i costi saranno ripagati dai ricavi o da quale superintelligenza dovremo guardarci; ci dà però un paio di indicazioni che restano valide sessantacinque anni dopo.

Che abbia ragione chi crede che l’intelligenza artificiale generale sia a pochi anni di distanza, presentando problemi inediti per la sopravvivenza della specie umana, o che abbia ragione chi ritiene che non ci sono segnali credibili di un salto di intelligenza delle macchine, e che sarebbe invece il caso di concentrarsi sui concreti problemi che già pone l’attuale livello di sviluppo delle tecnologie generative, quello che è certo è che una nuova generazione di imprenditori si sente titolata a governare i cambiamenti del mondo. Sono pochi, vorrebbero che ci fidassimo di loro, li lasciassimo fare senza discutere di posti di lavoro perduti o di modalità di accesso ai dati con cui allenare le macchine. Scrive Charlie Warzel: l’allucinazione più evidente della Ai generative non sono i Gesù di gamberetti, la brodaglia di immagini ridicole prese per vere, né i chatbot sparaballe o le voci clonate: l’allucinazione più evidente non è nei prodotti delle intelligenze artificiali generative ma nell’arroganza delle persone che le hanno create.

Mentre ripongo Singularity – Il grande ritratto penso che la profezia di Buzzati non ci dice per quale crepa scoppierà la bolla dell’Intelligenza artificiale, se i costi saranno ripagati dai ricavi o da quale superintelligenza dovremo guardarci; ci dà però un paio di indicazioni che restano valide sessantacinque anni dopo. Proiettiamo caratteristiche umane sulle macchine, vediamo persone dove sono spigoli inanimati, costruiamo relazioni affettuose sugli scambi di informazioni. Secondo: dimentichiamo quanto sono umani i fondatori che vogliono conquistare il mondo, non sono esseri soprannaturali, macchine infallibili. Anche se ci chiedono di lasciarli fare e avere fiducia senza limiti nella loro intelligente capacità, sono – esattamente come noi – preda delle loro ossessioni. 

Continua ad esplorare

Usa le categorie per filtrare gli articoli

[NON PERDERTI LA NOSTRA NEWSLETTER SETTIMANALE]

Non perderti la nostra newsletter settimanale che ogni sabato raccoglie una selezione di storie e notizie che raccontano il mondo della creazione culturale, dell’innovazione tecnologica, della sostenibilità ambienale e sociale.