🎙️Come si clona una voce. I messaggi (artificiali) di Meloni e Schlein #3
Nel 1999 Napster cambiò il mondo della musica. Adesso tocca all'intelligenza artificiale, con la possibilità di creare nuove voci e nuovi suoni, ma mettendo in crisi la proprietà intellettuale.
🦸♂️Benvenuti nel terzo numero di Superpoteri, più da “ascoltare” che da leggere! Vi ricordate “Napster”? Ecco, siamo di fronte a una nuova possibile rivoluzione dell’industria musicale.
🦸♀️Restiamo in tema “audio” per mostrare un nuovo “superpotere”: la possibilità di creare voci di ogni persona in pochi minuti e utilizzarle per dire qualsiasi cosa! E’ davvero così? Quanto sono affidabili?
🎶Proverò a rispondere qua sotto, nel frattempo vi vorrei far sentire gli ultimi due apprezzamenti alla newsletter che ho ricevuto. Non vi dico i nomi tanto le riconoscerete subito:
Wow, il Presidente del Consiglio che consiglia Superpoteri! Ma non finisce qui:
Anche la leader dell’opposizione Elly Schlein? Come è possibile? Leggete sotto!
🦹♀️E infine Supercattivi, la nuova rubrica che segnala gli usi nefasti delle nuove tecnologie.
🎙️Buona lettura, anzi, buon ascolto e, se non l’hai ancora fatto, iscriviti!
Superpoteri
🗣️La voce è uno strumento estremamente utile e potente. E’ un importante mezzo di comunicazione e di espressione. La voce esprime le nostre emozioni attraverso mille sfumature; riesce a trasmettere gioia, tristezza, paura, collera, disprezzo, tenerezza, indipendentemente dal significato delle parole. Queste sfumature sono infinite e spesso le emozioni possono generare molta confusione e risultare poco riconoscibili proprio perché la voce è in grado di esprimere e comunicare una notevole varietà di situazioni emotive. In effetti la voce di ognuno è unica, è il tratto fisico che ci contraddistingue di più rispetto agli altri. La voce è vita!
Ecco perché è sempre stato difficile sintetizzarla, riprodurla, ricrearla, con il risultato di far risultare poco naturale ogni tentativo di assistente vocale o di voce artificiale.
Almeno fino ad oggi. Quanto può essere difficile imitare la voce di qualcuno? In realtà bastano pochi minuti. Ma se non credete alle mie parole, ascoltatemi:
Sbalorditivo. La mia voce clonata in pochi minuti. Ci sono anche finti errori di lettura e tracce del mio dialetto pisano.
Ma la mia voce la conoscono in pochi e quindi mi faccio un’altra domanda: è possibile clonare le voci dei leader politici?
In realtà non sarebbe la prima volta: Ron De Santis, governatore della Florida e sfidante di Trump, recidivo nell’uso dell’intelligenza artificiale generativa, ha utilizzato una versione sintetica della voce dell’ex presidente in un suo spot elettorale.
Non sappiamo che software di IA abbia usato, ma voglio provare in prima persona se è davvero facile farlo anche con i nostri politici, creando le voci del Presidente del Consiglio Giorgia Meloni e della leader dell’opposizione Elly Schlein. Come avete potuto “sentire” in premessa, i risultati sono stati molto efficaci.
Ok, ma adesso che ho la voce di Giorgia Meloni e di Elly Schlein, cosa ci faccio? La cosa più innocua da fare è un esercizio di fantapolitica: la prima cosa che ho provato a fare è far cantare “Bella Ciao” alla leader di Fratelli d’Italia, ma purtroppo anche l’intelligenza artificiale si è rifiutata di darmi un risultato “verosimile”. E’ ancora difficile far cantare una voce sintetica (almeno con questi strumenti basici). Sentite il risultato:
Allora ho ripiegato su un testo molto particolare, più prosaico, dal forte messaggio politico di sinistra: l’epigrafe scritta dal partigiano Piero Calamendrei in segno di protesta per la scarcerazione di Albert Kesselring, comandante in capo delle forze armate di occupazione tedesche in Italia, responsabile per le Fosse Ardeatine, Marzabotto e altre orrende stragi di innocenti.
Sembra lei, vero? Anche se la parola “resistenza” le viene male anche nella voce sintetica. Per la par condicio, mi sono sentito in dovere di far dire a Elly Schlein qualcosa di destra, anzi, di fascista, spingendomi nel farle decantare il triste e famoso “discorso del bivacco”, il primo discorso tenuto da Benito Mussolini come Presidente del Consiglio dei ministri, alla Camera dei deputati il 16 novembre 1922.
Agghiacciante come l’indiscutibile forza retorica delle due leader renda verosimile l’ascolto di questi messaggi.
Questo è stato un “gioco”, un esperimento innocente. Se ne potrebbero fare altri, come ad esempio creare dialoghi inventati fra le due, con le loro voci artificiali, dove magari si promettono voti di scambio o segrete collaborazioni in Parlamento. Il risultato è, come per le immagini, dobbiamo dubitare di tutti gli audio. La facilità con la quale possiamo “impersonare” una singola persona è drammaticamente stupefacente. Non solo in politica, ma nella vita di tutti i giorni, la nostra sicurezza è in pericolo costante. La voce è quell’elemento fondamentale che influenza in maniera sostanziale l’efficacia delle parola, la credibilità di una persona, la forza delle emozioni, la memorabilità di un momento. Riuscire a ricrearla artificiosamente sblocca un “superpotere” che va controllato.
C’è ancora tanto da capire, valutare, sperimentare. Ad esempio, si può generare la voce di un defunto? Magari di un politico morto quasi 40 anni fa, ma ancora citato da molti….
E qua vi mostro i semplici passaggi che ho fatto per “sperimentare” con le voci:
Andate su ElevenLabs, una società di ricerca e implementazione dell'intelligenza artificiale vocale con la missione di rendere i contenuti universalmente accessibili in qualsiasi lingua e voce.
Sottoscrivete il loro piano più economico (starter), scontato a un solo dollaro il primo mese (potete comunque disdire quando volete).
Andate su Youtube e cercate discorsi integrali della persona che volete replicare. Devono essere privi di rumore di sfondo o di altre voci sovrapposte. Scegliete due o tre video abbastanza lunghi e usate uno strumento di conversione online da video a mp3 (basta una semplice ricerca su google per trovarli).
Infine aprite ElevenLabs, andate su Voicelab e “add generative or cloned voice”, dove caricare i file mp3.
Finito. Nel giro di pochi minuti avete la vostra voce sintetizzata. Senza troppe competenze tecniche e con mille opportunità di fronte a voi.
Superpost
E’ in arrivo un nuovo “momento Napster”? L’industria musicale e dei contenuti alla prova dell’intelligenza artificiale
🎶Correva l'anno 1999. Sulle note di “50 Special” dei Lunapop mi immaginavo a sfrecciare con una Vespa sui colli bolognesi portando in sella Britney Spears, sogno di tutti gli adolescenti dopo l’uscita di “Baby one more time”. Il vibrato di Cher in “Believe” stupiva il mondo e gli Offspring suonavano “A pretty fly for a white guy”, colonna sonora delle mie gite scolastiche.
Cosa hanno in comune tutte queste canzoni? Per voi niente, ma sono state le mie prime canzoni scaricate da Napster, una tecnologia rivoluzionaria che stava conquistando il mondo.
Se non sai cos’è Napster, vergognati, vuol dire che sei troppo giovane. Napster era un servizio di condivisione file peer-to-peer che consentiva agli utenti di scaricare facilmente tutta la musica che si voleva. Ovviamente in modo illegale, ma era abbastanza “tollerato”, se usato senza scopo di lucro.
🎼Napster è stato uno dei primi grandi segnali di come Internet avrebbe completamente sconvolto e trasformato numerose industrie. L’industria musicale è stata quella più colpita, andando vicina alla rovina. Le case discografiche ovviamente reagirono: dopo due lunghi anni di battaglie giudiziarie, Napster venne infine chiuso. Ma nel frattempo erano sorti altri siti simili, confermando che, quando emerge un bisogno, chiudere un rubinetto significa solo far esplodere l’acqua da altre parti. In questo caso il bisogno era quello di avere tutta la musica facilmente accessibile ovunque, pagando poco. Long story short, la chiusura di Napster non riuscì a fermare il lento e progressivo declino dell’industria musicale, fino a quando si trovò un nuovo modello economico che faceva contenti (più o meno) tutti: lo streaming.
Ma adesso sembra che ci sia un nuovo terremoto per l’industria musicale: il “colpevole” è l’intelligenza artificiale, o meglio, l’uso che ne facciamo, visto che, grazie ai nuovi strumenti potenziati dall’IA, è possibile analizzare milioni di canzoni e produrre nuove tracce e nuova musica.
🎤Possiamo far risalire questo nuovo “momento Napster” allo scorso Aprile, quando in tutte le piattaforme musicali uscì una nuova canzone, "Heart on my sleeve”, cantata da due dei più famosi artisti del pianeta: Drake e the Weeknd. Qual è la novità? Semplicemente che le voci dei due cantanti non erano le loro, ma generate dall’intelligenza artificiale. Erano voci false. Prima di essere rimossa, la canzone è stata ascoltata milioni di volte su Spotify, YouTube, TikTok, diventando presto una hit. Mentre sentire A.I. Freddie Mercury cantare “I will always love you” o A.I. Kanye West eseguire "Hey There Delilah" può sembrare un esperimento innocuo, il successo (anche se breve) di "Heart on My Sleeve" sui servizi di streaming ufficiali, completo di astuto marketing online da parte del suo creatore anonimo (addirittura la canzone è stata candidata al Grammy), ha intensificato gli allarmi che stavano già suonando nel mondo della musica, dove le aziende sono sempre più preoccupate per i modelli che apprendono le voci dei cantanti famosi che poi vengono riutilizzate per gli scopi più diversi: un’altra canzone, uno spot, un messaggio politico. Insomma, utilizzare le voci più famose del mondo a proprio piacimento. Un superpotere non da poco (come avete visto anche sopra). Ma "Heart on My Sleeve" è stato l'ultimo e più clamoroso esempio di un genere che è esploso negli ultimi mesi: c’è addirittura uno “Spotify dell’IA” , dove trovare canzoni nuove e originali cantate dagli artisti più famosi. Anche in Cina non si scherza: Tencent Music, il gruppo di intrattenimento cinese, ha pubblicato più di 1.000 brani con voci sintetiche.
🎵Ma non esistono solo voci artificiali. Audio e musica sono già facilmente generabili dall’IA: impressionante il documento di Google uscito la scorsa primavera che racconta le potenzialità di MusicLM, un sistema che genera qualsiasi suono, semplicemente con un suggerimento di testo, come facciamo per ChatGPT e gli altri. I risultati sono apparentemente straordinari e realistici: avete mai voluto sentire come “suonerebbe” l’urlo di Munch? Ecco, MusicLM può generare musica anche dalla descrizione di dipinti famosi, creando un mash-up tra varie arti dai risultati lisergici e perturbanti.
Il suono è conturbante e angosciante, proprio come il quadro. Non sappiamo se mai uscirà MusicLM. Sembra che Google tema i possibili effetti di un modello di generazione audio così potente, e nel frattempo si starebbe mettendo d’accordo con Universal per sviluppare uno strumento che consenta ai fan di creare brani musicali partendo da canzoni già esistenti, e insieme di garantire ai legittimi titolari dei diritti d’autore di ricevere un compenso per l’utilizzo delle loro opere.
Ma se non volete aspettare Google, e volete creare musica solamente con l’aiuto di un testo, potete provare gratuitamente Stable Audio, che, secondo il CEO Emad Mostaque, “può consentire agli appassionati di musica e ai professionisti creativi di generare nuovi contenuti con l'aiuto dell'intelligenza artificiale, generando infinite innovazioni”. Uno strumento virtuoso che può aiutare gli artisti a creare le loro opere.
🗣️Non solo c’è la capacità di creare musica e canzoni (senza possedere talento musicale), ma i nuovi algoritmi di intelligenza artificiale possono finalmente rompere il divario linguistico che purtroppo non ci consente di apprezzare pienamente la creatività globale. Ad esempio, Spotify ha annunciato una collaborazione con alcuni popolari podcaster inglesi per duplicare i loro episodi in lingua spagnola tramite AI. L'obiettivo è quello di rendere i podcast originariamente in inglese accessibili a un pubblico internazionale più ampio.
🎙️Ma ci pensate alle potenzialità di poter offrire la propria creatività, di condividere il proprio messaggio, potenzialmente in tutte le lingue del mondo, con un semplice click? Potrebbe finalmente segnare la fine della geografia, nessuna barriera o confine nazionale potrà evitare di far sentire le nostre voci (o le nostre canzoni). Questo potrebbe essere il “bisogno”, l’esigenza che muta i modelli produttivi ed economici: poter creare musica e audio facilmente, per tutti. In realtà, da grande fan del karaoke, mi accontenterei che l’intelligenza artificiale possa migliorare in tempo reale la mia voce, prendendomi una bella rivincita contro i miei detrattori.
🎶A parte i miei desideri canori, abbiamo visto luci e ombre per quanto riguarda l’utilizzo dell’IA nel campo della musica e degli audio. Da una parte gli evidenti problemi di copyright e di proprietà intellettuale, dall’altra la capacità di utilizzare nuove possibilità per esprimere la propria creatività. L’industria musicale e di creazione di contenuti è di fronte a un nuovo bivio: rinascere sfruttando l’intelligenza artificiale o morire per colpa di questa?
Supercattivi
🦹♀️La tecnologia non è neutrale. E’ uno strumento che può essere usato in molti modi. Anche per fare del male. In questa rubrica inseriremo esempi di uso sbagliato delle tecnologie, da parte di Stati, aziende o singoli cittadini. Conoscere questi usi è il primo passo per non farli accadere più. Non siamo in una macchina a guida autonoma: abbiamo il potere e il dovere di guidare le politiche tecnologiche per ridurre al minimo i rischi di nuovi “supercattivi”.
Una piccola cittadina nel sud della Spagna è sotto shock dopo che è emerso che immagini nude di giovani ragazze locali generate dall’intelligenza artificiale circolavano sui social media a loro insaputa.
I pedofili stanno sfruttando le tecnologie di intelligenza artificiale generativa per condividere online materiale falso contenente abusi sessuali su minori. Dall’inizio dell’anno sono purtroppo aumentate le segnalazioni di materiale pedopornografico falso.
Lo stimato costituzionalista americano Jonathan Turley, professore di legge alla George Washington University e commentatore televisivo della rete conservatrice Fox, è stato avvertito da un collega che ChatGpt aveva incluso il suo nome in una lista di molestatori.
👏Ed eccoci arrivati alla fine di questa terza uscita di Superpoteri. Avete ascoltato le voci sintetiche? Incredibili. Settimana prossima invece vi vorrei raccontare chi sta vincendo “la corsa all'Intelligenza artificiale”.
🫵Ricordatevi che Superpoteri è un esperimento collettivo, utile per generare dibattiti, riflessioni, proposte sulle tecnologie e il loro impatto. Nessuno si deve sentire escluso.
🤖Puoi darmi una mano semplicemente iscrivendoti (se non l’hai ancora fatto) cliccando sul pulsante sotto.
🦸♀️Puoi lasciarmi un commento (anche critiche, dai!) o scrivermi per qualsiasi suggerimento
🦸Infine puoi semplicemente condividere “Superpoteri” a chi pensi possa essere interessato
Grazie e ci vediamo settimana prossima!👋