ChatGPT diventa “quasi umana”: ora parla e risponde con la sua voce, oltre a creare testi ed immagini | Alexa e Siri sembrano giochi per bambini al confronto

ChatGPT OpenAI
L’app di ChatGPT si prepara a diventare una chat vocale – ipaddisti.it

OpenAI punta a trasformare ChatGPT in un assistente virtuale a tutto tondo: annunciato il supporto ai messaggi audio e alle immagini. La potente intelligenza artificiale ora si unisce ai ranghi degli assistenti personali come Alexa, Siri e Google Assistant. Grazie alla possibilità di fornire risposte rapide alle domande tramite l’app, gli utenti possono ora chiedere e ricevere risposte in pochi secondi.

Sono arrivate le ultime novità: OpenAI si sta ora avventurando in un nuovo territorio con l’introduzione di numerose funzionalità aggiuntive all’interno della sua app mobile. A breve si potrà parlare direttamente con ChatGPT esattamente come avviene con Alexa o con Siri.

Nelle prossime settimane, gli utenti che si sono registrati ai piani Pro ed Enterprise avranno la possibilità di attivare la funzione di richiesta di ChatGPT utilizzando la propria voce, anziché doverla digitare manualmente nella casella di testo. Inoltre, questa nuova tecnologia consentirà agli utenti di incorporare foto e altre immagini come mezzo per avviare richieste e rispondere a ChatGPT. Il metodo utilizzato nell’ultimo sistema ChatGPT è sorprendentemente simile alla tecnologia consolidata utilizzata da assistenti virtuali come Siri o Alexa.

Dopo aver ricevuto l’input vocale, ChatGPT trascrive la richiesta e genera una risposta testuale corrispondente. Nel giro di pochi secondi, questo viene poi convertito in parlato udibile e ritrasmesso all’utente. Per impostazione predefinita, la funzionalità rimane inattiva e richiede l’attivazione tramite le impostazioni dell’applicazione. È importante notare che inizialmente la funzionalità sarà accessibile solo in inglese, almeno per il momento.

Si potrà parlare con ChatGPT: la novità in arrivo per gli utenti Pro ed Enterprise

OpenAI ha evidenziato l’utilità della condivisione di immagini dimostrando come può essere utilizzata in molti modi nella nostra vita quotidiana. Un esempio fatto dalla stessa società è quello della scelta dello strumento appropriato in una cassetta degli attrezzi. Il modello di sintesi vocale che verrà utilizzato per ChatGPT è estremamente avanzato. Questa tecnologia innovativa ha la capacità di generare un audio incredibilmente simile a quello umano, utilizzando solo un piccolo campione di voce e testo.

ChatGPT App
Con le nuove funzionalità si potrà rispondere con messaggi audio e immagini – ipaddisti.it

Per implementare al meglio la funzione, la società si è avvalsa dell’aiuto di alcuni doppiatori professionisti. Addirittura, è stata annunciata una collaborazione con Spotify per utilizzare l’intelligenza artificiale nella traduzione di podcast dall’inglese ad altre lingue. Dopo test approfonditi, il prodotto finale sembra promettente, ma può ancora migliorare: la replica attualmente emette ancora un tono un po’ meccanico. A partire da ora, questa innovazione è rivolta a un gruppo selezionato di podcaster.