I discorsi utilizzano l'intelligenza artificiale per trascrivere le lingue e batte Google

$config[ads_kvadrat] not found

Investire in STARTUP ?? Le Vostre Domande al CEO di WeAreStarting

Investire in STARTUP ?? Le Vostre Domande al CEO di WeAreStarting
Anonim

I logopedici perseguono Google. La scorsa settimana, la startup britannica ha tolto l'incarico a Automatic Linguist, una potente intelligenza artificiale in grado di apprendere qualsiasi linguaggio per la trascrizione vocale in testo in pochi giorni. Il team vuole abilitare la tecnologia per ognuna delle circa 7.000 lingue al mondo, con il potenziale per trasformare le vite.

Dal lancio dello strumento linguistico, Speechmatics ha lavorato su Omniglot, una sfida per costruire un linguaggio al giorno. La scorsa settimana, l'azienda ha raggiunto un traguardo importante: ha battuto ufficialmente Google, con 72 lingue uniche in totale.

Il sistema utilizza l'apprendimento automatico per abbinare i dati audio con una controparte di trascrizione. Utilizza quindi schemi linguistici di altre lingue per rendere il processo il più semplice possibile, identificando le somiglianze tra i suoni e le strutture grammaticali e applicandoli a nuovi linguaggi. Il processo è molto efficace: ad esempio, il lavoro di Speechmatics in hindi ha richiesto solo due settimane per raggiungere l'80% di accuratezza. Quando il prodotto finale è stato testato contro gli sforzi di Google, ha fatto il 23 percento in meno di errori.

Inverso ha parlato con Benedikt von Thüngen, CEO di Speechmatics, per saperne di più.

In che modo il team ha iniziato a lavorare sul progetto?

Abbiamo avviato il progetto Omniglot come una sfida per noi stessi - per vedere quante lingue saremmo in grado di costruire in sei settimane. Ci siamo resi conto un po 'di tempo che l'approccio tradizionale di costruire ogni lingua individualmente non è più praticabile quando si cerca di scalare a un ritmo rapido. Tenendo a mente ciò, abbiamo dovuto ripensare a cosa sia una lingua, a come è strutturata ea quali somiglianze ci sono tra lingue diverse. Abbiamo trovato un modo per utilizzare questi elementi comuni per identificare i pattern e aiutare il nostro framework basato su AI, Automatic Linguist (AL), a sviluppare le lingue più velocemente che mai - 46 in sei settimane per essere precisi, o circa una lingua al giorno per sei settimane !

In che cosa differisce dagli sforzi di Google?

Il nostro approccio alla costruzione della lingua è uno degli aspetti principali che ci differenzia da Google. Mentre supponiamo che costruiscano le loro lingue individualmente (o con quella che chiamiamo 'forza bruta'), stiamo usando il potere di A.I. per semplificare e velocizzare il processo di costruzione della lingua. Inoltre, mentre altri servizi come Google si concentrano sulla creazione di dialetti piuttosto che su lingue uniche, siamo orgogliosi di dire che i nostri sforzi si sono concentrati su lingue uniche da tutto il mondo, comprese aree che erano state precedentemente sottovalutate dalle grandi aziende tecnologiche.

Quali sono alcune delle applicazioni del mondo reale per questo?

Ora disponiamo di tecnologia e conoscenza per rendere il nostro servizio più vasto che mai e portare a tutti il ​​riconoscimento vocale automatico (ASR). Ciò è particolarmente rilevante nei paesi con bassi tassi di alfabetizzazione, in cui la possibilità di utilizzare la tecnologia speech-to-text precedentemente non disponibile per comunicare può fare la differenza per le persone. Altri casi di vita reale in cui la tecnologia ASR può aiutare a risolvere problemi di accessibilità: persone con problemi di udito e / o ipovedenti da tutto il mondo possono ora utilizzare un dispositivo semplice come un telefono per interagire con chi li circonda.

Questo migliora l'accuratezza di lingue ben coperte come l'inglese?

Mentre continuiamo a sviluppare più lingue, la nostra A.I. la struttura diventerà sempre più abile nell'identificare caratteristiche e modelli linguistici. Useremo questa conoscenza per continuare a perfezionare la nostra attuale base linguistica, compreso l'inglese.

Questo potrebbe migliorare qualcosa come gli strumenti di traduzione in tempo reale di Google Pixel Buds?

Sicuramente vediamo progetti come Omniglot che aiutano a migliorare gli strumenti di traduzione in tempo reale. Man mano che maggiori risorse vengono investite nell'ampliare la portata e l'accuratezza delle lingue, vedremo un miglioramento continuo nel settore dei servizi di traduzione.

Funziona con qualsiasi lingua, persino con linguaggi costruiti come Klingon?

Dobbiamo ancora provare a costruire qualsiasi conlang, ma non vediamo alcun motivo per cui non funzionerebbero. Poiché queste lingue sono ancora parlate dagli umani, seguono anche regole e vincoli strutturali simili a quelli di tutti i giorni (come il numero di fonemi), che fornirebbe AL dati sufficienti per una build.

Sei aperto ad approvare il progetto?

No, non abbiamo piani per questo in atto.

Come funzionerà la licenza?

Le lingue offerte nell'ambito del progetto Omniglot sono gratuite e non possono essere utilizzate per scopi commerciali. Come tale, non ci sarà alcuna licenza ad essi collegata per il prossimo futuro.

Quali sono i prossimi passi da qui?

Il progetto Omniglot è solo l'inizio per noi. Vogliamo alla fine costruire tutte le lingue del mondo, quindi lavoreremo sodo verso questo obiettivo!

$config[ads_kvadrat] not found