Perché A.I. Può lottare per capire l'arabo

Perch Madness II - 9 perch over 1,6 kg!!

Perch Madness II - 9 perch over 1,6 kg!!
Anonim

Nel mondo dell'intelligenza artificiale, i dati sono re. Più ne hai, migliori sono i tuoi strumenti man mano che i sistemi sono in grado di "imparare" di più su cosa aspettarsi. Ma a seconda della piattaforma l'A.I. sta tracciando dati da, alcune lingue possono essere rappresentate meglio di altre, secondo Miriam Redi, uno scienziato ricercatore di Yahoo Labs.

"Ad esempio, come Flickr, da cui prendiamo i nostri dati, alcune lingue sono molto poco rappresentate", ha detto Redi, parlando al Deep Learning Summit di Londra giovedì. "Così abbiamo inglese, milioni di immagini per l'inglese, ma abbiamo forse 100.000 per l'arabo."

Il team di Redi sta lavorando a uno strumento in grado di identificare elementi non visibili per immagini, come valori culturali e connotazioni emotive. Lo strumento analizza il testo allegato alle immagini disponibili pubblicamente su Flickr. Nel tempo, l'A.I. inizia a capire perché qualcuno potrebbe taggare un'immagine "festa felice" o "momento imbarazzante", ma queste idee diventeranno sempre più accurate man mano che lo strumento analizza più immagini.

"Sfortunatamente, la precisione per il rilevamento dei sentimenti nelle immagini per le lingue arabe tende ad essere inferiore perché non abbiamo dati sufficienti", ha detto Redi.

Nelle lingue con maggiori quantità di dati, la squadra di Redi ha notato alcuni modelli interessanti. Le lingue romanze come il francese e lo spagnolo tendevano ad esprimersi in modo simile, mentre l'italiano sembrava essere l'unica lingua in cui gli utenti identificavano le immagini con il termine "evasione fiscale".

Le barriere linguistiche rimangono ancora un problema per l'A.I. ricercatori. Chiunque abbia utilizzato Google Traduttore saprà che cambiare le lingue non è mai così semplice come sembra. Tuttavia, i nuovi sviluppi stanno cambiando le cose, con Facebook che annuncia questa estate che si sta avvicinando al suo sogno di un social network in una lingua, traducendo automaticamente i testi per gli utenti.

Gli sviluppi nell'eliminazione delle barriere linguistiche possono aiutare a promuovere la comunicazione internazionale, ma per progetti come Redi, non esiste un reale sostituto per i dati sull'umore generati dall'uomo.