Webzine di Tecnica e Società
 

Con Mozilla cresce il riconoscimento vocale libero e accessibile

Fa progressi il progetto di riconoscimento vocale open source targato Mozilla. Che annuncia in modo ufficiale il rilascio del suo modello tecnologico e del secondo più grande dataset al mondo contenente registrazioni audio di 20mila diverse voci di utenti raccolte in crowdsourcing a livello globale.

Lanciato nel mese di luglio 2017, Project Common Voice è un’iniziativa che punta è creare un sistema aperto e accessibile a ogni sviluppatore per permettere a tutti di realizzare app basate sulla tecnologia di voice recognition.



La voce è diventata un mezzo mediante cui sempre più si interagisce con computer e dispositivi. Apple Amazon, Microsoft, Google, hanno ad esempio integrato la tecnologia di speech recognition in cellulari e gadget realizzando assistenti vocali come Siri, Alexa, Cortana e Google Assistant.

Molti pensano che controllo e interazione via voce siano componenti chiave di una tendenza destinata ad affermarsi ancora di più in futuro.

Anche Mozilla, organizzazione no-profit che sviluppa il browser Firefox, scommette sulla tecnologia di riconoscimento vocale riconoscendone il grande valore. Per questo motivo, è favorevole a rimuovere ogni ostacolo all’innovazione in questo settore per liberarne il potenziale e diminuire il peso di poche grandi aziende.

Come chiarisce in un post del blog aziendale, Sean White, manager di Mozilla, la ragione per cui ci sono ancora pochi servizi di riconoscimento vocale è a causa della mancaza di dati.

Startup e ricercatori hanno bisogno di dati di alta qualità per i loro algoritmi di apprendimento automatico. Proprio per superare questi limiti è nato Project Common Voice. Che vuole rendere lo sviluppo tecnologico alla portata di tutti mettendo a disposizione dati di qualità e a sufficienza per svolgere al meglio la propria attività.

Questo approccio ha già dato i primi risultati positivi. Perché il tasso di errore della tecnologia sviluppata è di appena il 6,5 per cento molto vicino alle prestazioni di un essere umano, anche se inferiore ai raggiungimenti di Microsoft (5,5 per cento).

Scritto da
Nessun commento

Lascia un commento