Software per il Riconoscimento Vocale


Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale.

Sviluppato da IBM, e distribuito in Italia da Questar, Via Voice è uno dei software pioneristici nel campo del riconoscimentovocale. Il software ha raggiunto un elevato grado di sviluppo e precisione grazie ai miglioramenti apportati in termini di accuratezza, prestazioni e semplicità d’uso. Si tratta dell’edizione rivolta ai professionisti e alle aziende e offre un ampio dizionario e funzionalità avanzate, tra cui la gestione di profili multipli e di macro per automatizzare le operazioni di riconoscimento e dettatura.



Offre un dizionario con 100 mila termini italiani, la possibilità di aggiungerne fino a 64 mila nuovi nonché il supporto ortografico a 260 mila parole. Se si dedica tempo e cura alla fase di “addestramento” del programma, in breve si è in grado di abbandonare definitivamente mouse e tastiera, utilizzando i comandi vocali e la dettatura dei testi. Al termine dell’installazione è richiesta la lettura di alcuni brani, per permettere al motore di Via Voice di analizzare la voce e apprenderne le caratteristiche. Con l’uso, poi, l’applicativo si evolve progressivamente, adeguandosi sempre più alle inflessioni e al modo di parlare dell’utente, migliorando così la precisione di riconoscimento. Dal canto suo l’utilizzatore deve usare alcune accortezze per “abituare” il programma alla propria voce e fare in modo che riconosca correttamente le parole e i comandi impartiti: per esempio, parlare lenta- Se ben addestrato, Via Voice consente di immettere testi nel pc o di impartire comandi senza usare mouse né tastiera. Contiene un dizionario con centomila termini in italiano, ma per funzionare al meglio richiede un certo addestramento mente e scandendo molto bene ogni parola.

Via Voice permette la dettatura di documenti direttamente in Word oppure utilizzando il Speak Pad, una sorta di Wordpad ottimizzato. Tramite comandi vocali si possono attuare operazioni di modifica, formattazione e spostamento all’interno dei testi. Allo stesso modo, la navigazione web avviene mediante il browser di sistema e gli indirizzi possono essere inseriti vocalmente o selezionati tra i preferiti, mentre nelle pagine gli elementi attivi sono indicati da numeri progressivi che, se letti, permettono di attivare i collegamenti corrispondenti. Il programma assicura il supporto alla composizione di e-mail, a chat e ai programmi, che possono essere avviati e gestiti passando da una finestra all’altra. Il Voice Center è il centro di comando poiché permette di modificare i parametri di funzionamento, di abilitare o disabilitare il supporto vocale e di utilizzare funzionalità interessanti come INIZIO LETTURA, che riproduce vocalmente il testo selezionato. L’interfaccia è molto intuitiva giacché ricalca quella della barra del menu START, ma appesantisce le prestazioni del sistema, che risentono dell’esecuzione di Via Voice. Tra gli altri strumenti interessanti figura Woodrow, un assistente che può essere interpellato in ogni momento per ottenere assistenza sull’uso del software. Importante anche la possibilità di riversare su pc il contenuto di audiocassette, inserendole come input audio e lasciando al programma il compito di riconoscere il parlato, nonché l’opzione per espandere il vocabolario, facendo analizzare i documenti presenti nel sistema per individuare i termini più frequentemente utilizzati. Il kit di Via Voice comprende, oltre al programma, l’indispensabile pieghevole con i comandi impartibili e una cuffia Plantronics di buona qualità abbinata a un microfono con tecnologia per la riduzione del rumore di fondo, che si è rivelata efficace e ha permesso
un’interazione ottimale in tutte le situazioni.

Il riconoscimento vocale offre numerosi vantaggi:

  • Permette di automatizzare i call center per offrire un servizio continuativo e ridurre i tempi di attesa
  • Rende più rapida ed efficace la ricerca delle informazioni e il raggiungimento degli obiettivi nelle interazioni uomo-macchina
  • Garantisce la riservatezza dei dati, perché sono trattati solo dai sistemi automatici
  • Unitamente all’autenticazione del parlatore, consente di ottenere un livello di sicurezza aggiuntivo
  • Permette di conseguire maggiore efficienza negli ambienti lavorativi in cui le mani sono impegnate
  • Riduce la distrazione delle persone alla guida
  • Rende più semplice l’uso di telefoni cellulari e di elettrodomestici, permettendo un’interazione più intuitiva e la riduzione dei passi necessari per raggiungere l’obiettivo
  • Consente alle aziende di conseguire ogni anno risparmi significativi.