Soluzioni per il riconoscimento vocale

Interfacce multimodali

Voce e gesti

La diffusione sempre maggiore dei sistemi informatici nelle attività giornaliere di tante persone, rende necessario “umanizzare” l’utilizzo di questi sistemi attraverso modalità di interazione “naturali”, quale la voce, lo sguardo, i gesti. Combinare più modalità di interazione, per ottenere dei sistemi più facili e più piacevoli da usare, è lo scopo delle cosiddette interfacce “multimodali”.

linguaggio_gesti-2

Controllare il computer senza usare la tastiera e il mouse per molte persone può essere un curioso diversivo, ma per altre è una stringente necessità, vuoi per impedimenti temporanei (situazioni in cui le mani sono impegnate), vuoi per difficoltà congenite.
Le tecnologie che, opportunamente combinate tra loro, consentono questo tipo di applicazioni sono:

  • riconoscimento dei comandi vocali: l’utente “ordina” al microfono quale azione deve essere eseguita dal computer;
  • riconoscimento dei gesti: l’utente “mostra” al sistema, con un gesto delle mani, una particolare azione (analogamente ad un comando vocale), o una “regolazione” (esempio: alzare il volume) che il computer deve applicare;
  • sintesi vocale (Text To Speech): il computer “risponde” all’utente, notificando l’esito di una richiesta, o proponendo una tra le scelte possibili.

La disponibilità di sensori a basso costo, quali Leap Motion e Kinect, e la maturità delle tecnologie di riconoscimento e sintesi vocale rendono oggi possibile integrare il riconoscimento dei gesti e della voce in applicazioni professionali rivolte a diversi settori, in cui le persone, durante l’esecuzione di alcune delle loro attività quotidiane, devono interagire con un computer ma non possono toccare il mouse o la tastiera.

Alcuni esempi di applicazione:

  • un chirurgo può visionare le immagini diagnostiche su un monitor in sala operatoria, senza toccare nulla;
  • un magazziniere può seguire le istruzioni impartite dal sistema (posizione e merce da prelevare) tramite un dispositivo mobile agganciato alla cintura, e dare conferma leggendo il check digit di verifica;
  • un operatore in ispezione all’interno di una cella frigorifera può dettare le proprie annotazioni sullo stato dei prodotti contenuti;
  • un addetto ad una linea di produzione può controllare le operazioni del computer tramite gesti, senza dover utilizzare dispositivi touch-screen;
  • un tecnico di manutenzione di un impianto industriale può interrogare e rispondere vocalmente al sistema computerizzato di supervisione per seguire la ‘checklist’ delle operazioni;

Grazie alla propria esperienza in questo settore, Voisis è in grado di realizzare interfacce multimodali per diverse esigenze.

Guarda i prodotti collegati: