Applicazioni multimodali

Se le applicazioni vocali rappresentano un ulteriore livello di astrazione rispetto alla tradizionale interfaccia grafica (GUI), le applicazioni multimodali rappresentano esattamente la loro sovrapposizione, e non solo.

Una applicazione multimodale sarà, infatti, in grado di ricevere input via tastiera e mouse, attraverso la voce, o attraverso sensori di movimento (haptic devices), touch screen, penne.

La pagina dovrà inoltre essere in grado di poter gestire i diversi input sia in modo “supplementare”, ovvero basata sull’utilizzo indipendente di modalità differenti:  l’utente potrà richiamare un form premendo una determinata icona con il mouse e riempirne i campi utilizzando una penna o la voce. Oppure di modo  “complementare”: l’utente potrà riempire il campo di un form utilizzando modalità differenti in modo sincrono (per assurdo potrebbe scrivere con la tastiera il suo nome e, contemporaneamente, pronunciare il cognome).

L’utilità delle applicazioni multimodali si evidenzia maggiormente nel momento in cui le diverse modalità siano adatte a raggiungere il medesimo risultato, e l’utente possa perciò scegliere se utilizzare la voce piuttosto che il mouse per interfacciarsi con la nostra applicazione.

La trattazione inerente le tecnologie multimodali, analogamente a quelle vocali richiederebbe molto più spazio… per ora ci limiteremo a dire che i linguaggi candidati sono principalmente tre, promettendoci di approfondirli in successivi interventi:

  • SALT (Speech Application Language Tags): linguaggio fondato da Cisco, Converse, Intel, Microsoft, Philips e SpeechWorks. (Per informazioni: http://www.saltforum.org)
  • X+V (XHTML + VoiceXML): promosso da IBM, Opera e Motorola
  • ECMA e V3: i due progetti portati avanti dal W3C.

Spero che da queste poche righe si sia riuscito a comprendere quale sia la reale portata della trasformazione che le odierne tecnologie vocali stanno introducendo, e quale potrebbe essere il loro impatto sul “tradizionale” uso del personal computer.

Presto potremo sederci davanti al nostro personal computer e chiedergli di cercarci una informazione o un sito di nostro interesse (a questo proposito vi consiglio di vedere cosa sta preparando Google all’indirizzo http://labs1.google.com/gvs.html), sfogliarlo semplicemente usando la nostra voce.. o premendo lo schermo del nostro computer.. ed altro ancora …

 

Potrebbero interessarti anche i seguenti articoli

  • Voce e Web – VXMLVoce e Web – VXML L'articolo è stato redatto in collaborazione con Cristina Tabachetti La ricerca nel campo delle tecnologie vocali, che ormai è prossima a compiere i suoi […]
  • Applicazioni vocaliApplicazioni vocali Le motivazioni che giustificano lo sviluppo delle applicazioni vocali nascono dalla considerazione che la tecnologia debba agevolare e semplificare le interazioni […]
  • Ouput vocaleOuput vocale La creazione di output vocale, nonostante venga citato in testa a questo articolo, non si può (e non si deve) considerare alla stregua di una applicazione […]
  • 15 – CSS sonori15 – CSS sonori   Punti di controllo in questa sezione: 11.3 Fornire agli utenti le informazioni necessarie affinchè siano adattabili secondo le loro preferenze (per esempio, la […]
  • Quanti termini nel web semanticoQuanti termini nel web semantico Prefazione Da poco abbiamo iniziato a parlare di questo nuovo web che è il web semantico e già in un primo articolo ne abbiamo illustrato a grandi linee […]
Condividi:

Informazioni sull'autore

Fabrizio Gramuglio
Fabrizio Gramuglio
Fabrizio Gramuglio nasce a Genova nel 1972. Esordisce come sviluppatore, analista, reportista etc.. di software gestionali.Approda al mondo vocale nel vicino 2001 e conquista la padronanza verbale su web alla veneranda età di 30 anni. I suoi applicativi misteriosamente parlano, ascoltano e rispondono al telefono... e con la stessa competenza di un operatore umano! Partecipa a seminari sulle tecnologie vocali, scrive articoli e tutorial sull'argomento... Gold Member del VoiceXML Italian User Group, rappresentante di IWA/HWG nei W3C Voice Working Group e W3C Multimodal Interaction Working Group e, progettista di soluzioni vocali di DotVocal(.com).

Commenti

Nessun commento

    Rispondi

    Link e informazioni