Loquendo Piattaforma VoxNauta
Transcript
Loquendo Piattaforma VoxNauta
Loquendo Piattaforma VoxNauta PIATTAformA VoiceXML & CCXML La piattaforma VoxNauta permette alle imprese, ai gestori di telecomunicazioni, alle aziende di servizi di poter sviluppare applicazioni vocali seguendo l’architettura Web e basate sugli standard W3C VoiceXML e CCXML. Il CCXML rende estremamente flessibile il controllo di chiamata, mentre il VoiceXML permette una gestione sofisticata dell’interazione vocale. La piattaforma VoxNauta può integrare le tecnologie vocali Loquendo, le più avanzate attualmente presenti sul mercato, fornisce il supporto completo di tutti gli standard più importanti e offre diverse funzionalità estremamente innovative per garantire le migliori prestazioni nelle applicazioni vocali. Una Piattaforma Completa, Flessibile e Scalabile La piattaforma software VoxNauta è stata ulteriormente potenziata per aumentarne l’efficienza, la scalabilità e le prestazioni nello sviluppo di applicazioni vocali. Le caratteristiche principali sono: • Un’architettura modulare rende la piattaforma VoxNauta indipendente dalle versioni degli engine del TTS/ASR e dalle lingue e voci installate, rendendo estremamente semplice l’aggiornamento a nuove release o l’aggiunta di nuove lingue e voci. • I canali dedicati alle tecnologie vocali sono indipendenti dal numero di sessioni attive in contemporanea sulla piattaforma. Questo permette un risparmio di costi di licenza quando le tecnologie ASR e TTS sono usate in modo parziale e non continuativo. • VoxNauta è disponibile su più sistemi operativi: sia Windows sia Linux sono supportati. • Attività di configurazione, amministrazione e gestione del sistema sono facilitate da una semplici e potente Console Grafica. www.loquendo.com Supporto Completo degli Standard La piattaforma VoxNauta e le tecnologie vocali Loquendo supportano in modo completo i più avanzati e rilevanti standard per il mercato vocale definiti da IETF e W3C: • VoxNauta è stata certificata dal VoiceXML Forum conforme alla Raccomandazione W3C VoiceXML 2.0 ed in aggiunta rende disponibili tutte le nuove funzionalità presenti nello standard VoiceXML 2.1. • Il controllo di chiamata è programmabile grazie al linguaggio CCXML 1.0, il nuovo potente standard W3C che complementa il VoiceXML per gli aspetti di gestione delle chiamate. Semplici azioni quali la ricezione e l’accettazione condizionata di una chiamata, modalità diverse di trasferimento di chiamata, gestione di conferenze e chiamate outbound proattive, sono facilmente programmabili in CCXML 1.0. Tecnologie vocali e standard: • • • VoiceXML 2.0 SRGS 1.0 SISR 1.0 CCXML 1.0 VoiceXML 2.1 SSML 1.0 MRCP v2 Loquendo ASR supporta pienamente lo standard SRGS 1.0 (Speech Recognition Grammar Specification), per definire grammatiche vocali e DTMF, sia nel formato XML sia ABNF. Inoltre l’interpretazione semantica dei risultati di ASR è realizzata attraverso lo standard SISR 1.0 (Semantic Interpretation for Speech Recognition). Loquendo TTS supporta completamente lo standard SSML 1.0 (Speech Synthesis Markup Language) offrendo un controllo standard del TTS e raggiungendo così la migliore qualità di interazione con l’utente. Inoltre tutte le caratteristiche distintive di Loquendo TTS sono accessibili anche attraverso SSML. Lessici utente ASR e TTS uniformi sono offerti agli sviluppatori VUI e la standardizzazione PLS 1.0 (Pronunciation Lexicon Specification) è un obiettivo primario per assicurare uno sviluppo di applicazioni vocali completamente basate su standard. Scenari Attuali e Futuri Loquendo VoxNauta può essere utilizzata in scenari diversi tra i quali il più comune, ma non l’unico, è l’ambito telefonico. Sono disponibili sia l’interfaccia VoIP (basata su un’implementazione solo software di SIP/RTP) che sta diventando l’opzione più vantaggiosa per l’utilizzatore/integratore, sia l’interfaccia TDM (sfruttando Gateways VoIP-TDM oppure schede telefoniche disponibili sul mercato). Inoltre VoxNauta può essere utilizzata per servizi sempre più innovativi e flessibili, che coniugano le funzionalità tradizionali di un IVR con funzionalità di riproduzione e registrazione di filmati audio e video in formato 3GPP, sfruttando le potenzialità della larga banda e dei terminali più evoluti disponibili sul mercato. Controllo di chiamata via CCXML Un nuovo linguaggio di markup è stato recentemente rilasciato dal W3C: CCXML (Call Control XML) il cui obiettivo è l’adozione di un’architettura web-based per la gestione del controllo di chiamata in applicazioni telefoniche. Il CCXML è un linguaggio capace di gestire efficacemente gli eventi telefonici e associare ad una chiamata un’applicazione VoiceXML. Le caratteristiche principali del CCXML sono la semplicità di utilizzo, la flessibilità e la capacità di gestire applicazioni complesse. CCXML in breve • Elaborazione di eventi asincroni • Accettazione o rifiuto condizionato di chiamate entranti • Molteplici modalità di trasferimento di chiamata • Realizzazione di chiamate outbound • Gestione di script (ECMA-327) • Gestione VoiceXML • Gestione di conferenza MANAGEMENT SNMP 3rd party IVR CALL CONTROL ADAPTER VoIP Fixed Mobile CCXML SERVER CCXML VoiceXML SERVER VXML MRCPv2 Server TTS ASR SV Il CCXML permette di mandare e ricevere comandi attraverso il protocollo HTTP, in modo da realizzare nuove logiche di controllo di chiamata interattive e remotizzabili. Inoltre il CCXML può gestire dialoghi VoiceXML per applicazioni self-service con raffinate modalità di trasferimento della chiamata ad un operatore. Infine la flessibilità del CCXML permette l’avvio di una chiamata da un server applicativo. VoxNauta implementa la versione 1.0 del linguaggio CCXML definita da W3C. Applicazioni VoiceXML Dal 2000 il VoiceXML ha ottenuto il consenso di un sempre più vasto numero di sviluppatori di applicazioni vocali. Il VoiceXML, divenuto fondamentale per tutte le piattaforme vocali, insieme al CCXML, rappresenta una caratteristica chiave della piattaforma Loquendo VoxNauta. Estensioni presenti nel VoiceXML 2.1 Il VoiceXML 2.0 è universalmente noto e la sua conformità è certificata dal VoiceXML Forum Platform Certification Program (www.voicexml.org). Recentemente sono state aggiunte alcune nuove funzionalità nel VoiceXML 2.1. audio, lexicons Application Server Network Servizi Flessibili di Controllo di Chiamata Un’applicazione CCXML può essere semplice come riprodurre un annuncio o re-instradare una chiamata se certe condizioni vengono soddisfatte, estendibile fino a gestire in modo flessibile un sistema di conferenza pilotato da un’applicazione web. SRGS, Architecture Le principali caratteristiche nella versione 2.1 del VoiceXML sono: • Registrazione audio durante il riconoscimento vocale • • • - questa funzionalità è estremamente importante per la registrazione delle chiamate, il data mining e il tuning delle applicazioni vocali. Il nuovo elemento <data> permette di caricare dati XML durante l’interpretazione di una pagina VoiceXML. Questo consente l’adattamento della strategia di dialogo a dati esterni, senza la necessità di cambiare spesso la pagina VoiceXML. Ad es. diventa possibile caricare ed utilizzare dinamicamente una lista di prompt specifici di un’interazione vocale come la lista di titoli cinematografici legati ad una determinata sala. L’elemento <foreach> permette di scandire una lista dinamica di prompt. Il nuovo tipo di trasferimento di chiamata, chiamato “consultation”, è stato aggiunto ai tipi “blind” e “bridge”. Permette il tentativo di trasferimento di chiamata e, in caso di errore o mancata risposta, ritorna il controllo all’applicazione vocale per riprendere il dialogo come utente. La piattaforma VoxNauta implementa tutte le funzionalità del VoiceXML 2.1. Applicazioni Web based Con l’impiego di VoiceXML e di CCXML, la logica applicativa e i contenuti possono risiedere su Web Server ed essere dinamicamente scaricati, come anche le grammatiche SRGS, i file pre-registrati e musicali, i lessici utente. Questo permette di semplificare notevolmente lo sviluppo delle applicazioni vocali permettendo una completa e netta separazione del livello logico-applicativo, dalla gestione dell’interazione vocale e dal controllo di chiamata. Lo Scenari Applicativi Innovativi Public/Private Network Application Server Conventional IVR or WiFi equipment TCP-IP based protocol VoiceXML TTS ASR SV Applicazioni Multimediali in ambito IMS L’attività del 3GPP (scenario UMTS), per assicurare la convergenza tra telefonia mobile e tecnologie internet, è giunta alla standardizzazione dell’architettura IP Multimedia Subsystem (IMS), secondo la quale le applicazioni multimedia sono ospitate su un server applicativo ed eseguite da una componente MRF (Media Resorce Function). Tramite VoxNauta gli elementi essenziali di un MRF sono l’interprete VoiceXML, il server vocale per TTS, ASR e DTMF e un server video per lo streaming, la presentazione video/immagini e co-decoding. Il VoiceXML è agnostico rispetto ai media in uso e quindi adatto anche allo sviluppo di applicazioni voce e video. Inoltre, alcuni specifici elementi addizionali VoiceXML sono stati introdotti per la presentazione video/immagini e le opzioni push-to-talk. Queste considerazioni rendono VoxNauta una piattaforma allo stato dell’arte per questa nuova e sfidante opportunità di mercato. DSR CODEC EMBEDDED TTS Application Server CCXML VoiceXML Public Mobile Network DSR DSV Vo q xN ue au nd Integrazione in IVR di terze parti ta o Loquendo VoxNauta, in aggiunta alle normali interfacce di rete e telefoniche, offre un’ulteriore interfaccia a livello applicativo basata su protocollo TCP/IP. Essa permette l’upgrade di qualunque piattaforma IVR, o di qualunque altro apparato di rete (es. WiFi) verso le funzionalità offerte dal VoiceXML 2.0 e 2.1. Allo stesso tempo permette un’integrazione ottimale con le tecnologie vocali Loquendo (ASR e TTS). In questo modo, qualunque IVR di terze parti può continuare a funzionare in modo tradizionale, ma essendo anche aperto e compatibile con una piattaforma che supporta lo standard VoiceXML. L’integrazione è semplificata, essendo basata su un protocollo a messaggi, e fa risparmiare tempo alle aziende che vogliono aprirsi al mondo VoiceXML senza costi di sviluppo e integrazione tecnologica. L’integrazione con le funzionalità di Gestione è assicurata dal protocollo SNMP disponibile su VoxNauta. Application Server SIP SIP SIP terminal or Voice/Video Gateway RTP HTTP MRF CCXML VoiceXML Video Server Speech Server Applicazioni Multimodali su Rete Dati Mobile La piattaforma Loquendo VoxNauta può essere usata come un server di rete nello sviluppo di applicazioni multimodali su reti dati mobili quali GPRS, EDGE sfruttando le capacità di codifica del DSR (Distributed Speech Recognition) e la presenza sul terminale di Loquendo Embedded TTS. In questo contesto le applicazioni multimodali possono essere attivate da un client installato su cellulare e essere esercite tramite VoiceXML/CCXML come qualunque applicazione vocale. La banda uplink necessaria per il canale vocale viene sensibilmente ridotta dall’uso della codifica DSR, che assicura una minore sensibilità agli errori di trasmissione. La banda downlink è resa minima con l’uso di Loquendo Embedded TTS, che può essere installato direttamente sul terminale insieme al client installato. Il colloquio con la piattaforma Loquendo VoxNauta avviene utilizzando i protocolli standard SIP/RTP. In questa maniera sviluppare servizi multimodali diventa facile quanto scrivere applicazioni vocali VoiceXML. o d n ue ta u q a o N L ox V Una vasta gamma di Soluzioni per tutti i tipi di Servizi e Applicazioni Loquendo VoxNauta è progettata per lo sviluppo di qualsiasi tipo di applicazione vocale e DTMF, inclusi: • Servizi informativi - per accedere alle informazioni su servizi e prodotti, assistenza post vendita e informazioni pubbliche come orari e ubicazioni uffici; • Servizi personali di comunicazione - per accedere in voce alla propria rubrica, agenda, calendario, e-mail; • Servizi transanzionali come il trading on line, l’home banking, il travel booking, servizi voicecommerce o assicurativi, ecc. Piattaforma Loquendo VoxNauta - Specifiche Tecniche IVR: include CCXML, VoiceXML, DTMF ed audio pre-registrato solo ASR: include CCXML, VoiceXML, DTMF, ASR ed audio pre-registrato solo TTS: include CCXML, VoiceXML, DTMF, audio pre-registrato e TTS Full dialog advanced IVR: include CCXML, VoiceXML, DTMF, ASR, SV, audio pre-registrato e TTS Sistemi Operativi Supportati Microsoft Windows 2000 e 2003 Server, Red Hat Enterprise Linux 4.0, Linux Debian 4.0 Network Signalling (TDM) Analog (Loop Start), Euro-ISDN Schede Telefoniche Supportate NMS AG 2000/200-8LSE (Analog), NMS AG4000/400-1E (Euro-ISDN), NMS AG4040/4-1TE (Euro-ISDN), Intel Dialogic DMV600BTEP (Digital), NMS CG6565 (Euro-ISDN) Cancellazione Eco Supportato dalle schede telefoniche Network Signalling (VoIP: SIP-RTP) RFC 3261 (Session Initiation Protocol), RFC 3515 (Refer Method), RFC 2327 e 3264 (SDP) RFC 3891 (Replaces Header), RFC 1889 (RTP), RFC 3665 (Basic Call Flow), RFC 3666 (PSTN Call Flow) Standard Vocali CCXML 1.0, VoiceXML 2.0, VoiceXML 2.1, RFC 2833 (DTMF), SRGS 1.0 (XML e ABNF), SISR 1.0, SSML 1.0, DSR Aurora, HTTP/HTTPS 1.1 Accesso Contenuti Documenti CCXML e VoiceXML, grammatiche SRGS, lessici utente e file audio sono accessibili da file system e tramite HTTP (con supporto caching) e/o HTTPS Codifiche Voce G.711 (A-law e μ-law) Formati File Audio 8 e 16 bit, A-law, μ-law e lineare, mono, 8 kHz Tecnologie Vocali (opzionali) Loquendo ASR, Loquendo SV, Loquendo TTS (via MRCPv2) Lingue Supportate Inglese Americano, Francese Canadese, Portoghese Brasiliano, Spagnolo Americano, Spagnolo Argentino, Spagnolo Cileno, Spagnolo Messicano, Inglese Britannico, Spagnolo Castigliano, Catalano, Valenziano, Galiziano, Olandese, Francese, Tedesco, Greco, Italiano, Polacco, Portoghese, Svedese, Turco, Arabo**, Russo**, Finlandese**, Danese** e Cinese Mandarino O&M SNMP e Console Grafica (Graphic Centralized Management Console) Profili di Sistema VoIP (SIP/RTP), rete TDM (con scheda NMS), rete TDM (con scheda Dialogic), DAP* (interfaccia TCP-IP) * il profilo DAP non include l’interprete CCXML. **disponibili nel corso del 2008 Per maggiori informazioni, consulta le brochure Loquendo TTS e Loquendo ASR. Per conoscere le opportunità di business che si possono creare con le tecnologie Loquendo, visita il sito www.loquendo.com e prova la demo interattiva del TTS. © 2008 - Tutti i diritti sono riservati. Loquendo, VoxNauta™ ed i loghi di Loquendo e VoxNauta sono marchi registrati di Loquendo. Tutti gli altri marchi sono dei rispettivi proprietari. Le informazioni contenute in questa brochure sono soggette a modifica senza preavviso. Loquendo - Vocal Technology and Services Via Arrigo Olivetti, 6 - 10148 Torino - Italia tel. +39 011 2913111 - fax +39 011 2913199 www.loquendo.com [email protected] LOQ - AUG 2008 - IT Configurazioni di Sistema
Documenti analoghi
Loquendo TTS
Loquendo offre ai clienti la migliore tecnologia di sintesi TTS disponibile, ideale per i servizi vocali interattivi, in grado di leggere e-mail
Loquendo è stata l’unica azienda ad offrire voci
e n...
Loquendo MRCP Server
Loquendo MRCP Server, grazie al completo supporto di tutti i più importanti standard IETF e W3C, permette di utilizzare
le tecnologie vocali in tutte le applicazioni VoiceXML 2.0 e 2.1:
• ASR – su...
Human-Computer vocal interaction: analisi dello
Come risulta dai dati raccolti attraverso un sondaggio d’opinione [15] la maggior parte delle
persone, interrogate circa i propri desideri in termini di HRI, preferisce nettamente l’uso del
parlato...