Старая версия xmlhack.ru


[W3C]  Во весь голос
  05.02.03 Александр Савенков

Консорциум Всемирной сети присваивает VoiceXML 2.0 статус Рекомендации-кандидата W3C

Краеугольный камень Модели речевого интерфейса W3C готов к реализации

Контактное лицо в Америках, Австралии
Джэнет Дейли (Janet Daly), <janet@w3.org>, +1.617.253.5884 или +1.617.253.2613
Контактное лицо в Европе
Мари-Клер Форг (Marie-Claire Forgue), <mcf@w3.org>, +33.492.38.75.94
Контактное лицо в Азии
Сэко Такеучи (Saeko Takeuchi) <saeko@w3.org>, +81.466.49.1170

Исходные тексты пресс-релиза на английском, французском и японском языках находятся на сайте W3C. Там же находятся и отзывы (на английском, французском и японском языках).

28 января 2003 года Консорциум Всемирной сети (W3C) опубликовал VoiceXML 2.0 в качестве Рекомендации-кандидата W3C. Продвижение технического отчёта W3C до статуса Рекомендации-кандидата — открытый общественный призыв к реализации. Целью VoiceXML 2.0 является привнесение в интерактивные системы речевого ответа преимуществ сетевой разработки и доставки данных.

Модель речевого интерфейса W3C предоставит Сети возможность говорить

Начиная с 1999 года, для расширения доступа к Сети W3C работал над Моделью речевого интерфейса (Speech Interface Framework), которая позволит людям взаимодействовать, используя телефонную клавиатуру, устные команды, прослушивание предварительно записанной речи, синтезированную речь и музыку. В настоящее время число телефонных линий и мобильных телефонов по всему миру превышает миллиард, поэтому спецификации Модели речевого интерфейса W3C позволят беспрецедентному числу людей использовать телефон для доступа к соответствующим сетевым службам.

VoiceXML 2.0 приносит голос в Модель речевого интерфейса

VoiceXML 2.0 позволяет разработчикам создавать аудиодиалоги, характеризуемые синтезированной речью, оцифрованными аудиоданными, распознаванием устного и DTMF-ввода (кнопочного тонального набора), записью устного ввода, телефонией и диалогами с перемежающейся инициативой.

«У VoiceXML 2.0 достаточно возможностей, чтобы изменить методы, с помощью которых разрабатываются телефонная информация и службы для клиентов. Не нужно будет больше нажимать „единицу“, чтобы сделать одно, или „двойку“, чтобы другое. Вместо этого у нас появится возможность делать выбор и вводить информацию с помощью речи, — пояснил Дейв Рэггитт (Dave Raggett), глава Программы W3C по голосовому обозревателю. — Более того, VoiceXML 2.0 создаёт преимущества для людей с нарушениями зрения или тех, кому требуется доступ в Сеть без использования рук и глаз, которые могут быть заняты чем-либо другим, например получение адреса при вождении».

В рамках Модели речевого интерфейса W3C VoiceXML контролирует то, как приложение взаимодействует с пользователем, тогда как Язык разметки синтеза речи (Speech Synthesis Markup Language — SSML) используется для речевых подсказок, а Спецификация Грамматики распознавания речи (Speech Recognition Grammar Specification — SRGS) — для указания устройствам распознавания речи грамматики, описывающей ожидаемые ответы пользователя. В Модели существуют и другие спецификации, например Контроль звонков голосового обозревателя (Voice Browser Call Control — CCXML), предоставляющая поддержку контроля телефонных звонков для VoiceXML и других диалоговых систем, и Семантическая интерпретация распознавания речи (Semantic Interpretation for Speech Recognition), определяющая синтаксис и семантику содержимого меток в SRGS.

Процент внедрения VoiceXML 2.0 увеличивается с появлением тестовых наборов

Существует большое число тестовых наборов, публично распространяемых вместе с Рекомендацией-кандидатом VoiceXML 2.0. Тогда как первоначальная версия содержит более трёхсот тестов, ожидается, что окончательный вариант будет насчитывать свыше пятисот. Объявления об обновлениях тестового набора будут сделаны посредством публичного списка рассылки голосового обозревателя.

Упомянутый набор дополняет тестовый набор, поставляемый со Спецификацией Грамматики распознавания речи, ставшей Рекомендацией-кандидатом W3C в июне 2002 года. Тестовые наборы для оставшихся спецификаций Модели речевого интерфейса W3C, включая Язык разметки синтеза речи, входящего сегодня в стадию Last Call, в настоящей момент разрабатываются Рабочей группой W3C по голосовому обозревателю и будут опубликованы в течение ближайших месяцев.

С развитием VoiceXML 2.0 и Модели речевого интерфейса будут разрешены проблемы с патентами

Рабочая группа W3C по голосовому обозревателю одна из самых многочисленных и активных в W3C. Её участниками стали BeVocal Inc., Canon, Comverse, France Telecom, Genesys Telecommunications Laboratories, HP, HeyAnita, Hitachi, IBM, Intel, Loquendo, Microsoft, MITRE, Mitsubishi, Motorola, Nokia, Nortel Networks, Nuance, Philips, PipeBeach, SAP, ScanSoft, SnowShore Networks, SpeechWorks, Sun, Syntellect, Tellme Networks, Unisys, Verascape, VoiceGenie, Voxeo и Voxpilot. Об устойчивой поддержке продолжающихся разработок и приверженности реализации их результатов свидетельствует целый ряд отзывов.

По мере продолжения технических разработок Рабочей группы по всему спектру голосовых спецификаций проблемы с патентами, явившиеся результатом несогласованности с безвозмездным способом лицензирования Рабочей группы по голосовому обозревателю должны быть решены Консультативной группой по патентам (Patent Advisory Group) согласно Текущей патентной политике W3C (W3C's Current Patent Practice) в рамках W3C. Подавляющее большинство Рабочей группы W3C по голосовому обозревателю ратует за создание открытой спецификации, поэтому Консультативная группа по патентам голосового обозревателя будет работать в направлении устранения оставшихся неувязок.

О Консорциуме Всемирной сети (W3C)

W3C был создан для того чтобы раскрыть весь потенциал Сети, разработать общие протоколы, содействующие её развитию и обеспечивающие её способность к взаимодействию. W3C — международный промышленный консорциум, совместно управляемый Лабораторией вычислительных систем Массачусетского технологического института (MIT LCS) в США, Европейским научно-исследовательским консорциумом в области информатики и математики (ERCIM), базирующимся во Франции, и университетом Keio в Японии. Услуги, оказываемые Консорциумом, включают разработку и тестирование сетевых стандартов, хранилище информации о Всемирной сети для разработчиков и пользователей и различные прототипные и пробные приложения для демонстрации применения новых технологий. На данный момент Членами Консорциума являются около 450 организаций. За более подробной информацией обращайтесь по адресу http://www.w3.org/.