От Лом Ответить на сообщение
К Михайлов А.
Дата 17.07.2007 03:56:20 Найти в дереве
Рубрики Культура & искусство; Версия для печати

Я немного интересовался данным вопросом...

>>Слушателей удивил лексикон компьютера в 23 фрагменте «Узел»: «зажимать», «допрет».

Интересовался я немного представлением информации на выходе ИИ систем и не только. С завкафедры пару раз сидели в кафешке часа по два и мечтали... :-) Генерация речи (не путать с генерацией звука, там может быть телетайп, например) происходит по следующим критериям:

1. Информация. Что собственно надо выразить в понятной человеку форме. Тут много методов, но мы сейчас не о них.

2. Контекст и ограничения
3. Фоносемантика и эмоции

Вот о последних двух пунктах.. В зависимости от уровня сложности и назначения система должна иметь возможность на просто выразить информацию в понятной человечеству форме вообще, а уметь представить способ оптимальной подачи информации в зависимости от контекста и ограничений. Это очень важно. Например задача - представить аннотацию первого тома "Капитала". Контекст "Серьезная беседа" или "Обучение". Ограничения: 18 лет, образование среднее, спецзнаний нет, 5 минут или 50 развернутых предложений. А теперь представьте, в 5 предложений, 1 предложение, 1 слово (Грабят!). Или.. Форма шутливая, уровень - 6 класс.
Фоносемантика и эмоциональная окраска могут употребляться по разным причинам - не вызвать зевоту в режиме "Обучение", передать дополнительную информацию когда есть жесточайшие ограничения по времени (опера всего полтора часа, а вы хотите услышать полный доклад Антонова Верховному ГК в Ставке, про узел и зажимать? ;-) ). В случае с Ганимедом, в одной фразе передается информация (контекст начатого разговора - неформальное обсуждение, ограничение по времени) что во-первых, АСГУ либо полностью превосходит его либо у нее была информация которая позволила задействовать более эффективные алгоритмы, указывает, что информирована о его возможностях, а так же указывает, что решение будет найдено Ганимедом все равно, а мелкие детали не важны.

Как это происходит программно? Готовится множество вариантов ответов, каждый из которых проходя через фильтры 2 и 3 либо отбрасывается, либо получает баллы. Оптимальный ответ (вариант), наиболее понятный, лаконичный, набравший максимум идет на вывод. То, что АСГУ в состоянии подобрать такие фразы, говорит только о ее гениальности. Причем человек может переспросить и тогда он получит следующие фразы кандидаты из пула набравшие меньше баллов. Если бы хоть одна система сегодня могла-бы генерировать речь как АСГУ, это был бы переворот в мире информации. Кстати, она демонстрирует еще более нехарактерное для компьютера поведение в области генерации речи - фраза "Я буду охранять тебя" вместо "Оповещаю службу безопасности..." Тут явно фильтры 3-го пункта сработали, причем получив входные данные об эмоциональном состоянии человека.

Так что тут как раз не вижу никаких проблем. Она делает то, что пишется сейчас в любом учебнике по менеджменту о речи при управлении...


>
>Да, местами АСГУ лексиконом и манерами речи с проглатываем гласной первого слога напоминает глупую девочку-ПТУшницу.

:-)) Хорошо, что вы не слышали как я иногда говорю... ПТУшницы начинают считать себя эстетической аристократией.