Выявление сигналов, позволяющих принимать правильную позицию, чтобы обеспечить сложное распознавание голоса

Во время 168-го собрания Акустического общества Америки (ASA), которое состоится 27-31 октября 2014 г. в отеле Indianapolis Marriott Downtown Hotel, Валери Фриман, доктор философии.D. кандидат факультета лингвистики Вашингтонского университета (UW) и его коллеги расскажут о своей спонсируемой Национальным научным фондом работе над проектом автоматической маркировки и распознавания стойки (ATAROS). Цель проекта — научить компьютеры распознавать различные позиции, мнения и отношения, которые можно выявить с помощью человеческой речи.
"Что такого особенного в том, как мы говорим, что проясняет нашу позицию при произнесении слов, но не обязательно, когда мы печатаем одно и то же??

Как людям удается отправлять разные сообщения, используя одни и те же слова? На эти вопросы и пытается ответить проект ATAROS », — пояснил Фриман.

По словам Фримена и главных исследователей проекта, в том числе профессоров Джина-Энн Левоу и Ричарда Райт с факультета лингвистики, выявление сигналов к «принятию позиции» в аудиозаписях разговоров людей — хорошее место для начала поиска ответов. Профессор Мари Остендорф с кафедры электротехники.

«В наших записях пар людей, работающих вместе над выполнением различных задач, мы обнаружили, что они склонны говорить быстрее, громче и с более преувеличенными тонами, когда выражают сильные мнения, а не слабые», — сказал Фриман.
Не так уж и удивительно? Возможно, не с точки зрения горячих споров, но исследователи обнаружили те же закономерности и в обычных разговорах. «Люди говорят быстрее и сразу говорят больше, когда работают над более интересными задачами, такими как уравновешивание воображаемого бюджета, а не размещение товаров в воображаемом магазине», — отметил Фриман.

Исследователи также заметили, что люди, похоже, менее свободно выполняют интересные задачи — отображают больше фальстартов, обрезанных слов, «хм» и повторений.
Кроме того, похоже, что «мужчины могут делать это чаще, чем женщины — независимо от того, разговаривают ли они с другим мужчиной или женщиной.«Фриман делает сильный акцент на слове« могущество », потому что на сегодняшний день они исследовали этот конкретный недостаток беглости только с 24 людьми.

На данный момент для всего проекта исследователи работали и зарегистрировали в общей сложности 68 человек разного возраста и происхождения, все из Тихоокеанского Северо-Запада.
«Мы планируем продолжить анализ этих разговоров на предмет более тонких сигналов и более сложных шаблонов — вариаций в произношении при сравнении положительных и отрицательных мнений, мужчин и. женщины и старше vs. молодые люди ", — сказал Фриман. "В будущем мы надеемся записывать людей из других мест, чтобы увидеть, есть ли в разных регионах разные способы выражения одних и тех же мнений."
Уроки, извлеченные из этой работы, должны помочь в создании сложных систем распознавания речи будущего. «Подумайте обо всех удивительных вещах, на которые способен компьютер в« Звездном пути », — сказал Фриман. "Чтобы достичь такого уровня сложности, нам нужны компьютеры, чтобы понимать все тонкие части сообщения, а не только задействованные слова. Такие проекты, как ATAROS, работают над тем, чтобы помочь компьютерам научиться понимать, что люди на самом деле имеют в виду, когда говорят, чтобы в будущем компьютеры могли реагировать гораздо более « человечески »."

Презентация № 2pSC18 «Фонетические корреляты занимаемой позиции» Валери Фриман, Ричард Райт, Джина-Энн Левоу, Йи Луан, Джулиан Чан, Транг Тран, Виктория Заяц, Мария Антониак и Мари Остендорф будут показаны во время стендовой сессии на 28 Октября 2014г., Вторник.