Голосовое управление в Ubuntu

Linux-разработчик McClain провёл демонстрацию утилиты распознавания речи под Ubuntu.

Какие возможности предоставляет:

  • запуск и закрытие приложений;
  • открытие веб-сайтов;
  • базовые операции при работе в файловом менеджере;
  • запись под диктовку;
  • отправку сообщений на почту;
  • ответы на вопросы.

Из видео ниже можно увидеть механизм работы на примере действующего прототипа.

 

Как работает

Утилита работает очень просто, весь алгоритм сводится к следующему:

  • пользователь нажимает заданные горячие клавиши;
  • пользователь говорит;
  • идёт распознавание (с помощью Google);
  • результат сравнивается со словарём;
  • выполняется команда, найденная в словаре.

Кроме всего прочего, программа имеет дружелюбный и отзывчивый интерфейс, реагирующий не на строго заученные фразы, а именно на те, которые более свойственны пользователю. Например, такие фразы, как: «Выполнить Firefox», «Запустить Firefox», «Открыть Firefox» – будут выполнять одну и ту же команду.

Более того, разработчикам также будет представлена возможность расширения словаря своим собственным набором команд.

Характеристика пока находится в разработке, но уже скоро будет открыта для тестирования в качестве закрытой беты. Поддержка русского языка, скорее всего, будет отсутствовать, но так как используется сервис Google, то вопрос стоит всего лишь в локализации словаря.

Смотрите также: