• Голосовой поисковик алиса. Алиса от Яндекс — помощник на андроид,скачать приложение

    Вот и наступила весна… В апреле 2014-го первая альфа версия Дуси появилась на форуме 4PDA.

    И вот, спустя два года, Дуся приходит на наши компьютеры . В виде нового проекта под названием Агрегат !

    Эта статья о том, что такое Агрегат, что он умеет делать и как его получить.

    Что такое Агрегат

    Итак, что же это такое — Агрегат? Как вам уже стало очевидно по нашему небольшому видео и нашему новому сайту , это голосовой ассистент для компьютера. Это если совсем коротко. Ну а подробности — далее.

    Знакомьтесь — Агрегат

    Дуся для ПК готовилась уже давно. Очень давно — с самых первых версий. И вот чем наш Агрегат отличается от Кортаны:

    1. Понимает русский (да и любой другой язык при желании)
    2. Работает на любой операционной системе (Windows, Linux, Mac OS X)
    3. Запускается даже на Raspberry Pi
    4. Легко расширяется за счет сторонних модулей
    5. Гибко настраивается под ваши требования
    6. Имеет открытый API для разработчиков и открытый исходный код
    7. Интегрируется с ассистентом на Android смартфоне

    И да — Агрегат абсолютно бесплатен!

    Что же он умеет делать?

    Агрегат — словно конструктор Lego — собирается из множества модулей. Какие модули вы установите — то и будет уметь делать ваш Агрегат. Похоже на Скрипты в Дусе, не правда ли? Только модули Агрегата — это полноценные микропрограммы , которые могут выполнять любые действия на компьютере, или даже управлять удаленной техникой (включая ваш смартфон).

    Пока Агрегат только в альфа-версии, и на данный момент модулей еще не так много. Но совсем скоро их станет больше! А самый главный модуль уже создан. Это…

    Интеграция с Дусей

    Альфа-версия Дуси 1.6.0 имеет функцию удаленного управления. Именно благодаря ей вы можете отправлять команды на ваш смартфон прямо с вашего компьютера. А ответы придут обратно на компьютер в виде речи и действий в браузере!

    Вы можете писать СМС, звонить, создавать напоминания, узнавать планы, ставить таймеры, слушать новости, выполнять вообще любые команды и скрипты, не беря в руки телефон! При этом диалог тоже поддерживается.

    А что же еще?

    Модуль «Диктовка» позволит просто продиктовать любой текст, который тут же будет вставлен в поле ввода открытой в данный момент программы.

    Например, можно писать поисковые запросы в окне браузера, диктовать текст в текстовом редакторе, писать сообщения в мессенджерах и многое другое.

    Посмотрите на видео, как я просто сказал «Дуся агрегат», когда курсор стоял в поле ввода текстового запроса на сайте youtube.com.

    Как им пользоваться?

    Легко! Так же, как и у Дуси, у Агрегата есть способы активации, распознавание и синтез речи.

    Самый простой способ активировать Агрегат и дать команду — это просто зажать пару горячих клавиш на клавиатуре, произнести команду и отпустить клавиши. При этом можно делать паузы — Агрегат будет слушать вас, пока вы не отпустите кнопки!

    Распознавание, синтез и активации — это тоже модули Агрегата, которые могут быть разными

    Как он выглядит?

    Вспомним те славные времена, когда и у Дуси не было никакого интерфейса кроме настроек.

    Для компьютерной версии голосового ассистента это намного важнее. Потому что вы можете пользоваться его функциями, не открывая другое приложение, не отвлекаясь от текущей работы. Ничего не занимает экран. Агрегат просто слушает вас и выполняет команды. Быстро и четко!

    Хочу! Как его установить?

    Сейчас Агрегат находится на стадии раннего альфа-тестирования . Поэтому он доступен только для энтузиастов и программистов, которые всегда стремятся оказаться на переднем крае технологий.

    Альфа-тестирование открытое . То есть любой может вступить в специальное сообщество Google+ и отправить заявку на получение копии своего Агрегата.

    В сообществе можно задавать любые вопросы и обсуждать их. Документация по проекту и Руководство Пользвоателя уже готовы в первом варианте и доступна в репозитории GitHub . Там же рассказывается в подробностях, где скачать модули, как их настроить и как ими пользоваться.

    Там же доступны модули, их описание и исходные коды (для тех, кто желает присоединиться к проекту и стать соавтором первого в мире голосового ассистента с открытым кодом).

    Создай свой Агрегат!

    Я надеюсь, что вам понравится наш новый проект, в котором каждый может поучаствовать как соавтор. И вы увидите, что только настоящая свобода дает неограниченные возможности вашему воображению по созданию своего собственного голосового ассистента под ПК!

    Для людей с ограниченными возможностями, а также просто для сибаритов, разработчики ОС создали голосовое управление компьютером. Оно позволяет пользователю вводить информацию при помощи голоса. После проговаривания определенных слов устройство начинает распознавание речи - преобразование звукового сигнала в цифровую информацию. После того, как введенная информация будет корректно распознана – программа переходит к заданному алгоритму действия – выполняет функцию, которая прикреплена к той или иной команде.

    Все достаточно просто. Не всегда речь распознается корректно, поэтому для решения сложных задач по управлению операционной системой программа голосового управления компьютером интенсивно не используется. Она применяется для выполнения основных функций: открытия и закрытия файлов, локального и сетевого поиска и пр.

    История развития голосового управления

    • Первая система распознавания голоса Audrey была создана в 50-х годах ХХ века. Она расшифровывала лишь цифры, проговоренные одним голосом.
    • В 1962 г была создана первая система распознавания слов. Она расшифровывала 15 англоязычных слов.
    • С развитием компьютеров в 1990 г была разработана программа Dragon Dictate. Она распознавала до 100 слов в минуту, но отличалась высокой ценой.
    • В начале 2000-х годов в iPhone появилось приложение для распознавания речи Google Voice Search. В 2010 году была добавлена система поиска в Android.
    • Siri была включена в программное обеспечение Phone 4S в начале октября 2011 г;
    • в 2014 г была представлена Cortana - голосовая помощница для Windows.

    Возможности Cortana и голосового ввода на сегодняшний день

    «Кортана» - это виртуальный помощник в операционной системе Windows. Сервис помогает пользователю в планировании дел, напоминает о них.
    При определенном запросе сервис поможет собрать конкретную информацию, создать четкую структуру и преподнести ее пользователю в максимально возможно обработанном виде.
    Интересно, что сразу при включении виртуальный помощник собирает всю информацию о введенных запросах, личных данных, пытаясь максимально адаптироваться под каждого отдельного пользователя.


    Голосовое управление компьютером Windows 7 посредством использования виртуального помощника невозможно – он интегрирован только в десятую версию. Но, как ни жаль, разработчики не удосужились выпустить русскоязычную версию.
    Главную роль отыгрывает поиск, который в 10-ке можно открыть через «Пуск». Эта функция определяет практически любые запросы. Если вхождение не распознано – можно ввести соответствующую команду во всплывающее окно и программа голосового управления компьютером считает текстовую информацию.

    Неприятный момент – сбор всех данных, введенных через клавиатуру, и их отправка в «Майкрософт».

    Сторонние программы

    Typle

    После выполнения установки переходим к следующему шагу – создаем учетную запись. Здесь необходимо придумать ключевую фразу, после чего прозвучит уведомление об активации.


    Дальше нужно будет придумать и создать голосовые команды, независимо от их предназначения. Команда «собака» может запускать приложение или выполнять совсем другое действие.




    Просто нужно создать голосовую команду и закрепить ее за определенным действием. Подойдет только для выполнения базовых операций – открытия файлов, папок и пр. Функционал ограничен.

    Speaker

    Здесь функционал более широкий, нежели в Typle.


    Голосовое управление компьютером Windows 10 предоставляет пользователю возможность открывать и закрывать файлы, делать снимки состояния экрана, выключать ПК.


    Распознавание речи происходит довольно долго, свыше 3-4 секунд. Это обусловлено тем, что сначала речь преобразуется в текст, а команды распознаются компьютером уже с текстовой информации.

    Laitis

    Это бесплатная программа, которая позволяет как управлять ПК, так и диктовать текст. После установки необходимо зарегистрироваться и дальше можно пользоваться в свое удовольствие.


    Интересна функция автозамены при наборе текста. Вы можете сказать «Кавычки» и в тексте появится соответствующий символ.

    Возможности управления голосом через Яндекс.строку

    Посредством использования этого приложения можно выполнять локальный или сетевой поиск информации и файлов, перезагрузить или выключить компьютер. Присутствует функция открытия программ и сайтов.
    Чтобы воспользоваться программой, необходимо сначала скачать и установить ее.

    Но при установке стоит убрать галочки напротив пунктов, где производитель софта предлагает установить браузер, поменять его настройки. В противном случае установка займет больше время и в браузере изменится конфигурация.
    В конечном итоге строка размещается около кнопки «Пуск». Скажите «Слушай Яндекс» и откроется окно.

    Проговорите запрос.

    После паузы в браузере откроется строка поиска. Занимательно управлять поиском таким образом.
    В целом, голосовое управление компьютером пока не развито, так как рисуется нам в воображении. Но и те функции, что имеются на сегодняшний день, уже впечатляют и существенно помогают перейти на новый уровень пользования ПК.

    Отличного Вам дня!

    Еще до релиза находящегося на стадии разработки, тестирования и отладки интерфейса Cortana для Windows 10 пользователи пытались организовать голосовое управление компьютера. О том, как такую функцию можно реализовать в Windows, вышедших до 10-ки и поговорим в сегодняшней статье.

    Cortana

    Кортана – голосовой помощник с ИИ, разработанный корпорацией Microsoft для Windows 10, Phone и Android с дальнейшим распространением проекта на XBox и iOS. Она заменяет классическую поисковую строку и выполняет множество действий, в первую очередь, связанных с поиском информации и системных команд, получая их от пользователя в виде голосовых команд. Глубокая интеграция в Windows 10, отсутствие русского языка (пока что), сбор фактически всей информации о пользователе с отправкой на серверы Microsoft и отсутствие финальной версии не дают возможности большинству пользователей получить полноценное голосовое управление собственным компьютером.

    Помимо Кортаны существует немало приложений, позволяющих осуществлять управление ПК посредством голосовых команд пользователя. Ознакомимся с самыми распространенными продуктами для решения этой задачи в Windows 7 и 10.

    Typle

    Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.

    Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).

    Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).

    Speaker

    • создание снимков состояния экрана;
    • переключение раскладки клавиатуры;
    • завершение работы Windows 7;
    • запуск приложения;
    • открытие файла.

    Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.

    Горыныч

    Разработчики программного комплекса для управления компьютером с Windows 7 и 10 являются первой отечественной командой, выпустившей приложение для решения подобного рода задач. За ядро приложения взята западная «Dragon Dictate», куда внедрили отечественный программный модуль для распознания русской речи.

    Алиса - один из самых технологичных голосовых помощников для устройств на базе Android, который интегрирован в официальное приложение Яндекс. Установив его, вы не только сможете управлять своим смартфоном/планшетом при помощи голосовых команд, но еще и получите очень смышленого собеседника. Алиса - это первый личный ассистент, который может вникать в контекст диалога с пользователем. Более того, она постоянно обучается, используя для этих целей нейросети.

    Функции

    На момент написания данного обзора, Алиса "умеет" выполнять не слишком много операций. Дело в том, что в отличие от той же Siri или она не слишком тесно интегрируется в операционную систему Android. Вследствие этого помощник умеет лишь рассказывать о погоде, отображать информацию о пробках, выполнять поисковые запросы в Яндекс, собирать для пользователя подборку новостей, прокладывать маршруты на картах и воспроизводить композиции в сервисе Яндекс Музыка. Запускать сторонние приложения и делать отметки в календаре программа не научена. Впрочем, вполне возможно, что эти функции будут добавлены в будущем.

    Общение

    А вот что касается обычных бесед с Алисой, то в этом плане она является самым "живым" виртуальным собеседником из тех, что доступны для операционной системы Android. Ассистент умеет шутить, учитывать предыдущие фразы диалога при составлении новых и даже немного "троллить" пользователя. После запуска данного сервиса в сети появилась масса скриншотов переписки, в которых Алиса очень колко "подстебывала" собеседника.

    Кроме того, голос данного помощника звучит гораздо естественнее, нежели у аналогов. Приложение правильно расставляет ударения и не делает длинных пауз между словами. В общем, иногда складывается впечатлением что вы общаетесь с настоящим человеком.

    Ключевые особенности

    • может вести с пользователем диалоги, вникая в контекст и посыл его фраз;
    • звучит гораздо естественнее других голосовых помощников;
    • интегрирована в официальное приложение Яндекс;
    • выполняет базовый набор функций, вроде отображения информации о погоде;
    • очень точно распознает и интерпретирует человеческую речь.

    Виртуальные голосовые помощники призваны упростить наше взаимодействие с устройствами и сервисами. Вместо того чтобы блуждать по графическому интерфейсу в поисках нужного пункта меню, вы можете просто скомандовать естественным языком «Включи музыку» или «Подскажи прогноз погоды». Идеальный помощник должен правильно понять команду и выполнить её.

    Технологии, которые лежат в основе таких ассистентов, пока далеки от совершенства, но уже способны впечатлять. Вы могли наблюдать их в действии, если пользовались помощниками Google Assistant, Cortana или Siri. Теперь давайте посмотрим, чем нас может порадовать « », которая недавно поселилась в приложении «Яндекс».

    Синтез и распознавание речи

    Хотя в голосе помощника можно без труда расслышать искусственные нотки, он звучит на порядок естественнее своего ближайшего конкурента - русскоязычной версии Siri. Для озвучивания «Алисы» привлекли актрису Татьяну Шитову. К слову, именно её голосом говорила операционная система в фильме «Она».

    В плане распознавания русской речи у помощника «Яндекса» пока тоже нет равных, ошибки встречаются относительно редко. Кроме того, ассистент не просто распознаёт фразы, но и учится правильно интерпретировать их. Поэтому вы можете использовать разные формулировки и задавать последующие вопросы в контексте предыдущих - скорее всего, сервис вас поймёт:

    Но промахи в интерпретации запросов пока встречаются у всех голосовых ассистентов, и «Алиса» здесь не исключение:


    Интеграция со службами «Яндекса»

    Другая важная особенность «Алисы», на которой делают акцент создатели, это удобная интеграция с остальными сервисами «Яндекса».

    К примеру, попросите ассистента включить песню, и она заиграет в «Яндекс.Музыке». Запросите перевод фразы на другой язык - помощник откроет «Яндекс.Переводчик»:


    «Алиса» также умеет отображать прогноз погоды и строить маршруты благодаря метеосервису и картам «Яндекса». А если вам понадобится найти что-либо в Сети, поможет «Яндекс.Поиск».


    Взаимодействие со сторонними программами

    Что касается интеграции со сторонними приложениями и службами на мобильных устройствах, то тут у «Алисы» не всё так хорошо.

    Ассистент можно установить на Android и iOS, но пока «Алиса» слабо использует возможности этих платформ. Так, с её помощью вы даже не сможете быстро завести будильник, добавить напоминание или заметку. А вот Siri легко справится с этими задачами.


    Хотя «Алиса» умеет открывать по запросу установленные на устройстве программы, эта функция срабатывает не всегда. Например, ассистент без проблем запускает «ВКонтакте» и Telegram, но если попросить его открыть Viber, то вместо приложения помощник направит вас на сайт этого мессенджера. На команду «открыть калькулятор» ассистент реагирует странно.


    Кроме того, чтобы обратиться к «Алисе», нужно сначала войти в приложение «Яндекс» и нажать на кнопку помощника (или воспользоваться ярлыком для быстрого доступа, если у вас Android). Это не очень удобно, ведь одна из главных задач голосового ассистента - позволить вам управлять устройством без рук. Та же Siri за счёт глубокой интеграции с iOS может принимать команды, даже когда экран заблокирован.

    «Алиса» на компьютере

    Ассистент «Яндекса» также доступен для компьютеров под управлением Windows в виде отдельной программы. После её установки на панели задач появляется поисковая строка и кнопка для голосового взаимодействия с помощником.

    Помимо функций, представленных в мобильной версии, «Алиса» для Windows умеет искать файлы на жёстком диске, запускать настольные программы, выключать компьютер или переводить его в спящий режим.