как сделать джарвиса на компьютер чтобы он сам думал

Содержание
  1. Как Цукерберг создал Джарвиса из «Железного человека» [+ перевод]
  2. Цукерберг год назад поставил цель создать искусственный интеллект
  3. Что Джарвис умеет делать?
  4. Как Цукерберг создавал Джарвиса?
  5. «Искусственный интеллект и ближе, и дальше, чем мы думаем»
  6. А кто озвучивает Джарвиса? (обновлено)
  7. Перевод поста Цукерберга, в котором он объясняет процесс разработки Джарвиса
  8. Система джарвис на компьютер голосовые команды. Typle — голосовое управление компьютером
  9. Ассистент на русском
  10. Robin
  11. Окей, Блокнотик!
  12. Голосовые помощники на ПК
  13. Заключение
  14. Сortana – что это за сервис
  15. Возможности Кортаны на Windows 10
  16. Сortana на русском – можно ли скачать для компьютера на Windows 10
  17. Как активировать голосовой помощник Сortana в России
  18. Cortana
  19. Typle
  20. Speaker
  21. Что такое Агрегат
  22. Знакомьтесь — Агрегат
  23. Что же он умеет делать?
  24. Интеграция с Дусей
  25. А что же еще?
  26. Как им пользоваться?
  27. Как он выглядит?
  28. Хочу! Как его установить?
  29. Создай свой Агрегат!

Как Цукерберг создал Джарвиса из «Железного человека» [+ перевод]

Марк Цукерберг создал искусственный интеллект Джарвис как из «Железного человека». Он управляет домом гендиректора Facebook, ставит ему музыку и выстреливает чистые серые футболки из специальной пушки. Мы ответили на главные вопросы об искусственном интеллекте от Цукерберга и перевели его оригинальный пост о процессе разработки Джарвиса.

Цукерберг год назад поставил цель создать искусственный интеллект

В начале каждого года Марк Цукерберг ставит себе цели на грядущие 12 месяцев. В 2010 году этой целью было выучить мандарин (диалект китайского языка), а в 2015-м — читать по две книги в месяц.

На этот год Цукерберг пообещал себе создать искусственный интеллект, как из «Железного человека». По задумке, он должен был управлять освещением, камерами и музыкой в доме.

В этот понедельник, 19 декабря, основатель Facebook заявил о завершении проекта и поделился постом, в котором описал процесс создания Джарвиса (искусственный интеллект назван в честь помощника Железного человека).

Что Джарвис умеет делать?

Практически все, что можно ожидать от искусственного интеллекта, подключенного к «умному дому». Он включает и выключает свет и музыку, жарит тосты и открывает двери (благодаря технологии распознавания лиц). Также Джарвис, используя специальную модифицированную пушку, выстреливает Цукербергу его фирменные серые футболки.

Среди функций Джарвиса есть и менее практичные способности. Например, Цукерберг научил его простой игре: он или его жена Присцилла спрашивают искусственный интеллект «кого нужно пощекотать», и Джарвис произвольным образом отвечает «Макс» или «Бист» (так зовут их дочь и собаку соответственно).

Как Цукерберг создавал Джарвиса?

Сам Цукерберг в своем посте разделил процесс создания Джарвис на пять больших блоков: объединенный дом, натуральный язык, распознавание лиц и объектов, бот для Facebook Messenger и распознавание речи.

15419743 10103347287954901 2744013366467623932 oJarvis является связующим звеном между домашними системами и пользовательскими устройствами

Во-первых, чтобы функционировать, у Джарвиса должен быть доступ к объединенной системе устройств по всему дому (лампы освещения, камеры, бытовая техника).

Во-вторых, искусственный интеллект должен понимать натуральный язык, то есть запросы вроде «сыграй что-нибудь из Канье Уэста».

В-третьих, Джарвису необходимо узнавать лица людей, чтобы оповещать Цукерберга о гостях или определять расположение членов семьи в доме.

В-четвертых, Цукерберг хотел иметь возможность говорить с Джарвисом не только с одного устройства, но и с любого телефона. Для этого он решил создать чат-бота в Facebook Messenger.

Наконец, Джарвис также должен был уметь распознавать устную речь и тоже отвечать голосом.

15577989 10103347985661691 4152643580570731663 oПример работы Jarvis через чат-бот

«Искусственный интеллект и ближе, и дальше, чем мы думаем»

Как отметил глава Facebook, его главной целью в процессе создания Джарвиса было узнать больше о состоянии искусственного интеллекта в современном мире. По его словам, ИИ может делать впечатляющие вещи — управлять машинами, лечить болезни и открывать планеты.

Однако проблема современного искусственного интеллекта кроется в самих людях. Мы еще не знаем, что такое интеллект, и пока мы не ответим на этот вопрос, настоящий ИИ нам не создать.

А кто озвучивает Джарвиса? (обновлено)

Цукерберг поделился роликом, в котором показывает аспекты работы Джарвиса. Из видео также становится ясно, что искусственный интеллект озвучен актером Морганом Фриманом.

В октябре этого года Цукерберг спросил на своей странице в Facebook, кого ему стоит пригласить для озвучки Джарвиса. Люди начали рекомендовать ему Моргана Фримана, известного ученого Нила Деграсса Тайсона и, да, самого Железного человека Роберта Дауни-младшего.

Актер ответил на этот комментарий и вроде бы согласился на предложение — при условии, что гонорар получит Пол Беттани (озвучивающий Джарвиса в фильмах про Железного человека).

Впрочем, в итоге за работу взялся Фриман.

Перевод поста Цукерберга, в котором он объясняет процесс разработки Джарвиса

Моим личным вызовом на 2016 год было создать простой искусственный интеллект, который управлял бы моим домом — совсем как Джарвис в «Железном человеке».

Моей целью было узнать о состоянии искусственного интеллекта — и оказывается, мы зашли гораздо дальше, чем многие люди себе представляют (тем не менее, нам еще далеко до финиша). Подобные испытания всегда приводят к тому, что я учусь и узнаю больше ожидаемого, и этот проект не стал исключением: он помог мне осознать внутреннюю систему для инженеров Facebook, которую мы используем в компании, а также дал мне общее представление об «умных домах».

За этот год я построил простой ИИ, с которым я могу разговаривать по телефону и компьютеру: он контролирует мой дом, освещение, температуру, музыку, безопасность; он узнает мои привычки и вкусы; он учит новые слова и концепты; плюс, он даже развлекает Макс [дочь Цукерберга — прим. ред]. Он использует несколько техник искусственного интеллекта, включая обработку натурального языка, распознавание речи и лиц и машинное обучение — всё это написано в Python, PHP и Objective C. В этой заметке я объясню, что я построил и чему научился в процессе.

Ролик, в котором Цукерберг демонстрирует работу Джарвиса

Начинаем: Соединяя дом

В некотором смысле, этот вызов оказался легче, чем я ожидал. На самом деле, моя цель по бегу (пробежать 365 миль в 2016 году) заняла даже больше времени. Но один аспект, который принес мне много сложностей, это процесс объединения всех различных систем в моем доме.

Перед тем, как построить ИИ, мне нужно было написать код, который бы соединил все эти системы, написанные на разных языках программирования. Мы [семья Цукерберга] используем Creston для освещения, термостата и дверей, Sonos со Spotify для музыки, Samsung для телевизора, Nest для камер и, естественно, Facebook для моей работы. В большинстве случаев мне пришлось заняться обратным инжинирингом API для этих систем, чтобы заставить их отвечать на мои команды включить свет или музыку.

Дальше встал вопрос того, что многие из этих устройств не подключены к интернету. Некоторые из них можно включать и выключать, используя интернет, но этого недостаточно. Например, у меня было много трудностей с поиском тостера, который с отключенным питанием позволит опустить хлеб, чтобы автоматически начать его жарить при включении. В итоге я купил старый тостер из 1950-х и приделал к нему подключенный [к сети] переключатель. Таким же образом я модифицировал кормилку для Биста [собака Цукерберга] и пушку для серых футболок.

Для того, чтобы помощники вроде Джарвиса могли управлять всем в наших домах, нам нужно больше подключенных [к интернету] устройств, а индустрии необходимо разработать общие API и стандарты для того, чтобы устройства могли друг с другом разговаривать.

Естественный язык

Когда я написал код, с помощью которого мой компьютер мог управлять всем домом, следующим шагом была коммуникация: я хотел разговаривать с компьютером и домом так же, как я говорю с кем-либо другим. Это был двухступенчатый процесс: сначала я научил его понимать текстовые сообщения, а затем добавил возможность голосового ответа и обработки речи в текст.

Я начал с простых ключевых слов вроде «спальня», «свет», «включен»: компьютер искал эти слова в предложении и, если нужно, включал свет в спальне. Вскоре стало ясно, что он должен также выучить синонимы — например то, что гостиная и семейная комната значат одно и то же в нашем доме. Это значит, я должен был научить его усваивать новые слова и концепты.

Понимание контекста важно для любого ИИ. Например, когда я говорю своему [ИИ, Джарвису] включить кондиционер в «моем офисе», это означает совершенно иное, нежели когда Присцилла [жена Цукерберга] просит его о том же самом. Сколько различных проблем всплыло из-за этого! Или, например, если вы просите его приглушить свет или сыграть песню, не уточняя определенную комнату, ему нужно знать, где вы находитесь — иначе в музыка зазвучит в комнате Макс именно в тот момент, когда она спит. Упс.

Музыка — более интересная и сложная плоскость для естественного языка, потому что существует слишком много артистов, песен и альбомов, и простой поиск по ключевым словам не срабатывает. Свет можно только включить или выключить, а когда вы говорите «сыграй X», даже самые маленькие вариации могут означать совершенно разные вещи. Возьмите к примеру несколько запросов, связанных с Адель: «сыграй someone like you», «сыграй кого-либо вроде Адель», «сыграй Адель» [игра слов на английском, в оригинале запросы выглядят так: “play someone like you”, “play someone like adele”, “play some adele”]. Они звучат похоже, но каждый из них относится к разным категориям запросов. Первый просит сыграть определенную песню, второй рекомендует артиста, а третий создает плейлист из лучших песен Адель. Сквозь систему позитивных и негативных отзывов, я научил свой ИИ видеть эти отличия.

Чем больше контекста предоставлено ИИ, тем лучше он справляется с открытыми запросами. Сейчас, если я прошу Джарвиса «включить музыку», он просматривает списки прослушанных мною песен и чаще всего выбирает именно то, что я хотел бы услышать. Если он ошибается с настроением, я могу просто сказать ему что-то вроде «это не легкая музыка, поставь что-нибудь легкое», и он сразу проклассифицирует песню и исправит запрос. Также он различает меня и Присциллу, и выдает нам индивидуальные рекомендации. В целом, я понял, что мы используем открытые запросы гораздо чаще специфических.

Распознавание объектов и лиц

Примерно одна треть головного мозга посвящена зрению, и у ИИ есть множество проблем, связанных с пониманием того, что происходит на фото или видео. Эти проблемы включает в себя отслеживание (например, проснулась ли Макс и ползает ли она по своей кроватке?), распознавание объектом (это Бист или ковер в той комнате?) и распознавание лиц (кто стоит перед дверь?).

Распознавание лиц — особенно сложная версия распознавания объектов, потому что большинство людей выглядят относительно похоже (компьютеру легче отличить друг от друга два произвольных объекта, например, сэндвич и дом). Но Facebook очень хорош в распознавании лиц, чтобы отмечать друзей в ваших фотографиях. Та же самая технология подходит для того, чтобы ИИ мог определить, кто из ваших друзей стоит у дверей вашего дома.

Для этого, я просто установил несколько камер на моей двери, которые захватывают картинку с разных углов. Сегодняшние ИИ пока еще не умеют идентифицировать людей по их макушкам, потому наличие нескольких углов гарантирует, что компьютер получит изображение лица. Я построил простой сервер, которые постоянно мониторит обе камеры и выполняет двухступенчатый процесс: во-первых, он запускает процесс выявления лиц (который позволяет определить, что к двери подошел человек), во-вторых, если он находит лицо, запускается процесс распознавания лиц (который позволяет определить, кто именно подошел к двери). Как только он определил гостя, компьютер сверяется с определенным списком — если я ожидал этого человека сегодня, то он впускает гостя и дает мне знать о его прибытии.

Такой тип визуальной системы у ИИ очень подходит для определенного числа вещей: например, он знает, когда Макс просыпается, и начинает играть ей музыку или урок языка мандарин [китайский диалект], или решает проблему контекста, зная в какой комнате мы находимся и точно отвечая на открытые запросы вроде «включи свет». Как и большинство аспектов этого ИИ, зрение является полезным, когда оно информирует более широкую модель мира, объединяя другие способности — например, зная ваших друзей и открывая им дверь по их прибытии. Чем больше контекста у системы, тем умнее она становится.

Чат-бот в Messenger

Я программировал Джарвис на своем компьютере, но для того, чтобы он был по-настоящему полезным, мне нужен был доступ к нему из любого места. Это означало, что для коммуникации мне нужно было использовать телефон, а не девайс, установленный у меня дома.

Я начал с создания чат-бота для [Facebook] Messenger для связи с Джарвис, потому что это гораздо легче, чем создать отдельное приложение. У Messenger очень простой фреймворк для создания ботов, который автоматически делает множество вещей за вас — включая работу и на iOS, и на Android, поддержку текста, изображений и аудио, доставку уведомлений и многое другое. Подробнее о фреймворке для ботов вы можете узнать на сайте messenger.com/platform.

Я могу написать что угодно боту Джарвис, и он автоматически передаст это серверу Джарвис и обработает запрос. Я могу также отправлять аудиозаписи, и сервер переведет их в текстовую форму и исполнит запрос. В середине дня, если я возвращаюсь домой, Джарвис пишет мне о том, кто там сейчас находится или что мне нужно сделать.

Один из сюрпризов, который я обнаружил при создании Джарвис — то, что когда у меня есть выбор между речью и текстом для связи с Джарвис, я пишу ему гораздо чаще ожидаемого. На это есть множество причин, но главная заключается в том, что это не мешает людям вокруг меня. Если я запрашиваю что-то связанное с ними, например прошу включить музыку для нас всех, то я использую голосовой запрос, но в большинстве случаев мне удобнее писать Джарвису. Схожим образом, когда Джарвис коммуницирует со мной, я предпочитаю текст, а не голос. Это потому, что речь бывает нестабильной, а текст дает больше контроля над тем, что вы хотите видеть. Даже когда я говорю с Джарвис, если я делаю это по телефону, я предпочитаю, чтобы он показывал свой ответ.

Это предпочтение текстовой коммуникации вместо голосовой — паттерн, который мы также видим в Messenger или WhatsApp, где объем текстовых сообщений растет гораздо быстрее объема голосовых. Значит, будущие ИИ продукты не могут полагаться лишь на голос [как это делает, например, Amazon Echo] и им стоит иметь интерфейс для личных переписок. Я всегда был оптимистичен насчет ИИ-ботов, но мой опыт с Джарвисом сделал меня еще более уверенным в том, что в будущем мы будем общаться с ботами вроде Джарвиса.

Голос и распознавание речи

Несмотря на мое мнение о том, что текст будет более важным при связи с будущими ИИ, я все равно считаю, что голос тоже играет не менее важную роль. Самое главное преимущество голоса — он быстрее. Вам не нужно доставать телефон, открывать приложение и начинать печатать — вам нужно лишь говорить.

Чтобы включить функцию голоса для Джарвиса, мне нужно было построить специальное приложение, которые бы постоянно прислушивалось к тому, что я говорю. Чат-бот Messenger прекрасен для многих вещей, но для постоянного мониторинга моей речи он плохо подходит. Мое собственное приложение Джарвиса позволяет мне положить телефон на стол, и он будет меня слушать. Я также могу положить несколько телефонов с приложением Джарвиса по всему дому, чтобы иметь возможность использовать его из любой комнаты.

Эта идея схожа с видением Amazon, которая реализует его со своим голосовым помощником Echo, но на своем опыте я обнаружил, что мне крайне часто хочется обратиться к Джарвису вне дома. Потому иметь телефон в качестве основного интерфейса вместо специально домашнего девайса — критически важно.

Я разработал первую версию приложения Джарвиса на iOS, и планирую сделать версию для Android в ближайшее время. Я не делал приложений для iOS с 2012 года, и одним из моих главных наблюдений стало то, что инструменты, которые мы создали в Facebook для разработки подобных программ, очень впечатляют в качестве распознавания речи.

Технология распознавания речи в последнее время значительно усовершенствовалась, но ни один искусственный интеллект еще не умеет понимать разговорную речь на лету. Распознавание речи полагается на прослушивание того, что вы говорите, и предсказание того, что вы скажете дальше, потому структурированная речь гораздо легче для понимания, нежели неструктурированный разговор.

Другое интересное ограничение в системах распознования речи — и машинного обучения в целом — это то, что они оптимизированы для специфических проблем. Например, понимать разговор человека с компьютером — не совсем то же самое, что понимать разговор человека с другим человеком. Если вы учите машину, предоставляя ей данные из поисковых запросов Google, когда люди разговаривают со строкой поиска, то эта машина будет работать хуже на сайте Facebook, где люди разговаривают друг с другом.

В случае с Джарвисом, он предназначен для распознавания речи с близкого расстояния, в отличие от [Amazon] Echo, с которым вы можете говорить из другого конца комнаты. Эти системы более специализированы, чем мы думаем, и это значит, что мы далеки от обобщенных систем [ИИ].

На психологическом уровне, когда вы говорите с машиной, вы автоматически присваиваете разговору больше эмоциональной глубины, нежели когда вы общаетесь с ней посредством текста или графического интерфейса. Одно любопытное наблюдение, которое я обнаружил при интегрировании голоса в Джарвиса, это то, что я хотел в нем больше юмора. Отчасти для того, чтобы он смог взаимодействовать с Макс и развлекать ее, и отчасти для того, чтобы он лучше интегрировался [в нашу семью].

Я научил его небольшим веселым играм вроде той, где я или Присцилла спрашиваем его, кого мы должны пощекотать следующим, а он произвольным образом отвечает «Макс» или «Бист». Ради смеха я также добавил несколько классических строчек вроде «Прости, Присцилла. Я боюсь, что не смогу этого сделать» [отсылка на искусственный интеллект HAL-9000 из фильма Стэнли Кубрика «Космическая одиссея 2001 года»].

Есть еще множество вещей, которые можно исследовать в плоскости голоса. Технологии ИИ уже достаточно хороши для отличного продукта, и они будут становиться лишь лучше в ближайшие годы. В то же время, я думаю, что лучшими продуктами станут те, которые вы сможете взять с собой и приватно использовать в любом месте.

Среда разработки Facebook [или немного рекламы от Цукерберга— прим. ред]

Как гендиректор Facebook, я больше не пишу код для нашей внутренней среды. Тем не менее, я никогда не прекращал кодить, хотя теперь делаю это для персональных проектов вроде Джарвиса. Я ожидал узнать многое о сегодняшнем состоянии дел с искусственным интеллектом, но я и не представлял, что также узнаю о том, каково это быть инженером Facebook. Вкратце — это впечатляюще.

Мой персональный опыт ознакомления с базой кода Facebook, скорее всего, похож на опыт наших новых инженеров. Я постоянно удивлялся тому, насколько хорошо организован код и как легко найти то, что вам нужно — неважно, связано ли это с распознаванием лиц и речи, с фреймворком для создания чат-ботов или разработкой приложения для iOS.

Опенсорсные пакеты Nuclide, которые мы построили для работы с гитхабовским Atom, делают разработку гораздо легче. Среда разработки Buck, которую мы создали для работы над большими проектами, тоже сэкономила мне много времени. Наш опенсорсный искусственный интеллект FastText, который классифицирует текст, тоже стоит посмотреть одним глазом, если вы заинтересованы в разработке ИИ — да и вообще, покопайтесь в гитхабовском репозитории Facebook Research.

Одна из наших ценностей — двигаться быстро. Это значит, что вы должны прийти сюда [в компанию Facebook] и построить приложение быстрее, чем где-либо еще. Вы должны прийти сюда и уметь пользоваться нашей инфраструктурой и инструментами для ИИ, для разработки вещей, на которые вы бы потратили гораздо больше времени при работе в одиночку. Создание внутренних инструментов, которые делают [программную] инженерию более эффективной, важно для любой технологической компании, и мы очень серьезно подходим к этому вопросу. Так что я призываю вас тоже пользоваться нашими инструментами, это никому не помешает.

Несмотря на то, что этот вызов подходит к концу, я уверен, что продолжу работать над усовершенствованием Джарвиса, так как я использую его каждый день и постоянно нахожу новые функции, которые хотел бы добавить.

В ближайшем будущем моими следующими шагами будет построить приложение для Android, настроить голосовые терминалы Джарвиса в большем числе комнат по дому и соединить больше техники. Я бы хотел, чтобы Джарвис управлял моим Big Green Egg [керамический гриль] и помогал мне в готовке, но это потребует более продвинутых модификаций, нежели оборудование пушки для футболок.

В долгосрочной перспективе, я хотел бы научить Джарвиса осваивать новые функции самостоятельно, вместо того чтобы каждый раз собственноручно программировать его для специальных задач. Если бы я провел еще один год на этом челлендже, я бы сфокусировался на штудировании того, как работает [машинное] обучение.

Наконец, было бы интересно найти способы сделать [Джарвиса] доступным для всего мира. Я думал о том, чтобы сделать его код опенсорсным, но сейчас он слишком сильно подвязан к моему собственному дому, его технике и настройкам сети. Если я когда-либо разработаю более абстрактную оболочку, возможно, я её выпущу. Или, конечно, сделаю основой для разработки совершенно нового продукта.

Выводы

Разработка Джарвиса была интересным интеллектуальным испытанием, благодаря которому я пополнил опыт работы с инструментами ИИ в сферах, которые важны для нашего будущего.

Ранее я предсказывал, что в течение 5-10 лет у нас появятся ИИ системы, которые станут более точны в каждом из наших чувств — зрении, слухе, обонянии и т.д., включая вещи вроде языка. Удивительно, насколько мощными уже стали эти инструменты, и этот год лишь убедил меня в этом предсказании.

В то же время мы далеки от понимания того, как работает обучение. Все, что я сделал за этот год — естественный язык, распознавание лиц и речи — всё это варианты фундаментального паттерна распознавательных техник. Мы знаем, как показать компьютеру множество каких-либо примеров и заставить его эти примеры различать, но мы все еще не знаем, как взять идею из одной плоскости и применить её в совершенно другой [например, применить техники из распознавания лиц на распознавании речи].

Для примера: я потратил около 100 часов на разработку Джарвиса в этом году, и у меня получилась довольно хорошая система, которая понимает меня и делает множество вещей. Но даже если бы я потратил еще 1000 часов, я, скорее всего, не смог бы создать систему, которая самостоятельно обучается новым функциям — для этого нужен фундаментальный прорыв в области ИИ.

В определенном смысле, ИИ ближе и дальше, чем мы себе представляем. ИИ ближе в том плане, что он способен выполнять очень мощные задачи — управлять автомобилями, лечить болезни, открывать планеты и понимать медиа. Каждая из этих вещей имеет огромное влияние на сегодняшний мир, но нам все еще предстоит выяснить, что такое настоящий интеллект.

В целом, это было огромным испытанием. Подобные вызовы всегда обучают меня большему, чем я ожидал в начале. В этом году я думал, что узнаю больше об ИИ, но я также узнал об устройстве «умных домов» и внутренней среде разработки Facebook. Это то, что делает подобные испытания интересными. Спасибо за то, что следили за мной в этом испытании, и я с нетерпением жду следующего челленджа, которым я поделюсь через несколько недель.

Источник

Система джарвис на компьютер голосовые команды. Typle — голосовое управление компьютером

Наиболее толковым из электронных ассистентов является – что и неудивительно, ведь Apple доводила программу до ума целых 6 лет. является фаворитом среди отечественных юзеров, потому как прекрасно понимает русский язык и говорит на нём. Однако пользователям Android-устройств нечего отчаиваться – они также могут загружать на свои смартфоны голосовых ассистентов, которые говорят на русском. Прочитав эту статью, вы познакомитесь с лучшими голосовыми помощниками для Андроид.

Google Now можно использовать и на iOS-гаджете. Для этого необходимо загрузить приложение Google из AppStore.

Главное достоинство Google Now – это интеграция со всеми остальными сервисами от компании Google. Пользователь, например, может сделать голосовой запрос в браузере Google Chrome или надиктовать заметку в Google Keep. Также голосом удастся завести будильник, активировать таймер или секундомер, отыскать событие в календарь, создать СМС-сообщение и отправить его абоненту, номер которого забит в телефонном справочнике. На современных версиях Android Google Now интегрирован и со сторонними приложениями – вроде мессенджеров Telegram и What’s App.

Главная особенность русскоязычного интеллектуального помощника «Дуся» — полное отсутствие интерфейса. Ассистент постоянно работает в фоне и при этом не занимает ни единого дюйма экрана мобильного гаджета. Запустить приложение «Дуся» можно голосом, взмахом, встряхиванием и множеством других способов.

К числу недостатков программы «Дуся» можно отнести то, что она является платной. Пользователю даётся неделя на знакомство с интеллектуальной помощницей – по истечении этого срока придётся приобрести подписку за 299 рублей.

Ассистент на русском

За невзрачным названием скрывается мощная программа, способная похвастать широким функционалом. «Ассистент на русском» может по голосовым командам искать информацию в Wikipedia, прокладывать маршруты, активировать / деактивировать будильник смартфона, отправлять сообщения, вызывать абонентов, номера телефонов которых «забиты» в телефонную книжку, и выполнять много других полезных действий. Для интеллектуального помощника не составит труда поработать в качестве переводчика – помимо русского он знает несколько европейских языков.

У «Ассистента на русском» есть ещё одна полезная функция под названием «Киноафиша» — помощник рассказывает, какие фильмы идут в кинотеатрах населённого пункта. Однако пока эта функция доступна только для пользователей из двух столиц — Москвы и Санкт-Петербурга.

Достоинством программы является то, что она способна к обучению – пользователь наверняка заметит, что спустя несколько дней «Ассистент на русском» начинает быстрее реагировать на его команды и выполнять их более точно. У помощника есть и недостаток – его «услуги» бесплатны только в течение первой недели. Затем придётся купить полную версию программы за сумму около 500 рублей.

Robin

Приложение «Робин» считается лучшим голосовым помощником для водителя. Автомобилисту не придётся отрывать руки от «баранки», чтобы написать СМС-сообщение, совершить звонок или узнать прогноз погоды. Интеллектуальный ассистент прекрасно справляется с такими задачами, как поиск актуальных новостей и проверка непрочитанных сообщений в соцсетях.

К русификации помощника «Робин» приложили руку подразделения сразу 2-х поисковых гигантов – Google Moscow и Yandex Labs. Результаты превзошли ожидания: «Робин» говорит на русском так, как будто этот язык для него родной.

«Изюминкой» интеллектуального ассистента Robin является его незаурядное чувство юмора. Помощник всегда готов порадовать автомобилиста анекдотом, а в плане забавных ответов даст фору даже «яблочной» Siri. Маркетологи фирмы Audioburst, распространяющей Robin – тоже юморные ребята, ведь иначе они бы точно не смогли создать такой вот шедевральный трейлер:

Окей, Блокнотик!

Функционал приложения «Окей, Блокнотик!» невелик — назвать его полноценным интеллектуальным ассистентом нельзя. Создавать голосом заметки и напоминания – это всё, что позволяет пользователю приложение «Окей, Блокнотик!». Судя по тому, что программа имеет отличные оценки и массу положительных отзывов в Google Play, со своей скромной задачей она справляется на 5+.

Разработчик приложения Д. Лозенко отмечает, что «Окей, Блокнотик!» является аналогом некогда популярной мобильной программы «Помнить всё». Сейчас приложение «Помнить всё» заброшено, поэтому толковых альтернатив «Блокнотику» в Google Play нет.

Функционал программы «Окей, Блокнотик!» можно немного расширить за счёт установки плагинов. Например, при помощи дополнительного софта удастся добавить синхронизацию с задачами Google.

Голосовые помощники на ПК

Управление компьютером тоже можно осуществлять при помощи виртуального ассистента – хотя, увы, лишь немногие пользователи знают об этом. Операционная система Windows 8 включает в себя встроенную утилиту под названием Windows Speech Recognition, которая активируется через панель управления. Windows 10 и вовсе оснащена полноценным интеллектуальным ассистентом Cortana, способным выполнять по голосовым запросам пользователя массу задач – искать и запускать файлы на компьютере, делать заметки и примечания в календаре, настраивать систему.

vdsc n10

Заключение

В скором времени владельцам гаджетов с Android не придётся задумываться о том, какими голосовыми помощниками оснащать свои смартфоны. Ещё в феврале компания Google заявила о намерении заменить на всех Android-аппаратах устаревший Google Now на более современный Google Assistant. «Апгрейдить» голосового помощника можно будет не только на Android 7.0 Nougat, но и на версии 6.0 Marshmallow. Google Assistant пока не говорит по-русски, но совершенно точно скоро будет – об этом представители Google сообщили на выставке I/O 2017.

– это официальный голосовой помощник, изначально встроенный в Windows 10. Вам не нужно скачивать Кортану отдельно, программу нужно лишь активировать. По умолчанию Кортана отключена у всех пользователей, но ее можно включить. Включить голосовой помощник Сortana в России – это целый квест и в этой статье вы узнаете как о самом сервисе, так и о том, как включить Сortana на русском языке на Windows 10.

Сortana – что это за сервис

898898f8264e3aba55bcaa1d1

Возможности Кортаны на Windows 10

Сortana на русском – можно ли скачать для компьютера на Windows 10

Как активировать голосовой помощник Сortana в России

В панели меню «Пуск» необходимо найти кнопку «Параметры» и щелкнуть по ней:

cttransrc

Далее перед вами откроется панель параметров, где одним из последних пунктов будет пункт «Время и язык», вам необходимо выбрать этот пункт и щелкнуть по нему мышкой:

1a0 1485784928 2nastrojki yazyka1

В новом окне у вас будет выбор регионов и языков. Если вы хотите подключить Кортану на английском, то вам нужно выбрать любой англоязычный регион. Для примера, США или Англию. А разделе добавления языков выбираем английский. И перед нами откроется следующее окно:

4669616

Система автоматически загрузит письменный пакет английского языка. Ниже вы увидите речевой пакет и его параметры. Вы должны самостоятельно инициировать загрузку англоязычного речевого пакета. Разумеется, для первичной настройки и подключения к Кортане вам потребуется доступ к сети Интернет. Время настройки зависит от скорости вашего Интернета. В том же разделе параметров речевого пакета проследите, что загрузка английского завершена. Далее отметьте английский в пункте о распознавании речи. Чуть ниже есть пункт о распознавании акцента. Вы можете отметить и его, если английский не является вашим родным. Но больших надежд на этот пункт не возлагайте, вам все равно потребуется говорить на достаточно чистом и понятном английском, чтобы Кортана смогла воспринять вашу речь.

После всех изменений вам обязательно нужно перезагрузить ваш компьютер. После запуска вновь откройте меню «Пуск». И в разделе настроек выключите сервис Сortana в качестве личного голосового помощника. Этот пункт будет уже на английском языке, так как мы до этого установили англоязычный языковой пакет. Поэтому, для активации вам нужно выбрать положение «On» в пункте «Cortana can give you suggestions».

Еще до релиза находящегося на стадии разработки, тестирования и отладки интерфейса Cortana для Windows 10 пользователи пытались организовать голосовое управление компьютера. О том, как такую функцию можно реализовать в Windows, вышедших до 10-ки и поговорим в сегодняшней статье.

Cortana

Кортана – голосовой помощник с ИИ, разработанный корпорацией Microsoft для Windows 10, Phone и Android с дальнейшим распространением проекта на XBox и iOS. Она заменяет классическую поисковую строку и выполняет множество действий, в первую очередь, связанных с поиском информации и системных команд, получая их от пользователя в виде голосовых команд. Глубокая интеграция в Windows 10, отсутствие русского языка (пока что), сбор фактически всей информации о пользователе с отправкой на серверы Microsoft и отсутствие финальной версии не дают возможности большинству пользователей получить полноценное голосовое управление собственным компьютером.

Помимо Кортаны существует немало приложений, позволяющих осуществлять управление ПК посредством голосовых команд пользователя. Ознакомимся с самыми распространенными продуктами для решения этой задачи в Windows 7 и 10.

Typle

Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.

lidob ru

Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).

Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).

Speaker

Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.

Разработчики программного комплекса для управления компьютером с Windows 7 и 10 являются первой отечественной командой, выпустившей приложение для решения подобного рода задач. За ядро приложения взята западная «Dragon Dictate», куда внедрили отечественный программный модуль для распознания русской речи.

23369

Кроме выполнения системных команд, Горыныч умеет осуществлять голосовой ввод в текстовых редакторах для Windows 10 с производительностью, превышающей скорость набора текста среднестатистическим пользователем ПК. ИИ приспосабливается к голосу юзера и со временем качество распознавания команд и текста становится гораздо выше, до очередной деинсталляции программы или переустановки ОС без сохранения пользовательских данных.

С системных функций программный комплекс легко выполняет запуск приложений, создание новых текстовых файлов.

Вот и наступила весна… В апреле 2014-го первая альфа версия Дуси появилась на форуме 4PDA.

Эта статья о том, что такое Агрегат, что он умеет делать и как его получить.

Что такое Агрегат

Знакомьтесь — Агрегат

Дуся для ПК готовилась уже давно. Очень давно — с самых первых версий. И вот чем наш Агрегат отличается от Кортаны:

И да — Агрегат абсолютно бесплатен!

Что же он умеет делать?

Пока Агрегат только в альфа-версии, и на данный момент модулей еще не так много. Но совсем скоро их станет больше! А самый главный модуль уже создан. Это…

Интеграция с Дусей

Альфа-версия Дуси 1.6.0 имеет функцию удаленного управления. Именно благодаря ей вы можете отправлять команды на ваш смартфон прямо с вашего компьютера. А ответы придут обратно на компьютер в виде речи и действий в браузере!

Вы можете писать СМС, звонить, создавать напоминания, узнавать планы, ставить таймеры, слушать новости, выполнять вообще любые команды и скрипты, не беря в руки телефон! При этом диалог тоже поддерживается.

А что же еще?

Модуль «Диктовка» позволит просто продиктовать любой текст, который тут же будет вставлен в поле ввода открытой в данный момент программы.

Например, можно писать поисковые запросы в окне браузера, диктовать текст в текстовом редакторе, писать сообщения в мессенджерах и многое другое.

Посмотрите на видео, как я просто сказал «Дуся агрегат», когда курсор стоял в поле ввода текстового запроса на сайте youtube.com.

Как им пользоваться?

Легко! Так же, как и у Дуси, у Агрегата есть способы активации, распознавание и синтез речи.

Самый простой способ активировать Агрегат и дать команду — это просто зажать пару горячих клавиш на клавиатуре, произнести команду и отпустить клавиши. При этом можно делать паузы — Агрегат будет слушать вас, пока вы не отпустите кнопки!

Распознавание, синтез и активации — это тоже модули Агрегата, которые могут быть разными

Как он выглядит?

Вспомним те славные времена, когда и у Дуси не было никакого интерфейса кроме настроек.

Для компьютерной версии голосового ассистента это намного важнее. Потому что вы можете пользоваться его функциями, не открывая другое приложение, не отвлекаясь от текущей работы. Ничего не занимает экран. Агрегат просто слушает вас и выполняет команды. Быстро и четко!

Хочу! Как его установить?

Там же доступны модули, их описание и исходные коды (для тех, кто желает присоединиться к проекту и стать соавтором первого в мире голосового ассистента с открытым кодом).

Создай свой Агрегат!

Я надеюсь, что вам понравится наш новый проект, в котором каждый может поучаствовать как соавтор. И вы увидите, что только настоящая свобода дает неограниченные возможности вашему воображению по созданию своего собственного голосового ассистента под ПК!

Источник

Поделиться с друзьями
DOMA35.RU