Технология распознавания речи speechkit от Яндекса

                                                                                                        

Здравствуйте друзья!  В данной статье мы рассмотрим использование технологии распознавания речи от Яндекса на мобильных устройствах и не только.

Управляйте смартфоном своим голосом

SpeechKitСегодня читал новости от Яндекса и был удивлён, оказывается, полгода назад Яндекс запустил новую технологию speechkit — технологию распознавания речи.

Многие, наверное помнят, как по телевизору показывали возможности гаджетов от Google, в которых использовалась технология распознавания речи. Например, Вы говорите своему смартфону: «Как попасть на улицу Ленина» и получаете от встроенного навигатора четкий ответ. Но, то Google, а то Яндекс.

Надо отдать должное специалистам Яндекса, которые стараются сильно не отставать от старшего брата. На мой взгляд, то, что сделал Яндекс, нужно протестировать и использовать, по этой причине я и решил сегодня поделиться этой новостью с читателями блога. Думаю, есть достаточно много людей, которые и не слышали о разработках Яндекса в области технологии распознавания речи для мобильных устройств.

Итак, постараюсь коротко поделиться полученной информацией и изложить её так, как я понял её сам. Система Яндекс speechkit имеет как бы два сервиса, один сервис предназначен для работы с мобильными телефонами и работает с Android, iOS Windows Phone.

Технология позволяет запускать голосовой ввод, то есть Вы диктуете голосом, а текст пишется автоматически. Такое сообщение Вы можете отправить в социальные сети, положить в качестве заметки или отправить текст по электронной почте. Думаю, таким же путем можно делать и комментарии на блогах.

Можно голосом редактировать текст, например, «Добавить смайл», убрать последнее слово из предложения. Как пишут разработчики, количество команд не ограничено, система понимает смысл предложения.

При диктовке текста, приложение способно воспринимать интонацию и паузы и автоматически расставляет знаки препинания. Можно использовать обратную функцию, нажав кнопку «Прочитать всё» смартфон Вам прочитает любой текст голосом. Можно выбрать мужской или женский голос, а также выбрать добрый голос, злой или нейтральный.

Настолько я понял, система использует два языка – русский и турецкий, почему выбран турецкий непонятно. Качество распознавания речи достаточно высокое, при запросах – 88%, при навигационных запросах – 95%, при текстовых запросах – 82%. Вы можете давать голосовые команды навигатору.

Использовать данное приложение могут все желающие, оно бесплатное, при условии, что количество запросов не будет превышать 10 000 запросов в сутки. Правда, надо выяснить, что подразумевается под одним запросом.

Второй сервис SpeechKit Cloud позволяет использовать данные технологии, в том числе и технологию распознавания речи через облако, это реализация многих проектов, так сказать, по-взрослому. Вы можете оборудовать голосовым интерфейсом систему «Умный дом», организовать голосовое управление всей бытовой техникой и роботами, если они у Вас есть.

Можно построить голосовое управление в салоне автомобиля, настроить голосовой ввод данных в компьютер, в том числе и в играх, можно использовать голосовое управление в промышленности, медицине и так далее. Здесь уже будет работать фантазия. Использование технологии SpeechKit Cloud платное, первый месяц даётся бесплатно.

В этой статье я не ставил задачу рассказать о всех технических моментах данных сервисов от Яндека, хотел только познакомить читателей с ними. Если Вы захотите узнать подробности, Вы можете просто набрать в поисковой строке Яндека «Яндекс speechkit» и сами все прочитать, материалов там много.

Есть и лицензионные условия, есть инструкции на тему, как установить такое приложение к себе на телефон и многое другое. Если Вам нужны такие функции, то заходите на сервис, читайте, устанавливайте и используйте. Удачи Вам!

С уважением, Иван Кунпан.

Просмотров: 693
30 комментариев на “Технология распознавания речи speechkit от Яндекса
Григорий
03.07.2015 в 13:35

Очень занятно. Не знал. Посмотрю, что за зверь speechkit

Насчет турецкого — понятно. Яндекс в Турции хорошо сидит. Крепенька 🙂 Я даже в твиттере на него подписан…

03.07.2015 в 14:05

Надо же век живи, век учись, а я и не знал, что Яндекс у нас Турецкий!? Теперь понятно.

Григорий
03.07.2015 в 14:07

Иван Семёнович) Здрасте, приехали… 🙂 После России, Турция. Далее Украина. С Восточной Европой сложнее там все

03.07.2015 в 14:34

Да я всё понял, просто так сказал. Вы мне объяснили, почему именно турецкий язык внедрен.

Татьяна
03.07.2015 в 16:25

Ого, какие возможности открываются! Думаю, что через пару лет мы перестанем пользоваться клавишами на клавиатуре, а перейдем на голосовой ввод текста.

03.07.2015 в 16:58

Было бы отлично просто

Андрей Косолапов
03.07.2015 в 19:02

Все может быть. я еще помню бабинные магнитофоны. А сейчас и диски уже отходят на второй план.

05.07.2015 в 09:50

Прогресс с каждым годом только ускоряется. Вспомните, когда появились первые сотовые телефоны. Свой первый телефон я получил на работе в 2001. Это был скромненький телефон с черно белым дисплеем. А что сейчас — телефон-компьютер у которого десятки Гигабайт памяти. Сами понимаете.

Татьяна
07.07.2015 в 15:21

А сейчас никакие носители информации не нужны: ни диски, ни флешки. Главное, чтобы интернет был. А там закинул информацию в облако и в любом месте можешь ей воспользоваться.

Андрей Косолапов
07.07.2015 в 18:23

Татьяна, согласен. Только есть одно но, пароль запомнить нужно. Без него облако инфу не вернет 🙂

Татьяна
07.07.2015 в 23:42

У меня запомнить все пароли не получится, я их записываю. Так надежней.

Андрей Косолапов
08.07.2015 в 01:44

Согласен. Я тоже их записываю, но думаю что надо бы еще продублировать в обычном блокнотике. Мало ли что.

Григорий
18.07.2015 в 20:58

Тренируйте память — старайтесь пароли запоминать, желательно делать их 9-ти и выше значные.

Андрей Косолапов
18.07.2015 в 22:14

Григорий, с памятью вроде все в порядке. Так что пароли стараюсь запоминать 🙂

21.07.2015 в 12:46

Все верно, облачные технологии все прочнее входят в нашу жизнь. Хотя надо понимать, что информация в облаке может тоже пропасть.

21.07.2015 в 13:14

Не надо пароли запоминать, их просто надо записывать и хранить. У меня сейчас порядка 40 паролей от различных ресурсов — как их запомнить?!

05.07.2015 в 09:47

Так и будет Максим!

05.07.2015 в 09:46

Думаю, пару лет это много. Если есть возможность это делать уже сейчас на мобильниках, адаптировать к обычному компьютеру достаточно просто.

Григорий
18.07.2015 в 20:47

Через пару десятков лет в мозг людям воткнут чип и вообще ничего не надо будет, никаких гаджетов, всё общение и коммуникация будет проходить на нейронном уровне.

Не верите? А зря! В 19 веке за космос тоже никто не верил…

21.07.2015 в 13:12

Чип это плохо! Тогда можно управлять любым человеком, а это конец личности!

Григорий
21.07.2015 в 13:18

Иван Семёнович! 🙂

Я вас считаю хорошим.

И что плохого с чипа?

Если это веточка эволюции?

21.07.2015 в 15:52

Возможно, я не так Вас понял? Согласен, варианты разные есть у этого элемента технического развития.

21.07.2015 в 12:44

Да, Татьяна — так примерно и будет. Мало того, мониторов лет через пять тоже не будет — будет изображение посреди комнаты в виде голограммы.

03.07.2015 в 21:26

Обязательно опробую программку SpeechKit.
Если она сама знаки препинания ставит, то это будет для меня большим плюсом. Так как я часто пользуюсь голосовым набором текста на Android от разработчиков google. Правда она имеет небольшой минус, те самые знаки препинания приходиться проставлять вручную. А это время занимает. Иногда кажется, что пальчиками написать было бы быстрее.

05.07.2015 в 09:51

Обязательно поделитесь своим опытом, будет всем интересно.

Татьяна
07.07.2015 в 15:17

Артем, проблема только со знаками препинания при голосовом наборе, а в словах ошибки не допускаются?

Григорий
18.07.2015 в 20:49

2 недели прошло. Проверили?

06.07.2015 в 05:01

Да, конечно.

06.07.2015 в 13:17

Буду ждать, да и читателям будет интересно.

Григорий
18.07.2015 в 20:49

Да мы ждем, ждем…

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *