Алгоритм Baidu догнал людей в распознавании речи на английском и китайском

Алгоритм Baidu догнал людей в распознавании речи на английском и китайском

Лаборатория искусственного интеллекта (SVAIL) исследовательского подразделения китайской компании Baidu улучшила алгоритм распознавания речи под названием Deep Speech, при этом в некоторых случаях вторая версия программы распознает речь даже быстрее людей. Препринт статьи опубликован на arXiv.org, кратко о прогрессе рассказывает MIT Technology Review.

Разработчикам удалось использовать один алгоритм глубокого обучения для распознавания устной речи на двух языках: английском и мандаринском (крупнейший из китайских). При этом авторы улучшили распознавание английского в шумных местах, а также продвинулись вперед в быстродействии — создали новую аппаратную платформу на видеокартах, в семь раз подняв производительность по сравнению с предыдущей версией сервера для Deep Speech.

Авторы также протестировали Deep Speech 2 на скорость распознавания коротких фраз, сравнив ее с человеческой. Оказалось, что в некоторых случаях (короткие фразы без контекста) алгоритм справляется с распознаванием даже быстрее людей. Тем не менее, Deep Speech 2 все еще уступает людям в распознавании больших фрагментов текста, а также в распознавании речи с акцентом или при большом количестве посторонних шумов.

По словам авторов, система уже готова к применению в онлайн-сервисах и мобильных приложениях и превосходит аналогичные алгоритмы конкурентов. В ближайшем будущем специалисты SVAIL планируют работать в направлении распознавания фраз на английском с акцентом. В частности, исследователи начали обучение нейросети английскому с индийским акцентом.

Один из авторов статьи — Эндрю Ын — известен своими исследованиями в области информатики и искусственного интеллекта. До весны 2014 года работал на Google. Эндрю Ын опубликовал более сотни научных работ и известен как создатель проекта Google Brain и образовательной онлайн-платформы Coursera.

Кроме Baidu обучение нейросетей для улучшения своих продуктов используют и другие компании. Facebook, например, разработала алгоритм, способный узнать человека даже со спины, а Google использует обученную нейросеть для перевода надписей на 27 языков в приложении Google Translate.

Николай Воронцов

N+1

Похожие новости:
Baidu собирается расширятся
Китайский поисковик Baidu выходит на новый уровень международного рынка поиска. Представители Baidu заявили, что они начали проводить тестирование поиска в Египте, Таиланде и Бразилии. Таким образом, они обозначили перед собой новые приоритеты, а именно Baidu начинает наступление ..
2014-01-29 839 0 Интернет, IT
0
В Microsoft создан новый алгоритм распознавания речи
С целью уменьшения отрыва от своих основных конкурентов в лице  Google и Apple на рынке мобильных телефонов, специалисты компании Microsoft провели обширные исследования в области улучшения распознавание речи для людей, которые используют голосовые команды для набора текстовых сообщений ..
2013-06-18 1191 0 Интернет, IT
0
Создан эффективный алгоритм распознавания пешеходов
Исследователи из Калифорнийского университета в Сан-Диего разработали алгоритм распознавания пешеходов в режиме реального времени, который в качестве исходных данных использует только изображение с камеры. Доклад был представлен на конференции ICCV 2015, которая прошла в декабре в Сантьяго. С кратким описанием ..
2016-02-10 1015 0 Интернет, IT
0
Нейросеть Google улучшит качество распознавания речи
Google начнет использовать собственную нейронную сеть для улучшения качества своих коммерческих продуктов. До этого виртуальный "мозг", созданный небольшой группой инженеров из секретной лаборатории компании, работал в экспериментальном режиме. К примеру, его учили самостоятельно распознавать изображения котов ..
2012-10-5 2137 0 Интернет, IT
0
Алгоритм определит правдивость твитов
Twitter остается интересной средой для практического применения математики. Не так давно мир увидел алгоритм, способный предсказывать тренды в этой соцсети. А на днях ученые представили программу, определяющую, содержится ли в твите достоверная информация. Необычный алгоритм использует для определения правдивости сообщения различные ..
2012-12-18 940 0 Интернет, IT
0
Нейросеть Google тренируется на кошках из YouTube
Небольшая группа инженеров из секретной лаборатории Google X добилась успехов в области применения компьютеров для моделирования работы человеческого мозга. Соединив вместе 16 тысяч процессоров, исследователи создали одну из крупнейших искусственных нейронных сетей, способную к машинному обучению. Ученые Google ..
2012-06-26 1513 0 Интернет, IT
0
Google и MIT разработали алгоритм удаления отражений при съемке через стекло
Компания Google и Массачусетский технологический институт (MIT) совместно разработали алгоритм, который позволяет удалять с фотографий отражение, возникающее при съемке через стекло. О задачах, поставленных перед командой исследователей, и принципах действия предложенной ими методики рассказывается в видеоролике, опубликованном ..
2015-08-13 1911 0 Интернет, IT
0
Китайцы против Apple
Сегодня, 19 марта, 22 китайских писателя, в число которых вошел известный в Поднебесной писатель и по совместительству блогер Хань Ханя, подали на американскую компанию Apple в суд. Китайские авторы потребовали от Apple выплатить им компенсацию за то, что их авторские права были явно нарушены ..
2012-03-19 1145 0 Интернет, IT
0
«Яндекс» представил приложение для перевода речи в текст и обратно
Компания «Яндекс» выпустила демонстрационное приложение для мобильных устройств, предназначенное для записи речи в виде текста и его голосового воспроизведения. Об этом говорится в сообщении компании. Приложение работает c использованием трех новых функций технологии распознавания речи, разработанной компанией. Эти функции обеспечивают ..
2014-10-30 2161 0 Интернет, IT
0
Skype освоил синхронный перевод голосовых звонков
Популярный сервис Skype запустил тестовую версию функции Skype Translator, автоматически переводящей речь на другие языки во время голосовых звонков. Об этом «Ленте.ру» сообщили в пресс-службе Skype. «Более десятилетия Skype разрушал географические барьеры, чтобы обеспечивать аудио- ..
2014-12-16 2270 0 Интернет, IT
0
Вести.net: "Яндекс" начал охоту за картинками
"Яндекс" запустил собственный модный в наши дни поиск по картинке. Движок под него готовили довольно давно и анонсировали достижение уже около месяца назад, но официально сервис заработал только на этой неделе. Собственно, что такое поиск по картинке, все уже знают. Пользователь показывает ..
2013-09-13 1035 0 Интернет, IT
0
Создан алгоритм для наведения порядка в социальных связях
Ученые из Стенфордского университета создали алгоритм, который способен автоматически выделять в социальных связях пользователя "круги" коллег, членов семьи или знакомых. Препринт работы доступен в архиве Корнельского университета, краткое ее содержание пересказывает блог Technology Review. В основе ..
2012-11-5 998 0 Интернет, IT
0
Google улучшает поиск и вводит новый алгоритм Hummingbi
В рамках празднования 15-летия Google компания объявила о переходе самого главного своего продукта — поисковика — на новый алгоритм под названием Hummingbird. На самом деле он начал действовать еще месяц назад, но рассказать о некоторых его достоинствах руководство корпорации решило ..
2013-10-1 1021 0 Интернет, IT
1
Панда нового поколения скоро увидит мир
Согласно данным, полученным с конференции SMS West, которая недавно проходила в Калифорнии, команда разработчиков интернет-корпорации Google занимается разработкой нового алгоритма, носящего название Панда «нового поколения». По словам Мэтта Каттса: «Этот алгоритм станет для представителей малого ..
2014-03-17 890 0 Интернет, IT
0
Яндекс научил робота-поэта читать свои стихи вслух
Яндекс расширил возможности проекта Яндекс.Автопоэт, добавив в него функцию «чтения вслух» стихотворений, составленных из поисковых запросов. Об этом сообщается в пресс-релизе, поступившем в редакцию N+1.Голос робота-поэта синтезирован при помощи SpeechKit — это комплекс речевых технологий Яндекса, который включает ..
2016-01-10 1122 0 Интернет, IT
0