Нейросеть DeepMind от Google научилась «читать по губам»

02.12.2016

Искусственный интеллект DeepMind, созданный сотрудниками Google, а также изобретателями Оксфордского университета, по-прежнему продолжает развиваться с невероятной скоростью. Поступала информация, что он уже пробует играть в различные видеоигры, а процесс его обучения практически не нуждается в контроле человеком. А совсем недавно ИИ овладел способностью чтения по губам.

Специалисты установили в нейросеть новый продвинутый алгоритм LipNet, также разработанный учеными Оксфордского университета. Это инновационная система, позволяющая распознавать мимику человека. После инсталляции DeepMind пришлось «посмотреть» множество различных BBC-шоу, таких как BBC Breakfast, Newsnight и Question Time, состоящих примерно из 120-ти тыс. предложений. В общем счете на это потребовалось около 5-ти тыс. часов.

После этого ИИ научился «читать по губам», даже тогда, когда человек волнуется, невнятно говорит или «проглатывает» части слов. Далее был проведен эксперимент, в ходе которого ИИ вместе с квалифицированным специалистом по распознаванию речи просмотрели по 200 совершенно случайно подобранных отрывков видео. В результате человек сумел правильно установить всего 12,5% информации, в то время как DeepMind не допустил ошибок в 46,8%.

Ученые надеются, что благодаря этим разработкам удастся помочь людям, страдающими проблемами со слухом, ведь технологию LipNet наверняка получится использовать в мобильных приложениях и других виртуальных ассистентах.

Напоминаем, что Google постоянно обновляет магазин своих приложений. Так совсем недавно появилось новое приложение Google PhotoScan, с которым Вы сможете легко оцифровать свои старые фото.



Похожие новости
30.03.2018
Какие изменения ждут нас в Google Partners?

Google Partners ждут перемены. Некоторые его разделы будут удалены, однако большинство из них будет перенесено на обновленный сайт AdWords. Узнайте, какие ресурсы будут недоступны уже в апреле 2018.