Специалисты Google DeepMind совместно с учеными из Оксфордского университета разработали систему глубокого обучения для чтения информации по губам человека, - передает Robotics.ua.

Ход исследования

Во время тестирования инженеры испытывали систему на основе более 100 000 предложений из 5 тыс. часов программ BBC. Искусственный интеллект наблюдал за динамкой губ ведущих и научился точно расшифровывать ключевые слова. Например, такие фразы, как "мы знаем, что сотни журналистов здесь" или "согласно последним данным Управления Национальной статистики".

По информации Robolovers, система показала впечатляющие результаты: около 50% слов были распознаны без ошибок по сравнению с человеческими показателями в аналогичной задаче – 12,4%.
"Мы думаем, что системы для чтения по губам имеют очень большой потенциал в будущем", - заявил Яннис Ассаэль, один из авторов проекта.

Читайте также: DeepMind заставляет ИИ учиться ещё быстрее

Видео