24 ноября 2016 | 16:36

Нейросеть Google читает по губам лучше людей

0 230

И опять нейросеть Google сделала невероятное: учёные Оксфордского университета «научили» DeepMind очень точно читать по губам. Искусственный интеллект так хорошо натаскали, что он справляется с поставленной задачей лучше специалистов рода человеческого: коэффициент удачного распознавания машины — 46,8%, у человека — 12,4%. При этом в отчёте говорится, что ИИ совершал незначительные ошибки, которые не мешали общему восприятию текста.

Чтобы добиться внушительных результатов, ученые показали нейросети Google более 5000 часов видео, которые содержали около 118 тысяч предложений на английском языке. В основном DeepMind тренировался на губах дикторов новостных телепередач с канала BBC.

К слову, в Оксфорде и до этого трудились над созданием ПО, для распознавания речи людей по губам, назывался проект LipNet. Коэффициент правильного распознавания той программы — 93,4% против человеческих 52,3%. Высокий показатель предыдущего эксперимента объясняется более простыми условиями: дикторы читал заготовленный текст из шаблонных фраз. Нейросеть Google выдала более 40% работая со случайными видеороликами.

нравится
+11 11 голосов
не нравится
в избранное

комментарии

0