В Корнельском университете изобрели камеру, которая считывает команды по движению подбородка.
Камеру протестировали на 20 участниках говорящих на разных языках: английский и китайский. Половина из них говорили на английском. Первые 10 беззвучно проговорили 54 фразы, которые включали команды и цифры. На китайском языке было «сказано» 44 слова. Это стало коротким обучением для «умной» камеры. В итоге точность распознавания на английском составила 90,5%, а на китайском 91,6%. Эксперимент проводился в неподвижном состоянии, поэтому когда распознавание речи велось на ходу, точность значительно снизилась из-за разницы в движениях и походки.
Исследователи считают, что проблема решается если камеру чуть больше «натаскать» на различные варианты произношений и технически доработать разрешение и частоту кадров. Если поразмышлять на тему развития такой технологии, устройство можно синхронизировать с голосовым синтезатором. Это помогло бы людям лишенных возможности говорить. Например, с помощью искусственного интеллекта о котором мы рассказывали ранее. Его голос неотличим от живого человека и очень реалистично признается в любви.