Компания Google анонсировала очень крупное обновление своей поисковой системы. Она трудилась над ним в течение нескольких лет. По словам Google, готовящиеся к запуску нововведения станут самым большим прорывом на рынке поиска информации в интернете.
Поисковик Google станет самообучаемым, интеллектуальным и сможет делать то, что до сих пор не умеет ни одна поисковая система в мире — воспринимать запросы на естественном языке. Все существующие решения не учитывают того, что у слов может быть несколько значений, поэтому результат выдачи может получаться нерелевантным. BERT анализирует не только основные слова, но и вспомогательные (например, предлоги), а также числа и другие символы, которые могут оказаться важными для правильного нахождения результатов.
Технология BERT была анонсирована в ноябре 2018 года. Google уже использует её в собственных дата-центрах, но до сих пор она была доступна только сотрудникам компании. В скором времени Google внедрит её в поисковик, который работает на сайте google.com и в мобильном приложении Google. На первом этапе BERT работает только с запросами на английском языке, в будущем алгоритм научится распознавать запросы на других языках. В настоящее время эта технология тестируется в двух десятках стран.
С помощью BERT поисковая система превратится в помощника, которые будет точно отвечать на вопросы. Например, если сейчас ввести в Google запрос «Можно ли получить лекарство по чужому рецепту», поисковик покажет статьи, в которых рассказывается о том, как получить рецепт на лекарства. BERT гораздо лучше понимает цель запроса, поэтому выведет в первую очередь те статьи, в которых рассказывается о том, в каких случаях можно выкупать лекарства в аптеках по рецептам, выписанных на родственников.
Google отмечает, что в некоторых случаях даже BERT не может правильно проанализировать поисковый запрос. Например, если спросить «Какой штат находится к югу от Небраски», BERT ответит «Юг Небраска» (окрестность в Тампе, штат Флорида), хотя очевидно, что правильный ответ — Канзас. Для того, чтоб подобные ошибки не возникали, требуется более глубокий анализ значения слов и их сочетаний, которые пока недоступны искусственному интеллекту.