YouTube рассказал об устройстве и совершенствовании рекомендаций
Видеохостинг YouTube показал, как устроены и совершенствуются его рекомендации. По словам вице-президента видеохостинга Кристоса Гудроу, именно рекомендации дают большую половину всех просмотров, ведь они побуждают человека посмотреть тот или иной видеоролик. Время просмотра, нажатия, пользовательские опросы, лайки и дизлайки, ссылки на контент — вся эта информация учитывается при подборке видеороликов.
Основная задача рекомендаций — облегчить юзерам поиск видеороликов, которые будут представлять для них интерес. Рекомендации находятся на главной странице сайта и на панели «Следующее».
Система рекомендаций была разработана в 2008 г., но тогда принцип ее работы заметно отличался от сегодняшнего дня. К примеру, пользователи видели в рекомендациях только те ролики, которые набирали больше всего просмотров и были популярными. Не было персонального «подстраивания» под определенного пользователя, поэтому контент мог быть для человека абсолютно «чужим». В те годы пользователи осуществляли мало переходов по рекомендованным видео, поэтому львиную часть просмотров YouTube получал из поиска и внешних ссылок.
Сейчас YouTube идет по иному пути: в 2021 г. он обрабатывает миллиарды видеороликов, учитывая интересы каждого юзера. В отличие от иных интернет-ресурсов, ориентирующихся на социальную активность человека, видеохостинг старается спрогнозировать желания юзера, и учитывая это, рекомендует ему соответствующие видео.
После того как система сравнит действия юзера в сервисе с другими людьми, имеющими похожее поведение, и проанализирует полученные данные, она подберет человеку именно те видеоролики, которые будут ему интересны. Следует уточнить, что алгоритм работы рекомендаций в новостных и информационных разделах будет отличаться из-за возрастающей проблемы недостоверной информации.
Также YouTube прекрасно осознаёт, что не все юзеры готовы предоставлять личные данные, поэтому в настройках можно редактировать, удалять и даже временно отключать историю поиска и просмотров на платформе.
Персонализация рекомендаций
Принципы работы рекомендаций на YouTube все время развиваются, обрабатывая и анализируя миллиарды так называемых «сигналов» — информационных объектов. Для определения предпочтений юзеров алгоритмы принимают к сведению следующие сигналы: нажатия, время просмотров, данные пользовательских опросов, лайки и дизлайки, ссылки на контент. Важность каждого сигнала зависит от определенного юзера. К примеру, если человек репостит все видеоролики, которые он посмотрел, то сервис, подбирая рекомендации, не будет брать во внимание отправленные им ссылки. Именно по этой причине у алгоритмов видеохостинга нет строгих правил по подбору рекомендаций, они «подстраиваются» к поведению определенного юзера.
Борьба с фейковой информацией
В последнее время усилилась проблема недостоверной информации. В целях борьбы с таким положением вещей видеохостинг создал улучшения в системе, чтобы она могла обрабатывать видеозаписи с фейковыми данными и спорный контент.
Проверенные видеоролики разделяются от пограничных при помощи классификаторов. Специально обученные люди занимаются оценкой качества контента, добавляемого на видеохостинг. Для этой цели YouTube может прибегнуть и к помощи экспертов (например, к врачам, если видеозапись несет информацию о здоровье).
Для определения спорных видеозаписей специалисты отмечают наличие в них оскорбительной, лживой, неточной, нетерпимой, вредоносной и тому подобной информации. Затем такие видеоролики изымаются из рекомендаций. Эти оценки учитываются системой и в процессе ее обучения.
Вспомним, что годом ранее Google представил юзерам ресурс How YouTube Works, где рассказал о принципах работы поиска, персонализации и рекомендаций на платформе.