Порой, листая ленту рекомендаций, например, во ВКонтакте, мы сталкиваемся с непонятыми постами: их не лайкали друзья, никто из знакомых на эти группы или этих людей не подписан, и вы уж точно не интересовались каким-то товаром, который назойливо мелькает у вас в ленте изо дня в день. Так в чем же дело, и почему разные платформы часто предлагают то, что вам абсолютно не нужно? Все дело в коллаборативной фильтрации — алгоритмы пытаются угадать, что вам может понравиться. Для бизнеса рекомендательные алгоритмы — это PR-агент, которому не нужно платить (или нужно, но не так много). Технология позволяет поднять объем продаж на новый уровень за счет демонстрации релевантного контента узкой аудитории. Самим пользователям такая система тоже в целом выгодна, так как они тратят меньше времени на поиски необходимого. Но даже когда нам кажется, что алгоритмы «сломались», на самом деле это не так — технология просто экспериментирует с вашими предпочтениями. Разберемся в этом детальнее. Как мы уже выяснили, суть коллаборативной фильтрации заключается в прогнозировании пользовательских предпочтений с одной оговоркой: система учитывает интересы и других посетителей платформы. На основе собранных данных о том, на какие кнопочки и баннеры вы жмякали, алгоритмы уже выбирают, какой товар или запись рекомендовать вам. Этот способ применяют специалисты из многих крупных компаний вроде Amazon, AliExpress или Netflix. Пользователь российского интернет-сегмента чаще сталкивается с этим во ВКонтакте или Facebook. Система работы коллаборативной фильтрации проста — ее можно разобрать на примере онлайн-кинотеатра IVI. Пользователь регистрируется и начинает смотреть «Криминальное чтиво». После этого платформа предлагает ему другие фильмы, основываясь на предпочтениях других зрителей, которые интересовались этой кинолентой. С таким же подходом сайт делает подборки, например, по жанрам, актерам, режиссерам и т.д. При этом чем больше времени вы проводите на сайте, тем больше платформа узнает о ваших вкусах и точнее попадает в них. Выставление оценок товарам или кино повышает точность персональных рекомендаций в будущем. Есть разные виды коллаборативной фильтрации Первый используется наиболее часто и основан «на соседстве» — алгоритмы подбирают для пользователя людей с похожими интересами, и на основе того, что они кликают, сортируют потенциально интересующий контент. Это могут быть предпочтения не только людей из вашего персонального френдлиста в соцсети, но и друзья друзей. Если речь идет, скажем, об онлайн-магазине, то более вероятно, что в первую очередь алгоритм попытается изучить ваши интересы на основе геолокации и того, чем интересуются люди вокруг вас. В другом случае алгоритм предлагает вам контент на основании статистики и оценок пользователей — технология ориентируется по семантике, байесовской статистике, кластеризации и прочих методах, основанных на расчетах. Технология использует интеллектуальный анализ данных, выявляя определенные закономерности. К слову, этот вид прогнозирования используется чаще всего, так как он более точен и использует скрытые факторы. Например, время, проведенное в сети, или анализ пользовательской активности. Скажем, если вы заходите в сеть в восемь утра или в шесть вечера, это может быть полезно рекламодателям. Вероятно, такие детали очень важны — это объясняет дороговизну использования этого способа. Наконец, третий вариант коллаборативной фильтрации — гибридный. Он особенно полезен для интернет-магазинов и других коммерческих платформ, так как в этом случае увеличивается точность таргетинга и учитывается фактор «соседства», о котором мы писали выше. В любой системе есть недостатки И в этой тоже. Один из главных недочетов, в первую очередь для рекламодателей — мошенники и недобросовестные конкуренты, играющие в темную. Возьмем хотя бы возможность оценивать товар: никто не застрахован от того, что на сайт придут бизнес-оппоненты и оставят плохие отзывы на продукцию, а на своем ресурсе, напротив, разместят хорошие рекомендации. Есть и обратная ситуация, когда большая часть покупателей или пользователей не ставят оценок и не пишут отзывов. Следовательно, при отсутствии какой-то обратной связи алгоритмам сложнее подобрать релевантные рекомендации. Так называемый «холодный старт» можно отнести туда же. Это относится к тем случаям, когда на платформу приходит новый пользователь, о котором система еще совсем ничего не знает, а значит, и не может ничего порекомендовать. Порой коллаборативная фильтрация работает «криво» из-за схожестей в данных. Проще всего это разобрать на примере онлайн-кинотеатра. Скажем, есть фильмы про сыщиков и фильмы про детективов. В сущности, это все одно и то же — один и тот же жанр. Но искусственный интеллект не умеет выявлять скрытые связи на таком уровне, потому будет разделять эти фильмы на разные категории и сортировать по разным библиотекам. Это не критичный недостаток, но все же если бы была возможность навести в условной библиотеке больше порядка, платформа рекомендовала бы больше фильмов, а значит, удерживала внимание пользователя на своем ресурсе дольше. Так или иначе, в этом и заключается ее главная цель. Окей, а кто применяет все эти алгоритмы и для чего? Пожалуй, первое, что приходит на ум — конечно, соцсети. Метод коллаборативной фильтрации в них встроен по умолчанию — это база, на которой основывается построение «умных» новостных лент, в которых вы видите посты не по дате публикации, а по степени вашей вовлеченности. Скажем, чаще всего вы заходите в три паблика с фотографиями котиков, а группы по советам начинающим дизайнерам далеко не в топе ваших подписок. Вполне логично, что алгоритмы будут в первую очередь предлагать вам в ленте очаровательных пушистых, а не очередной онлайн-урок. Дело, опять же, в удержании вашего внимания. Аналогично работает и Instagram — к слову, там эти изменения произошли относительно недавно. Сейчас в ленте на первый план выходят посты людей, которых вы чаще всего лайкаете или заходите к ним в профиль. Следствием таких перемен стало и увеличение количества контекстной рекламы, в том числе в сторис. Интересовались недавно новым пальто в одном из бизнес-аккаунтов? Пожалуйста! Завтра, пока будете листать истории друзей, вам обязательно попадутся две-три похожие странички с новыми элементами гардероба. Таргетинг — страшная вещь :) YouTube также подбирает видео в рекомендациях на основе того, что вы уже посмотрели. Кроме того, платформа предлагает вам новые посты от блогеров, которые по контенту похожи на тех, за творчеством которых вы уже следите какое-то время. Напомним, по такому же принципу работают сейчас и онлайн-кинотеатры, и интернет-магазины. Вывод Конечно, применение коллаборативной фильтрации — далеко не панацея для построения и расширения бизнеса. Тем не менее, эта система работает, и работает хорошо, особенно в социальных сетях. Для мастеров маникюра и начинающих фотографов этот способ — один из самых простых, доступных и дешевых. Кроме того, если раньше основой для алгоритмов были интересы исключительно пользователя, который в итоге оказывался запертым в некотором информационном вакууме, то сейчас он получает более разнообразный контент и доступ к новой информации, которая порой даже может идти вразрез с его кругозором.