воскресенье, 10 февраля 2013 г.

расстояние между точками в метрике равно

Манхэттенова метрика названа так потому-что отражает расстояние, которое нужно пройти в крупном городе с перпендикулярными улицами, когда можно двигаться только параллельно осям координат.

Эвклид против Манхэттена

Вопрос как получить численную оценку близости вкуса критика и вашу? Есть бесконечно много метрик, которые это определяют. Две самые простые это Эвклидова (расстояние между двумя точками из школьной программы) и Манхэттенова (в честь района Нью-Йорка).

У первого кинокритика все оценки совпадают, кроме одной. Но эта оценка сильно отличается. У другого все оценки немного отличаются. Вопрос кто из них ближе.

Кинокритик 2:| 4 | 6 | 8

Кинокритик 1:| 5 | 8 | 4

Ваши оценки:| 5 | 8 | 7

Например, вот таблица двух кинокритиков

Начнем с простого примера. Мы каждую субботу ходим в кино. Однако, чтобы не ходить на кота в мешке мы предварительно читаем колонку кинокритики в 5-6 газетах. В последнее время нам лень читать 5 газет и нам нужно выбрать одну, оценки кинокритика которой максимально похожи на ваши. Т.е. ваши вкусы и вкусы кинокритика максимально совпадают.

Выбор лучшего критика

Мы будем считать что все оценки по 10ти бальной шкале от 1 до 10. Для любой шкалы это верно, хотя чем больше в ней вариантов оценок тем лучше. Однако для оценок a у меня есть сомнения что она будет работать. Для оценок «мне нравится» или «покупки» метод будет работать, однако, есть другие варианты.

Мы считаем что средняя оценка любого фильма статистически достоверна (у фильма много голосов), как средняя оценка любого критика (критик много раз голосовал). Мы можем прогнозировать эти два значения и часть критиков и фильмов с малым числом оценок убрать из рейтинга.

Хотя пользователи и критики находятся в одной базе и пересекаются нам удобнее называть их по разному. Если у пользователя есть один голос, то мы можем что-то предсказать. Но критик с одним голосом бесполезен. Также можно добавить в качестве критика средний рейтинг фильмов или рейтинг по IMDB и кинопоиску.

Пользователя для которого мы будем считать оценку мы будем называть пользователем.

Пользователя на основе которого считаются оценки мы назовем критиком

Нам нужно используя оценки других пользователей предсказать оценку фильма для текущего пользователя. Т.е. наша задача сводится к прогнозированию оценок конкретного пользователя.

В прошлых статьях я затрагивал тему простых рейтингов. В комментариях меня попросили расписать тему рейтингов, которые выдают для каждого пользователя свои.

О создании персональных рейтингов. Вроде IMHO.net

6 сентября 2012 в 18:59

О создании персональных рейтингов. Вроде IMHO.net / Хабрахабр

Комментариев нет:

Отправить комментарий