Я делаю онлайн-движок для рекомендательных фильмов. Я провел некоторые исследования и думаю, что лучший способ реализовать это — использовать корреляцию Пирсона и создать таблицу с полями item1, item2 и корреляции, но проблема в том, что после каждой оценки элемента у меня есть для восстановления корреляции в худшем случае для N записей (где N — количество элементов).
Еще одна мысль, которую я прочитал, — это следующая статья. , но я не придумал, как это реализовать.
Итак, каково ваше предложение по оптимизации этого процесса? Или любые другие предложения? Спасибо.