Я пытаюсь рассчитать различия между продуктами и пользователями, чтобы использовать их в системе рекомендаций.
Данные находятся в двух столбцах с несколькими строками, их необходимо преобразовать в строки как пользователи и столбцы как продукты.
Я безуспешно пробовал функцию приведения из пакета reshape.
library(dplyr)
library(reshape2)
library(tidyr)
library(reshape)
data <- tibble("customerId" = c(1,2,3,4,1,1), productId = c(10,11,12,10,11,10))
Я хочу преобразовать его в этот формат:
10 11 12
1 1 1 0
2 0 1 0
3 0 0 1
4 1 0 0
Моя основная проблема сейчас заключается в том, что когда у нас есть повторяющаяся запись, она должна учитываться только один раз, поэтому у нас есть значения 0-1.