Я работаю над фреймворком pyspark, который выглядит, как показано ниже
id | category |
---|---|
1 | A |
1 | A |
1 | B |
2 | B |
2 | A |
3 | B |
3 | B |
3 | B |
Я хочу разложить столбец категорий и подсчитать их появление. Итак, результат, который я хочу, показан ниже
id | A | B |
---|---|---|
1 | 2 | 1 |
2 | 1 | 1 |
3 | Null | 3 |
Я попытался найти в Интернете что-то, что могло бы мне помочь, но не смог найти ничего, что могло бы дать мне такой конкретный результат.