У нас есть некоторые неструктурированные текстовые данные в нашем хранилище данных движка приложения. Я хотел создать единое облако тегов одного свойства для подмножества объектов хранилища данных. Оглядевшись вокруг, я не вижу ни одного фреймворка, который позволил бы мне сделать это, не написав его самостоятельно.
То, как я имел в виду, было:
- Напишите функцию карты (как в функции уменьшения карты), чтобы просмотреть каждый объект определенного типа в хранилище данных,
- Разбить текстовую строку на слова
- Для каждого слова увеличивается счетчик
- Используйте окончательные подсчеты для создания облака тегов с помощью стороннего программного обеспечения (в автономном режиме - приветствуются любые предложения)
Поскольку я никогда не делал этого раньше, я бродил, во-первых, есть ли какая-то структура, которая делает это для меня (пожалуйста), если нет, то правильно ли я подхожу к этому. то есть, пожалуйста, не стесняйтесь указывать на зияющие пробелы в плане.