Я играю с FastText
, https://pypi.python.org/pypi/fasttext , что очень похоже на Word2Vec
. Поскольку это довольно новая библиотека с небольшим количеством встроенных функций, мне было интересно, как извлечь морфологически похожие слова.
Например: model.similar_word("dog")
-> собаки. Но встроенной функции нет.
Если я наберу model["dog"]
Я получаю только вектор, который можно использовать для сравнения сходства косинусов. model.cosine_similarity(model["dog"], model["dogs"]])
.
Должен ли я сделать какой-то цикл и выполнить cosine_similarity
для всех возможных пар в тексте? На это нужно время...!!!