Я нахожу косинусное сходство между документами .. Я сделал это вот так
D1 = (8,0,0,1), где 8,0,0,1 - оценки tf-idf терминов t1, t2, t3, t4
D2=(7,0,0,1)
cos (тета) = (56 + 0 + 0 + 1) / sqrt (64 + 49) sqrt (1 +1)
что оказывается
соз (тета) = 5
Теперь, что я могу оценить по этому значению ... Я не понимаю, что означает cos (theta) = 5 о схожести между ними ... Правильно ли я делаю?