Так что есть несколько вопросов по этому поводу, будьте готовы ;-)

  1. вы сами создали этот набор данных? и если да, то не слишком ли меньше? Точность 80% — это хорошо, но вы протестировали только 25 предложений, а реальный сценарий может сильно отличаться.
  2. если ты не сам его создал, то где ты его взял? и где я должен получить доступ к тому же? (Чем больше, тем лучше) Я надеялся получить около 1000 строк