В прошлый вторник, 13.03.2018, я решил начать свой первый проект NLP (Обработка естественного языка). Проект Gabiroo - приложение "Хорошие новости". На основе нескольких анализов настроений, доступных в Интернете, я попытаюсь создать классификатор «хороших» новостей. Цитируемый товар указывает на личный критерий того, насколько хороши некоторые новости. Я использую свою личную учетную запись Twitter, чтобы получать новости из 30 учетных записей Twitter с широким диапазоном политической / экономической ориентации. На данный момент я создал простой скрипт и пользовательский интерфейс для классификации новостей. Получив столько новостей, которых, как мне кажется, будет достаточно для обучения некоторого алгоритма НЛП (который, как я полагаю, составляет около миллиона твитов), я начну этап обработки данных и, наконец, этап машинного обучения.

Отобранные вручную хорошие новости уже размещены здесь (https://twitter.com/projeto_gabiroo). Он на бразильском португальском языке, но, если этот проект работает правильно, я постараюсь как можно скорее адаптировать его к английскому языку.

Помимо самого проекта, этот пост также является моим первым постом на Medium, и я решил записать здесь свои достижения, чтобы улучшить свои письменные навыки и отслеживать то, что я сделал до сих пор.

Если у вас есть вопросы, предложения, комментарии и т. Д., Не стесняйтесь обращаться ко мне! Я с нетерпением жду возможности услышать все, что вы хотите сказать.

Надеюсь скоро вас увидеть!

Спасибо за прочтение!

FORTE ABRAÇO !!!