Публикации по теме 'reddit'


Классификация сообщений Reddit с помощью обработки естественного языка и классификатора случайного леса
В моем предыдущем посте я рассказал вам о процессе анализа данных для использования машинного обучения для кластеризации футбольных команд . В этом посте я покажу, как я использовал обработку естественного языка (NLP) и классификацию случайного леса для классификации сообщений Reddit из каналов субреддита Toyota и Honda . Мы определим, из какого субреддита пришло сообщение, используя только заголовок сообщения. Чтобы справиться с этим, я использовал процесс науки о данных:..

Машинное обучение с Reddit и влияние алгоритмов сортировки на сбор данных и модели
В рамках своего иммерсивного курса по науке о данных в General Assembly я разработал модель классификации на Python, используя обработку естественного языка и базовые методы машинного обучения. Эта модель определяла бы происхождение сообщения Reddit, если бы оно было из субреддита /r/futurology или /r/worldnews , хотя модель можно обобщить для сравнения других субреддитов. Модель сработала, обычно определяя, какой пост принадлежит примерно в 83–91% случаев. Что меня заинтересовало после..

Классификация текстов и анализ тональности на r / SGExams
Использование Support Vector Machines и VADER (словарь Valence Aware Dictionary и sEntiment Reasoner) Введение Два месяца назад я закончил CS50 «Введение в искусственный интеллект» с использованием курса Python. Во время курса меня особенно заинтриговала концепция анализа настроений, извлечения функций из текстовых данных и перехода в алгоритмы машинного обучения для определения эмоционального тона. Я решил заняться проектом, который включает в себя классификацию текста и анализ..

Позвольте мне помочь вам найти свое сообщество в Reddit!
Позвольте мне помочь вам найти свое сообщество в Reddit! Пока я сижу здесь и пишу свой блог, мой компьютер выполняет слишком много итераций, чтобы получить около 20 000 сообщений с Reddit! Я совсем не жалуюсь, так как мой MacBook Pro раз за разом превосходил мои ожидания на протяжении всего этого путешествия! Если вы разбираетесь в Интернете и следите за новостями в социальных сетях, вы наверняка слышали о Reddit! Среди 1,2 миллиона субреддитов насчитывается около 138 000 активных..