Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.

Наука о данных

Дешевое создание классификаторов НЛП с помощью трансферного обучения и слабого контроля

medium.com
Эффективное создание антисемитского классификатора твитов без общедоступного набора данных путем сочетания слабого контроля и трансферного обучения.

Обработка естественного языка в Apache Spark с использованием NLTK (часть 1/2)

towardsdatascience.com
В самой базовой форме обработка естественного языка — это область искусственного интеллекта, которая исследует вычислительные методы для интерпретации и обработки естественного языка в текстовом или…

10 методов машинного обучения, которые должен знать каждый специалист по данным

www.datasciencecentral.com
Фото chuttersnap на Unsplash Машинное обучение — горячая тема в исследованиях и промышленности, где постоянно разрабатываются новые методологии. Скорость и…

Инжиниринг данных

Как подготовить данные обзора фильмов для анализа настроений

machinelearningmastery.com

Подготовка начинается с простых шагов, таких как загрузка данных, но быстро усложняется из-за задач очистки, которые очень специфичны для данных, с которыми вы работаете. Вам нужна помощь в том, с чего начать и в каком порядке выполнять шаги от необработанных данных до данных, готовых для моделирования.

Как очистить текст для машинного обучения (с помощью Python)

machinelearningmastery.com

Вы не можете сразу перейти от необработанного текста к модели машинного обучения или глубокого обучения. Сначала вы должны очистить свой текст, что означает разделение его на слова и обработку пунктуации и регистра.

Изучение Spark с использованием Python: основы и приложения

mlwhiz.com
В этом посте представлен обзор того, как вы можете использовать Spark для своих ежедневных задач с большими данными. Начинается с основ и знакомит вас с преобразованиями и действиями, которые составляют основу инфраструктуры Spark.

Программирование

40 лучших вопросов и ответов на собеседовании по Python

www.guru99.com
1) Что такое Python? Каковы преимущества использования Python? Python — это язык программирования с объектами, модулями, потоками, исключениями и автоматическим управлением памятью. Преимущества питонов в том, что

Создайте свой первый чат-бот с помощью Python NLTK

towardsdatascience.com
«Чат-бот (также известный как разговорный бот, чат-бот, бот, бот для обмена мгновенными сообщениями, интерактивный агент или искусственный диалоговый объект) — это компьютерная программа или искусственный интеллект, который проводит…

Практическое введение в парсинг веб-страниц на Python

realpython.com
Изучите основы парсинга веб-страниц с помощью Python, используя пакеты requests и BeautifulSoup.

BI и аналитика

3 потрясающих метода визуализации для каждого набора данных

mlwhiz.com
Несколько потрясающих визуализаций с использованием Seaborn, которые стоит попробовать с каждым набором данных, с которым вы сталкиваетесь.

Исследователи данных, 5 графических алгоритмов, которые вы должны знать

mlwhiz.com
В этом посте я расскажу о некоторых наиболее важных графовых алгоритмах, которые вы должны знать, и о том, как их реализовать с помощью Python.

5 советов по принятию лучших бизнес-решенийwww.datasciencecentral.com
Сегодняшняя бизнес-среда как никогда конкурентна. С объединением цифровых и физических предприятий для создания комплексной экосистемы товаров…