Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.
Наука о данных
Дешевое создание классификаторов НЛП с помощью трансферного обучения и слабого контроля
medium.com
Эффективное создание антисемитского классификатора твитов без общедоступного набора данных путем сочетания слабого контроля и трансферного обучения.
Обработка естественного языка в Apache Spark с использованием NLTK (часть 1/2)
towardsdatascience.com
В самой базовой форме обработка естественного языка — это область искусственного интеллекта, которая исследует вычислительные методы для интерпретации и обработки естественного языка в текстовом или…
10 методов машинного обучения, которые должен знать каждый специалист по данным
www.datasciencecentral.com
Фото chuttersnap на Unsplash Машинное обучение — горячая тема в исследованиях и промышленности, где постоянно разрабатываются новые методологии. Скорость и…
Инжиниринг данных
Как подготовить данные обзора фильмов для анализа настроений
Подготовка начинается с простых шагов, таких как загрузка данных, но быстро усложняется из-за задач очистки, которые очень специфичны для данных, с которыми вы работаете. Вам нужна помощь в том, с чего начать и в каком порядке выполнять шаги от необработанных данных до данных, готовых для моделирования.
Как очистить текст для машинного обучения (с помощью Python)
Вы не можете сразу перейти от необработанного текста к модели машинного обучения или глубокого обучения. Сначала вы должны очистить свой текст, что означает разделение его на слова и обработку пунктуации и регистра.
Изучение Spark с использованием Python: основы и приложения
mlwhiz.com
В этом посте представлен обзор того, как вы можете использовать Spark для своих ежедневных задач с большими данными. Начинается с основ и знакомит вас с преобразованиями и действиями, которые составляют основу инфраструктуры Spark.
Программирование
40 лучших вопросов и ответов на собеседовании по Python
www.guru99.com
1) Что такое Python? Каковы преимущества использования Python? Python — это язык программирования с объектами, модулями, потоками, исключениями и автоматическим управлением памятью. Преимущества питонов в том, что
Создайте свой первый чат-бот с помощью Python NLTK
towardsdatascience.com
«Чат-бот (также известный как разговорный бот, чат-бот, бот, бот для обмена мгновенными сообщениями, интерактивный агент или искусственный диалоговый объект) — это компьютерная программа или искусственный интеллект, который проводит…
Практическое введение в парсинг веб-страниц на Python
realpython.com
Изучите основы парсинга веб-страниц с помощью Python, используя пакеты requests и BeautifulSoup.
BI и аналитика
3 потрясающих метода визуализации для каждого набора данных
mlwhiz.com
Несколько потрясающих визуализаций с использованием Seaborn, которые стоит попробовать с каждым набором данных, с которым вы сталкиваетесь.
Исследователи данных, 5 графических алгоритмов, которые вы должны знать
mlwhiz.com
В этом посте я расскажу о некоторых наиболее важных графовых алгоритмах, которые вы должны знать, и о том, как их реализовать с помощью Python.
5 советов по принятию лучших бизнес-решений — www.datasciencecentral.com
Сегодняшняя бизнес-среда как никогда конкурентна. С объединением цифровых и физических предприятий для создания комплексной экосистемы товаров…