Публикации по теме 'data-science-for-ml'


Сценарии обработки данных, часть 2: Работа с отсутствующими значениями в наборе данных
Методы вменения отсутствующих значений данных В последней статье мы обсудили 3 общие и типичные ситуации, с которыми сталкиваются при обработке данных: оптимизация чтения файлов CSV с большим количеством ненужных столбцов, использование метода карты для создания столбцов новых категорий и поиск пустых строк в вашем DataFrame, которые не помечены как null. Однако другой общей характеристикой реальных данных является наличие пропущенных значений - другими словами, неполный набор..

Передаточные функции для машинного обучения, упрощенные
Введение в передаточные функции Эта статья - отрывок из моего недавнего исследования передаточных функций и операций машинного обучения. В этом посте я, в основном, установлю основные принципы этих двух различных концепций и исследую их взаимосвязь друг с другом. Я всегда понимал алгоритмы машинного обучения как простую взаимосвязь между переменной X и Y, где X - входные данные, а Y - результат обучения. Общая полиномиальная связь между X и Y ограничена следующей функцией: В..

Советы и рекомендации по анализу данных с помощью Pandas
Советы и хитрости, которые сделают вашу жизнь с вашими данными / пандами проще Pandas - это библиотека Python с открытым исходным кодом, построенная на основе NumPy . Pandas, вероятно, самая популярная библиотека для анализа данных в Python. Это позволяет выполнять быстрый анализ, а также очистку и подготовку данных. Одним из удивительных аспектов Pandas является то, что он может хорошо работать с данными из самых разных источников, таких как: таблицы Excel, файлы CSV, файлы SQL..

Понимание математики, лежащей в основе линейной регрессии, часть II
Изучение линейной регрессии: математические основы, преимущества и ограничения Во второй части этого обзора основ линейной регрессии мы продолжим с того места, где остановились. Если вы не читали часть 1 , я настоятельно рекомендую вам это сделать. В части 1 мы обсудили регрессию на высоком уровне и выполнили проектирование функций в наборе данных Facebook-Comment-Prediction. Наша цель - предсказать количество комментариев к сообщению с учетом различных функций. После..