Еженедельно обновляемые блоги и инструменты для людей, работающих с данными.

Наука о данных

Что такое объяснимый ИИ и зачем он нужен?

www.datasciencecentral.com
Представьте себе, что передовой истребитель патрулирует вражескую зону конфликта, и вдруг на радаре появляется тележка, агрессивно ускоряющаяся на них. Пилот,…

Обработка естественного языка в Apache Spark с использованием NLTK (часть 2/2)

towardsdatascience.com
В первом блоге (Обработка естественного языка в Apache Spark с использованием NLTK (часть 1/2)) из двух серий блогов я рассказал об обработке естественного языка, NLTK в Spark, настройке среды и…

Помимо линейной регрессии: введение в GLM

www.genevievehaies.com

Исходя из опыта работы со статистикой, мой первый набег на науку о данных и машинное обучение был связан с линейной регрессией. В то время я искренне верил, что не существует такой сложной задачи статистического моделирования, которую нельзя было бы решить с помощью правильно определенной модели линейной регрессии.

Инжиниринг данных

10 лучших сайтов с бесплатными наборами данных

towardsdatascience.com
Если вы новичок, который еще не попробовал свои силы в проектах по науке о данных, ваш возможный переход от отправной точки без опыта к столь исключительно желанной цели, называемой эксперт

Как использовать большие данные и облачные вычисления для вашего бизнеса?

www.hadoop360.datasciencecentral.com
Сегодня две самые популярные технологии — это большие данные и облачные вычисления, которые принципиально отличаются друг от друга. С одной стороны, большие данные — это работа с…

Как автоматически определить количество кластеров в ваших данных — и не только

www.datasciencecentral.com
Определение количества кластеров при неконтролируемой кластеризации — непростая задача. Многие наборы данных не имеют четко разделенных кластеров, и два ч…

Программирование

Как сделать цикл Pandas в 71803 раза быстрее

towardsdatascience.com
Если вы используете Python и Pandas для анализа данных, вскоре вам захочется использовать цикл в первый раз. Однако даже для небольших DataFame использование стандартного цикла и…

Какой язык программирования следует изучить в первую очередь специалистам по данным?

towardsdatascience.com
Когда я начал свою первую настоящую работу в качестве дипломированного актуарного аналитика еще в 2000-х годах, первое, что сделал мой босс, это вручил мне копию The Little SAS Book и сказал, чтобы я преподавал сам САС. Я…

Команда R или команда Python?

www.genevievehaies.com

Общепризнанная истина заключается в том, что специалист по данным, хорошо разбирающийся в информатике и статистике, должен нуждаться в языке программирования».

BI и аналитика

11 библиотек визуализации данных Javascript на 2019 год

blog.bitsrc.io
Лучшая визуализация dData и построение графиков в Javascript. Создавайте диаграммы и графики в Интернете или на мобильных устройствах: D3js, threejs, chartjs, Echarts, metrics-graphics, React-vis, Metabase, NVD3, Chartist, Highcharts и др.

Аналитика данных — это сложно… Вот как вы можете преуспеть

towardsdatascience.com
Мне очень понравилось работать с данными. Еще со второго курса я уже знал, что хочу использовать технологии для решения реальных бизнес-задач. Это дает мне смысл работать, и я надеюсь, что это делает для…

Чем отличается аналитика от статистики?

towardsdatascience.com
Статистика и аналитика — это две отрасли науки о данных, у которых много общих героев, поэтому иногда пиво по-прежнему посвящено оживленным спорам о том, где провести границу между…