Публикации по теме 'data-visualization'


Как нанять специалиста по данным: названия должностей
Один из вопросов, который мне задавали мои друзья, компании которых начинают набирать обороты: как нанять специалиста по обработке и анализу данных? Многие компании еще не уверены, нужен ли он им и с чего вообще начать. В этом посте я расскажу, какое название должности использовать и в чем различия. Первое, что нужно понять при найме специалиста по данным, — это тип навыков, которые вы ищете. В Microsoft большая часть кода, который мы писали как специалисты по обработке и анализу..

Фрагменты методов выбора функций
Три метода выбора функций, чтобы улучшить ваш результат. В машинном обучении и статистике используется выбор признаков , также известный как выбор переменных , выбор атрибутов или выбор подмножеств переменных — это процесс выбора подмножества соответствующих функций (переменных, предикторов) для использования при построении модели. В машинном обучении у нас есть три метода выбора признаков. Универсальный выбор Важность функции Корреляционная матрица с тепловой картой..

Сводная статистика может обмануть.
На всякий случай позвольте представить вам квартет Энскомба. Он состоит из четырех наборов данных, которые имеют аналогичную статистическую сводку. У них одинаковые показатели центральной тенденции, корреляции и даже одна и та же модель линейной регрессии. Они похожи во всех отношениях. Однако вы добавляете визуализацию данных, и начинает появляться совершенно другая история. В следующем блоге вы найдете подробные заметки о наборе данных и его визуализации с использованием библиотек..

Пять способов провести четверг
К моему некоторому удивлению, мои предыдущие анализы Американского исследования использования времени в конечном итоге выявили наши сходства, а не различия. Оказывается, мы все-таки не такие уж разные. Полагаю, что в этом есть надежда. Однако до сих пор я смотрел в основном на поведение более высокого уровня, сравнивая пять, десять или двадцать различных видов деятельности. Есть еще кое-что, чтобы покопаться. На самом детальном уровне ATUS предоставляет отчеты о 170 000 дней за 13..

8 советов по лучшей визуализации данных
8 советов по лучшей визуализации данных Практические советы по улучшению вашего GGPlot Ggplot - лучший пакет визуализации данных R. Его популярность, вероятно, объясняется простотой использования - всего несколько строк кода, вы можете создавать отличные визуализации. Это особенно хорошо для новичков, которые только начинают свой путь в R, так как очень обнадеживает то, что вы можете создать что-то визуальное с помощью всего двух строк кода: ggplot(data = iris, aes(x =..

Красивые пользовательские палитры с Matplotlib
Повысьте уровень своей игры с диаграммами с помощью настраиваемых цветовых карт в соответствии с вашей темой. Если вашей диаграмме Matplotlib нужна палитра, а вы не используете встроенную карту, скорее всего, у вас будут плохие времена. Раньше я боялся редактировать палитру в Python. Каждая ветка справки, на которую я смотрел, показывала разные подходы, и ни один из них не соответствовал моей ситуации. Это всегда разочаровывало, потому что цветовые карты могут значительно изменить..

H2o.ai (один из худших «стартапов» Кремниевой долины)
Я делюсь своим опытом с одним из худших стартапов в Bay Area, H2o.ai . Чем плохи эти "люди"? Позвольте мне сказать вам. Их Glassdoor должен стать первым тревожным сигналом. Согласно анонимным отзывам сотрудников, большинство ситуаций сводится к плохому управлению, высокому эго и исключительной дружбе между начальством. Вернемся к моему личному опыту; Я посетил один из хакатонов H2o.ai по найму. Пришло небольшое количество людей, 10–15 человек, и у них было две задачи. Задача на..