Что такое наука о данных и почему вас это должно волновать?

Мир меняется. Все виды новых технологий на горизонте. Вы когда-нибудь задумывались, откуда Amazon точно знает, какие книги вам могут понравиться? Как Pinterest определяет, какие «булавки» могут вас заинтересовать. Как Apply Music или Spotify находят новые песни, в которые вы точно влюбитесь. Как у этих машин все это выходит? Как наши устройства становятся такими умными? Ответ — наука о данных.

Теперь у нас есть возможность отслеживать каждый щелчок, пролистывание, «лайк» и репост, который мы хотим.

Эти данные содержат огромное количество информации о поведении потребителей и даже общей психологии. Компании имеют огромные объемы Данных и могут делать с ними всевозможные невероятные вещи. Data Scientist: Самая сексуальная работа 21 века. Наука о данных может объявить президентские гонки, может подсказать, какой фильм лучше всего подходит вам, исходя из ваших вкусов и настроения. Netflix обновил свою простую службу рассылки DVD и сделал себе имя нарицательным, применив алгоритмы, которые определяют, какие фильмы вам, скорее всего, понравятся.

Наука о данных может показать вам новую музыку, которая вам понравится, исходя из ваших вкусов и даже настроения. Mercedes-Benz, например, экспериментирует с датчиками сердечного ритма, чтобы определить ваше настроение, чтобы решить, какую музыку играть для вас. Он может сказать, находитесь ли вы в расслабленном настроении и просто хотите немного расслабляющей музыки, или если вы в приподнятом настроении и хотите чего-то более энергичного.

Искусственный интеллект, машинное обучение… все это возможно благодаря науке о данных.

В начале 2000-х бейсбольный менеджер Билли Бин коренным образом изменил способ игры в бейсбол. С помощью статистика из Гарварда Пола ДеПодесты команда «Окленд А» перестала полагаться на неофициальные данные и начала полагаться на точные статистические данные о том, каких игроков покупать.

До Билли Бина, Билла Джеймса и Пола Депосты бейсбол полагался на архаичные критерии и анекдоты, а не на точную статистику. Бейсболистов часто выбирали по таким критериям, как «хорошее лицо»… (лицо, которое бейсбольные скауты могут «просто сказать», будет хорошим игроком). ” или внешний вид игроков, позиция или личная жизнь часто были разбросаны.

Перейдя от «интуитивного подхода» к подходу, в большей степени основанному на данных, «Окленд А» (одна из самых бедных команд в бейсболе в то время) смогли идти ноздря в ноздрю с «Янкиз», несмотря на тот факт, что у «Янкиз» была бюджет, который был почти в 15 раз больше, чем у Oakland As. В результате его эксперимента вся игра в бейсбол изнутри.

Это было изображено в популярном фильме 2011 года с Брэдом Питтом и Джона Хиллом в главных ролях. Прежде чем идти дальше, ознакомьтесь с этими клипами Moneyball, потому что они важны для понимания того, какое влияние интеллектуальный анализ может оказать на ваши результаты. Рекомендую посмотреть клипы, даже если смотрели фильм.

Посмотрите эти короткие видеоролики, чтобы ощутить силу науки о данных.

(Обратите внимание, есть спойлеры, но они не испортят фильм, если вы хотите посмотреть фильм полностью.)

Поэтому неудивительно, что с такими результатами компании стремятся найти хороших аналитиков данных.

Так где же научиться этому бесценному навыку? Ну, это, вероятно, одно из лучших времен в истории, чтобы освоить такой навык. С появлением Open Courseware и MOOC (массовых открытых онлайн-курсов) вы можете посещать занятия профессоров Лиги плюща, не выходя из собственной кухни (брюки не обязательны!) О, и я упомянул самое приятное? Большинство из них бесплатны. Вы можете буквально бесплатно посещать занятия профессоров Лиги плюща в нижнем белье. Это прекрасное время, чтобы быть живым. Большинство колледжей Лиги плюща размещают огромное количество курсов на таких сайтах, как edX и Coursera.

Итак, вернемся к науке о данных.

Вы можете посещать эти занятия бесплатно или получить сертификат за 441,90 долларов США (цена на момент написания этой статьи).

Сертификат по науке о данных | Harvard Extension — Гарвардская школа повышения квалификации

У Гарварда отличная узнаваемость бренда, и он отлично смотрится в резюме, но могут быть и лучшие способы изучения этого ценного навыка. Дэвид Вентури из freeCodeCamp рассказал, как он отказался от одной из лучших программ по компьютерным наукам в стране, чтобы создать свою собственную программу по науке о данных, используя лучшие онлайн-курсы. Он написал серию статей, в которых оценил каждый курс «Введение в науку о данных в Интернете на основе тысяч точек данных». Дэвид Вентури получает дополнительные баллы за удивительную иронию в том, что он использует науку о данных для рейтинга лучших в мире курсов по науке о данных.

Его выбор для класса № 1 по науке о данных? Кирилл Еременко Data Science A-Z™, простой курс, в котором используется бесплатное программное обеспечение Tableau, которое отлично подходит для начинающих.

Дэвид говорит:

Курс Data Science A-Z™ Кирилла Еременко на Udemy является явным победителем с точки зрения широты и глубины охвата процесса обработки данных среди 20+ курсов, которые прошли квалификацию. Он имеет средневзвешенный рейтинг 4,5 звезды из 3071 отзыва, что делает его одним из самых рейтинговых и наиболее рецензируемых курсов из рассмотренных. В нем описывается весь процесс и приводятся примеры из реальной жизни. При 21 часе контента это хорошая продолжительность. Рецензентам нравится подача преподавателя и организация контента. Цена варьируется в зависимости от частых скидок Udemy, поэтому вы можете приобрести доступ всего за 10 долларов.

И отмечает, что один рецензент заявляет:

Кирилл - лучший учитель, которого я нашел в Интернете. Он использует примеры из реальной жизни и объясняет распространенные проблемы, чтобы вы лучше поняли курсовую работу. Он также дает много информации о том, что значит быть специалистом по данным, от работы с недостаточными данными до представления вашей работы руководству C-класса. Я настоятельно рекомендую этот курс для начинающих студентов и аналитиков данных среднего уровня!

Хотя в этих курсах используется программное обеспечение «укажи и щелкни», если вы хотите углубиться в науку о данных, некоторые знания в области компьютерного программирования неизбежны. Но не волнуйтесь, есть несколько замечательных классов для этих навыков. Дэвид подробно описывает их в других своих статьях:

Лучшие курсы по науке о данных в Интернете, ранжированные по вашим отзывам https://medium.freecodecamp.org/the-best-data-science-courses-on-the-internet-ranked-by-your-reviews–6dc5b910ea40

https://medium.freecodecamp.org/an-overview-of-every-data-visualization-course-on-the-internet–9ccf24ea9c9b

Все курсы по машинному обучению в Интернете, ранжированные по вашим отзывам https://medium.freecodecamp.org/@davidventuri

Если вы хотите изучать науку о данных, пройдите несколько из этих классов по статистике https://medium.freecodecamp.org/if-you-want-to-learn-data-science-take-a-few-of-these-statistics. -классы–9bbababab098b9

Если вы хотите изучать науку о данных, начните с одного из этих классов программирования https://medium.freecodecamp.org/if-you-want-to-learn-data-science-start-with-one-of-these- классы программирования-fb694ffe780c

Некоторые другие рекомендуемые ресурсы — это книга Умные данные: использование науки о данных для преобразования информации в понимание от Wiley Publishing. В этой книге используются простые инструменты, такие как Excel, для обучения пользователей анализу данных, а затем мягко облегчается изучение кода.

Excel обычно не используется в науке о данных, но он объясняет это в своей книге:

Электронные таблицы — не самые привлекательные инструменты. По сути, это Уилфорд-Бримли-продажа-Колониал-Пенн в мире аналитических инструментов. Совершенно несексуальный. Извини, Уилфорд.

Но в этом суть. Электронные таблицы остаются в стороне. Они позволяют вам видеть данные и касаться (или, по крайней мере, нажимать) данные. Там свобода. Чтобы научиться этим техникам, вам нужно что-то обычное, что-то понятное всем, но, тем не менее, что-то, что позволит вам двигаться быстро и легко, когда вы учитесь. Это электронная таблица

Другими замечательными ресурсами являются серия O’Reily Media по науке о данных, в первую очередь R для науки о данных и Поваренная книга R Graphics: практические рецепты визуализации данных.

Удачи и приятного анализа!