Я начал изучать науку о данных совсем недавно, около двух месяцев назад. У меня нет степени в области статистики, математики, обработки данных, инженерии, экономики или чего-либо подобного. Если честно, в студенческие годы математика и статистика не были моей сильной стороной. Я лучше разбирался в языках. Это могло бы быть мифом, чтобы сказать, что некоторые люди более лингвисты, чем математики, или наоборот, но это то, что я чувствовал.
Я изучал менеджмент на степень бакалавра и курирование на степень магистра. Я написал диссертацию, но она была больше ориентирована на обзор литературы, чем на применение количественных методов исследования. А в моде работаю мерчендайзером, покупателем. Так что на протяжении всего моего образования и опыта я не был так близок с математикой и статистикой.
Тогда почему я вообще изучаю науку о данных? Меня так заинтриговала концепция извлечения информации из данных. Настолько заинтригован, что даже решил преодолеть свой давний страх перед математикой и статистикой. Учитывая, что мы создаем такой же объем данных до 2003 года всего за два дня (сейчас это может быть даже 10 минут), и анализируется только 1% из них, поле полно возможностей. Мне нужно быть частью этого, - вот что я думал и до сих пор верю в это.
MOOC (курсы Coursera)
Исчисление один (на уроках математики я не уделял особого внимания и определенно нуждался в переподготовке.)
Базовая статистика (я слышал об этом раз или два, но не мог сказать, что что-то знаю) < br /> Python для всех (это очень рекомендуемая специализация (5 курсов), если вы, как и я, не обладаете техническими знаниями, это хорошее введение в программирование на Python)
Каналы Youtube
Есть разные категории, которые могут вам пригодиться.
Первый тип - «учебный».
Машинное обучение
- Сирадж Раваль (мнения расходятся, но я все же считаю, что это хорошая закуска)
- Харрисон Кинсли (опять же, могут быть разные мнения)
В целом, они хороши для начала, но я чувствовал, что эти типы руководств на Youtube могут быть немного предвзятыми в отношении того, как они подходят к решению проблемы, как они берутся за это. - Welch Labs (У них есть хорошие учебные пособия по Учимся видеть, Демистификация нейронных сетей. Учебники предназначены для начинающих, поэтому я нашел видео чрезвычайно полезными, чтобы понять основные принципы концепций. . Даже если у них не так много видео, их определенно стоит посетить)
Статистика
Математика
- Mathbff (когда вы сталкиваетесь с математическим термином, с которым вы не знакомы, или математическими правилами, которые вы не можете запомнить, это хороший источник. Тригонометрия, производные, цепные правила и т. Д.)
Python
Python Чака Северанса для всех
Второй тип - «конференция».
Некоторые материалы может быть непросто усвоить новичку, но не помешает увидеть, что находится на горизонте, каковы последние разработки, темы в науке о данных.
- PyData
- Наука открытых данных
- Фестиваль науки о данных
- Scipy: научные вычисления с Python
- О’Рейли
- "Перейти к"
- Разработчики Google
- KDD 2016, KDD 2017 (личная сфера интересов: мода встречает машинное обучение)
Третий - собственный канал школ и учебных центров по обработке и анализу данных на Youtube.
- "Генеральная Ассамблея"
- Додзё Data Science
Последний - Ted Talks. Я такой любитель разговоров с Тедом. Поэтому я поместил ее в отдельную категорию от обычных конференций.
Отличные спикеры на самые разные темы, я всегда открываю что-то новое, осознаю то, чего не знал, вдохновляюсь, мотивирую, это просто заставляет меня хотеть быть лучше человека. Он может не научить вас, как построить алгоритм, но он может сказать вам, почему и для чего.
Между прочим, у Ted Talks два разных названия. «TED Talks» и «Tedx Talks». Я не знал разницы, пока не погуглил.
Разница между мероприятиями TED и TEDx заключается в том, что первые используют более глобальный подход, а вторые обычно фокусируются на местном сообществе, которое концентрируется на местных голосах. «Официально« x в TEDx обозначает независимо организованное мероприятие TED, но это больше похоже на умножение TED. Это та сила, которая распространила TED по всей планете и посеяла семена всех этих сообществ ».
Если вы выполните поиск ted на Youtube, первая запись, которую вы получите, - это TED Talks на Youtube-странице.
https://www.youtube.com/user/TEDtalksDirector
У которой 7,9 миллиона подписчиков с 2488 видео (10.01.2017)
А на 17-й записи в результатах поиска появляется страница TEDx Talks.
https://www.youtube.com/user/ TEDxTalks
У которого 8,9 миллиона подписчиков с 99 031 видео (10.01.2017)
В любом случае, ниже приведены некоторые из разговоров, которые мне действительно понравились.
- Мы все специалисты по данным | Ребекка Ньюджент | TEDxCMU
- Важнейшие навыки специалистов по данным | Хосе Мигель Кансадо | TEDxIEMadrid
- Покажи мне данные - стань экспертом в себе | Талития Уильямс | TEDxClaremontColleges (Не конкретно о науке о данных, но учит думать как статистик. Концепция сбора данных о вашем теле с течением времени звучит как интересная задача)
- Повышение значимости данных благодаря повествованию | Бен Веллингтон | TEDxBroadway (Рассказчик данных, как построить содержательную историю с данными)
- Вес данных | Джер Торп | TEDxVancouver (Это очень интересный доклад художника по обработке данных о том, как видеть данные в контексте человека) - У него также есть средний аккаунт blprnt
Я планирую обновлять список по мере нахождения более полезных источников. Я надеюсь, что это поможет любому, кто находится в такой же ситуации, как я. Во второй части я перечислю подкасты и блоги как источники для изучения науки о данных.