Поднимитесь над обычным - список литературы по науке о данных

Часовой спринт для чтения в день, чтобы ваши знания были широкими и актуальными.

В одной из самых быстрорастущих отраслей быть специалистом по обработке данных без исследовательской группы может быть недееспособным. В конце прошлого года я понял, что часто упускаю новые разработки в отрасли, бессознательно изобретаю велосипед и терплю неудачу в беседах с экспертами. Поскольку я работал консультантом по науке о данных, уровень моего стресса резко возрос, поскольку я постоянно чувствовал себя недостаточно подготовленным к встречам с клиентами.

В качестве своей цели на 2020 год я решил освободиться от этого стресса.

«Лучше всего знать, чего ты не знаешь. Думать, что вы знаете, когда не знаете, - это болезнь. Признать эту болезнь болезнью - значит избавиться от нее ». - Лао-цзы

Из этой цитаты вытекает довольно простая стратегия: читая больше, я должен быть в курсе новостей, связанных с ИИ. Это, в свою очередь, увеличивает мою уверенность в том, что могу участвовать в различных обсуждениях, связанных с ИИ.

С января я начал регулярно читать блоги и подкасты, чтобы оставаться актуальным. Каждый будний день, после йоги и медитации, и перед тем, как встать в 10 утра, я посвящаю час чтению, выпивая первую чашку кофе.

У меня есть ОКР Inbox Zero, поэтому я сократил подписку, чтобы получать то, что мне нужно, не утопая в информации. Как ведущий консультант по науке о данных в компании, специализирующейся на развертывании машинного обучения, я убедился, что мой список чтения может поднять меня по трем направлениям:

Вещи, о которых будут заботиться руководители ИИ (мои клиенты): состояние отрасли ИИ, состояние отрасли клиентов, тип материалов, публикуемых Gartner и McKinsey.
Вещи, которые сделают мою работу более эффективной: новые библиотеки, новая архитектура, улучшение некоторых математических навыков / навыков программирования.
Вещи, с которых можно начать разговор: забавные истории об искусственном интеллекте, новости стартапов, конкуренты.

В основном я читаю из списков рассылки и подкастов, на которые я подписан. Компромисс между тем, чтобы кто-то достал ваш список для чтения, - это время, потраченное на поиск вещей для чтения, и качественный материал для чтения, который на 100% соответствует вашим интересам.

Я придумываю эту подписку, но она постоянно меняется в зависимости от моих потребностей. Сейчас, когда мир закрывается, а работа на дому становится нормой, я надеюсь, что этот список может вдохновить вас на то, чтобы начать свой график чтения. Воспользуйтесь возможностью, когда за вами постоянно не скрывается ни один менеджер и не смотрит на ваш экран.

📩 Списки рассылки:

Я составляю список исходя из целевой аудитории, времени чтения и того, что мне нравится в нем. Конечно, целевая аудитория - это просто рекомендация, и время чтения сильно зависит от того, сколько ссылок вы нажимаете и как далеко вы продвигаетесь по кроличьей норе. Я буквально могу потратить весь свой час чтения на изучение одной статьи.

В любом случае. А вот и

1. Пакет от deeplearning.ai

The Batch: новый еженедельный информационный бюллетень от deeplearning.ai!
Добро пожаловать в The Batch, новый еженедельный информационный бюллетень от deeplearning.ai! Пакет представляет наиболее важные события ИИ и… www.deeplearning.ai

The Batch - еще одно детище Эндрю Нг, и оно напоминает мне о работе исследовательской группы. Каждую неделю группа представляет 6 хорошо написанных статей о последних достижениях в области глубокого обучения.

👥 Целевая аудитория: ученые, исследователи и энтузиасты глубокого обучения.

⏱ Время чтения: ~ 30 минут (еженедельно)

⭐ Что мне в нем нравится: он исключительно хорошо организован. Статьи собраны из различных источников и содержат подробное изложение того, что это такое, как работает, почему это важно, что стоит за новостями и что о них думают редакторы.

2. Обзор Harvard Data Science Review

Harvard Data Science Review
В качестве платформы открытого доступа Гарвардской инициативы в области науки о данных, Harvard Data Science Review (HDSR) включает… hdsr.mitpress.mit .edu

Я не могу объяснить это лучше, чем первый абзац на сайте, который гласит:

Harvard Data Science Review (HDSR) - платформа открытого доступа в рамках Гарвардской инициативы в области науки о данных, в которой представлены основные принципы мышления, основные этапы исследований, образовательные инновации и основные приложения. Он направлен на публикацию контента, который помогает определить и сформировать науку о данных как научно строгую и глобально значимую междисциплинарную область, основанную на принципиальном и целевом производстве, обработке, синтаксическом анализе и анализе данных.

👥 Целевая аудитория: для всех есть столбец

⏱ Время чтения: более 60 минут (ежемесячно)

⭐ Что мне в нем нравится: есть хороший веб-сайт, на котором информация упорядочена по типу аудитории, которую она привлекает. Существует панорама для видений и дискуссий, столб, посвященный образованию в области науки о данных, и различные рубрики по истории, лидерам отрасли, теориям и т. Д.

3. Среднесуточный дайджест

Средняя - узнайте больше о том, что для вас важно.
Среда не похожа ни на одну другую платформу в Интернете. Наша единственная цель - помочь вам найти интересные идеи… medium.com

👥 Целевая аудитория: как начинающие, так и ведущие специалисты и инженеры по обработке данных.

⏱ Время чтения: ~ 20 минут (ежедневно)

⭐ Что мне в нем нравится: вы можете легко настроить то, что читаете, и он имеет широкий спектр содержания. Кроме того, многие популярные библиотеки и инструменты также имеют собственный профиль на Medium. Я получаю новости о Project Jupyter через Jupyter Blog, и впервые я узнал о Streamlit на Medium. Мне также очень нравится читать комментарии к статьям, и я обнаружил, что у Medium больше всего комментариев, и сообщество в целом хорошее.

Так как я также подписываюсь на публикации, не связанные с наукой о данных, это помогает мне дать мозгу отдохнуть, прочитав кое-что еще. Однако я считаю, что рекомендации смещены в сторону статей за платной стеной.

4. Информационный бюллетень O’Reilly Data & AI

Получите информационный бюллетень O’Reilly Data - O’Reilly Media
В среднем четыре из пяти звезд из 1969 оценок Будьте в курсе. Получайте еженедельные обзоры от инсайдеров отрасли, плюс… www.oreilly.com

Информационный бюллетень O’Reilly - это еженедельный обзор отраслевых новостей. Существует широкий спектр тем, от чисто технических до того, как руководить группами по анализу данных и другой бизнес-информации.

👥 Целевая аудитория: технические лидеры и профессионалы отрасли.

⏱ Время чтения: ~ 20 минут (еженедельно)

⭐ Что мне в нем нравится: по сравнению с другими списками рассылки, на которые я подписан, в информационном бюллетене О’Рейли гораздо больше статей о состоянии [x]. Эти статьи хорошо проработаны и содержат интересные графики и забавную статистику, на которую можно ссылаться. Я также считаю, что этот информационный бюллетень включает больше статей о типах разработки данных и машинного обучения. Кстати, Data и AI - это два отдельных информационных бюллетеня.

5. Новости KDNuggets

Подпишитесь на новости KDnuggets ™ - KDnuggets
Подпишитесь на рассылку новостей KDnuggets: Электронная почта: Имя: (необязательно) KDnuggets - ведущий сайт по машинному обучению, данным… www.kdnuggets.com

Этот информационный бюллетень разделен на избранные статьи, события / вебинары, новости, учебные пособия и мнения. Я считаю, что KDNuggets является хорошей отправной точкой для специалистов по данным, которые только начинают свою карьеру, или людей, которые хотят попасть в науку о данных.

👥 Целевая аудитория: более молодые специалисты по обработке данных.

⏱ Время чтения: ‹10 минут (ежедневно)

⭐ Что мне в этом нравится: Иногда я не понимаю, как это связано, но я получаю отчеты от таких компаний, как DataRobot, Gartner и Figure8, в свой почтовый ящик через KDNuggets. Мне нравятся отчеты такого типа, поскольку они содержат достаточно подробный анализ и хорошую статистику и визуализацию, подтверждающую их утверждения.

🎧 Подкасты:

Я слушаю подкасты, когда собираюсь утром или когда готовлю ужин вечером. Я ужасно умею выполнять несколько задач одновременно, поэтому я выбрал подкасты с хорошим интересным контентом, но при этом за которыми легко следить.

1. Линейные отступления

Линейные отступления
ищите меня lineardigressions.com

Кэти и Бен - ведущие «Линейных отступлений». Шоу охватывает понемногу обо всем: науке о данных, машинном обучении, интерпретируемости моделей, карьерной траектории и т. Д. Кэти - консультант по науке о данных, поэтому я считаю, что ее примеры и образ мышления очень помогают мне в общении с моими клиентами.

👥 Целевая аудитория: как начинающие, так и ведущие специалисты и инженеры по обработке данных. Большой привет инженерам, потому что Бен помогает проводить очень хорошие параллели между наукой о данных и миром разработки программного обеспечения.

⏱ Время прослушивания: 20–30 минут (еженедельно)

⭐ Что мне в нем нравится: стиль разговора между соведущими делает его очень легким и интересным прослушиванием. Например, слушать, как ваши друзья говорят о BERT, намного интереснее, чем слушать, как ваш профессор говорит о BERT. Бен задает проницательные вопросы, и Кэти объясняет их простыми и понятными терминами, которые я могу понять - обычно, жонглируя между нарезкой моркови и жаркой стейков.

2. Скептик данных

Data Skeptic
Ваш надежный подкаст, посвященный науке о данных, машинному обучению и искусственному интеллекту. Подключайтесь еженедельно к… dataskeptic.com

В подкасте Data Skeptic есть ряд тем, связанных с наукой о данных, статистикой, машинным обучением и т. Д. Шоу выбирает тему и подробно освещает ее в течение нескольких месяцев - одним из которых я внимательно следил, были фейковые новости и НЛП. Кайл, ведущий, особенно увлечен научными методами и применением критического мышления при решении проблем.

👥 Целевая аудитория: как начинающие, так и ведущие специалисты и инженеры по обработке данных.

⏱ Время прослушивания: 20–50 минут (еженедельно).

⭐ Что мне в нем нравится: обычно есть общая тема, которая работает для нескольких эпизодов, темы широко раскрыты. Начальные эпизоды хороши для ознакомления и новичков, и по мере развития темы содержание становится сложным, но увлекательным.

3. Выставка данных O’Reilly.

Подкаст O’Reilly Data Show - O’Reilly
Подкаст O’Reilly Data Show: Эван Чан о первых днях Spark + Cassandra, FiloDB и облачных вычислений. … www.oreilly.com

Шоу исследует возможности и методы, управляющие большими данными, наукой о данных и искусственным интеллектом. В каждом выпуске ведущий Бен Лорика берет интервью у ведущих профессионалов отрасли, чтобы рассказать о своем опыте в реальной жизни.

** Я также только что понял, что это шоу, похоже, прекращено, но у ведущего есть новый подкаст под названием Обмен данными. Я все же считаю, что эпизоды шоу O’Reilly Data Show стоит послушать!

👥 Целевая аудитория: профессионалы отрасли, больше ориентированные на инженеров машинного обучения, поскольку многие эпизоды связаны с развертыванием моделей.

⏱ Время прослушивания: 20–50 минут (еженедельно).

⭐ Что мне в нем нравится: гости шоу очень хорошо осведомлены и уважаемы в своих областях. Очень интересно слышать о разнообразных проблемах, с которыми сталкиваются компании, и еще интереснее учиться на их опыте.

Это все, что нужно для моего списка чтения по науке о данных

Надеюсь, этот пост добавит контент в ваш почтовый ящик или вдохновит вас составить список для чтения самостоятельно.

Я всегда слежу за хорошими информационными бюллетенями и подкастами, пожалуйста, оставляйте комментарии к хорошим материалам, чтобы я мог следить за ними.

Спасибо за чтение ⭐ Подписывайтесь на меня в Medium, LinkedIn или посетите мой Веб-сайт. Кроме того, если вы хотите оценить структуру развертывания машинного обучения, напишите нам в Melio Consulting.

Поднимитесь над обычным - список литературы по науке о данных

Часовой спринт для чтения в день, чтобы ваши знания были широкими и актуальными.

📩 Списки рассылки:

1. Пакет от deeplearning.ai

2. Обзор Harvard Data Science Review

3. Среднесуточный дайджест

4. Информационный бюллетень O’Reilly Data & AI

5. Новости KDNuggets

🎧 Подкасты:

1. Линейные отступления

2. Скептик данных

3. Выставка данных O’Reilly.

Это все, что нужно для моего списка чтения по науке о данных

Вопросы по теме