Привет!!! Добро пожаловать обратно!

Несколько недель назад мы запустили нашу седьмую когорту в AI Saturday Lagos - и мы в восторге! Для тех, кто нас не знает, AI Saturday Lagos - это сообщество по обучению искусственному интеллекту в Нигерии, которое я начал со своим приятелем Азизом Олувафеми в 2018 году. Мы предлагаем бесплатные занятия и провели более 100 занятий. на темы, связанные с ИИ. До COVID-19 занятия проводились очно, а сегодня все встречи виртуальные. 7-я когорта уже на 3-й неделе лекций. Вам стоит взглянуть на нашу структуру - я считаю, что это фантастика! Моя команда приложила много усилий для этого ❤️

Сегодня я хочу поделиться с вами множеством определений Data Science в том виде, в каком они разворачивались на одном из наших классов в этой когорте😅. Было интересно узнать, как по-другому наши студенты думают о науке о данных.

Чтобы дать определение Data Science, один из студентов помог нам с определением самой науки 😌.

Наука - это интеллектуальная и практическая деятельность, заключающаяся в систематическом изучении структуры и поведения физического и природного мира посредством наблюдения и эксперимента.

Как видно из приведенного выше определения, все, что претендует на звание науки, должно быть чем-то, что можно изучать, наблюдать и экспериментировать. Чтобы уточнить, я цитирую абзац из книги Дэвида Донохо 50 лет науки о данных.

There are diverse views as to what makes science, but three constituents will be judged essential by most, viz:
(a1) intellectual content,
(a2) organization in an understandable form,
(a3) reliance upon the test of experience as the ultimate standard of validity

Теперь перейдем к определениям :)

Наука о данных использует данные, анализируя их, делая из них выводы и создавая на их основе решения.

Наука о данных - это в основном область, которая включает использование статистики и вычислений для решения или понимания реальных проблем.

Наука о данных - это наука о сборе структурированных или неструктурированных данных для извлечения из них информации, которая, в свою очередь, используется для принятия решений.

Data Science - это наука о данных

Для меня Data Science означает применение статистических инструментов для получения информации из данных и использования ее в настоящем или будущем.

Наука о данных - это процесс обработки данных и их визуализации в реальном мире.

Наука о данных - это процесс превращения необработанных данных с использованием вычислительных и статистических методов во что-то полезное для людей.

Наука о данных - это междисциплинарная область, которая использует научные методы, процессы, алгоритмы и системы для извлечения знаний и идей из зашумленных, структурированных и неструктурированных данных, а также применяет знания и практические идеи из данных в широком диапазоне областей применения.

Наука о данных - это искусство решать проблемы реального мира, делая выводы из данных.

Я считаю, что лучше всего управлять (сбор, обработка и т. Д.) Данными и манипулировать ими для достижения определенных целей с использованием любых знаний (математика, программирование, статистика и т. Д.), Которые сделают общий процесс более эффективным.

Data Science - это исследование данных, позволяющее извлечь из них понимание

Для меня Data Science использует огромные объемы данных для принятия лучших решений - используя статистику и визуальные эффекты.

Я считаю, что наука о данных - это способ использования таких данных, как статистическая информация, чтобы помочь понять и найти решение проблем, которые могут быть решены только с помощью статистики.

Наука о данных связана со сбором данных и извлечением из них значимой и интересной информации с помощью некоторых инструментов машинного обучения.

Наука о данных - это метод, используемый для анализа структурированных или неструктурированных данных.

Наука о данных - это сбор и обработка данных для получения аналитических сведений и прогнозов.

Наука о данных использует передовую аналитику, научные методы, статистику, математику и программирование для получения информации, скрытой в данных.

Лично я считаю, что наука о данных включает в себя как анализ данных, так и машинное обучение, когда проводится очистка и исследование данных, чтобы получить представление о конкретной проблеме, тем самым создавая модели, которые могут лучше всего решить проблему в будущем.

Для меня наука о данных - это исследование, в котором сочетаются навыки программирования и знания математики для извлечения значимой информации из данных.

Наука о данных - это область исследования, которая сочетает в себе опыт в предметной области, навыки программирования, а также знания математики и статистики для извлечения значимой информации из данных.

Поскольку машинное обучение - это построение моделей для решения проблем, означает ли это, что это наука о данных или это часть науки о данных?

Чтобы сделать класс еще более интересным, я спросил их, совпадают ли машинное обучение и наука о данных. Ниже приведены некоторые ответы студентов.

Я считаю, что машинное обучение относится к науке о данных, но наука о данных - это не машинное обучение, потому что это более широкая область.

Я думаю, это потому, что это гораздо больше, чем просто что-то одно. Машинное обучение - это всего лишь одна сторона - разработка новых алгоритмов на основе существующих / данных. Но Data Science включает в себя гораздо больше, включая обработку данных, гипотезы, визуализацию и т. Д.

Я думаю, что машинное обучение есть в науке о данных, потому что машинное обучение создает алгоритмы для обучения.

Наука о данных использует инструменты машинного обучения

Наука о данных - это не машинное обучение, потому что это гораздо больше, некоторые аспекты науки о данных не обязательно нуждаются в машинном обучении.

В DS больше внимания уделяется статистике, чем в ML. Типичные профили, работающие в качестве инженера машинного обучения, имеют опыт работы в CS, в то время как специалисты по данным могут иметь опыт работы в науке и бизнесе, используя статистику и бизнес-накопители.

Можно быть инженером машинного обучения, реализующим математические модели без глубокого понимания, в то время как специалисты по данным не могут / не должны разбираться в данных, не понимая математических концепций, лежащих в основе.

Я думаю, что наука о данных - это сбор данных и т. Д., В то время как машинное обучение - это использование этих данных для прогнозирования результата.

Машинное обучение - это приложение искусственного интеллекта, которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования, в то время как DS - это прогностический анализ для лучшего принятия решений.

Наука о данных - это не машинное обучение. Это гораздо шире. Машинное обучение - это разновидность науки о данных. Хотя они взаимосвязаны, когда дело доходит до прогнозирования посредством построения моделей и использования алгоритмов, поскольку машинное обучение использует данные, полученные в результате рабочего процесса науки о данных.

Наука о данных требует, чтобы человек мыслил нестандартно, пытаясь найти закономерности в данных, что требует глубокого понимания после ответа на вопросы, которые задает ситуация в реальном мире. Анализ данных, интеллектуальный анализ данных, инженерия данных, визуализация данных также являются подгруппами науки о данных, потому что машинное обучение требует результата данных, полученных в результате этих процессов.

Нам было очень весело в классе, обсуждая Data Science и что значит быть Data Scientist. Мы также рассмотрели такие инструменты, как proGender, который был разработан Беном Шмидтом, профессором истории из Северо-Восточного университета. Инструмент использует 14 миллионов отзывов с сайта RateMyProfessor.com и подсчитывает количество вхождений различных терминов на миллион слов в обзорах профессоров мужского и женского пола. Мы запрашивали такие слова, как амбициозный, строгий и т. Д. Я должен признать, что выбор слов определенно не был случайным, но, к счастью, я смог определить нашу предвзятость до того, как она поразила нас.

Мы также рассмотрели еще один инструмент, разработанный одним из наших выпускников Чизурум Олоронду, под названием NBA Players. Цель этого инструмента - ограничить время, необходимое поклоннику НБА или любознательному человеку, чтобы найти полезные факты о текущих активных игроках в НБА.

В заключение, для меня и моей команды большая честь обучать таких разнообразных, любопытных и невероятных людей. Многие из них являются экспертами в разных областях, но хотят расширить свои навыки или даже поменять карьеру. Настоящая решимость, рвение, настойчивость и сила воли наших учеников действительно вдохновляют.

Теджу, ты можешь брать все уроки… Мне нравится твоя энергия - очень добрым тоном.

Я думаю, что ученик может передумать после того, как его взорвет моя команда. У нас действительно лучшие инструкторы😌. Я с нетерпением жду работы с этой удивительной группой людей в течение следующих 14 недель.

Большое спасибо моей невероятной команде, без которой эта магия затерялась бы в пещерах простого воображения❤❤

Спасибо, что добрались до конца. Посетите наш репозиторий, чтобы узнать больше о нашей структуре cohort7. Вы используете Spotify? Какая твоя любимая песня? Послушайте наш Плейлист Spotify - вы также можете добавить в него свои любимые песни. Хотели бы вы разместить свою статью в нашем среднем издании? Посмотрите этот документ

Мы социальные сети, подпишитесь на нас❤

  1. Twitter: https://twitter.com/aisaturdaylagos
  2. LinkedIn: https://www.linkedin.com/company/aisaturdayslagos
  3. Youtube: https://www.youtube.com/c/AISaturdaysLagos
  4. Github: https://github.com/AISaturdaysLagos
  5. Средний: https://medium.com/@AI6Lagos
  6. Instagram: https://www.instagram.com/aisaturdayslagos/
  7. Facebook: https://www.facebook.com/aisaturdayslagos
  8. Подпишитесь на нашу рассылку новостей: https://mailchi.mp/fac720d0b7cc/join-ai6-list

использованная литература

[1] http://www.datasciencecourse.org/notes/intro/

[2] http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf