Привет!!! Добро пожаловать обратно!
Несколько недель назад мы запустили нашу седьмую когорту в AI Saturday Lagos - и мы в восторге! Для тех, кто нас не знает, AI Saturday Lagos - это сообщество по обучению искусственному интеллекту в Нигерии, которое я начал со своим приятелем Азизом Олувафеми в 2018 году. Мы предлагаем бесплатные занятия и провели более 100 занятий. на темы, связанные с ИИ. До COVID-19 занятия проводились очно, а сегодня все встречи виртуальные. 7-я когорта уже на 3-й неделе лекций. Вам стоит взглянуть на нашу структуру - я считаю, что это фантастика! Моя команда приложила много усилий для этого ❤️
Сегодня я хочу поделиться с вами множеством определений Data Science в том виде, в каком они разворачивались на одном из наших классов в этой когорте😅. Было интересно узнать, как по-другому наши студенты думают о науке о данных.
Чтобы дать определение Data Science, один из студентов помог нам с определением самой науки 😌.
Наука - это интеллектуальная и практическая деятельность, заключающаяся в систематическом изучении структуры и поведения физического и природного мира посредством наблюдения и эксперимента.
Как видно из приведенного выше определения, все, что претендует на звание науки, должно быть чем-то, что можно изучать, наблюдать и экспериментировать. Чтобы уточнить, я цитирую абзац из книги Дэвида Донохо 50 лет науки о данных.
There are diverse views as to what makes science, but three constituents will be judged essential by most, viz: (a1) intellectual content, (a2) organization in an understandable form, (a3) reliance upon the test of experience as the ultimate standard of validity
Теперь перейдем к определениям :)
Наука о данных использует данные, анализируя их, делая из них выводы и создавая на их основе решения.
Наука о данных - это в основном область, которая включает использование статистики и вычислений для решения или понимания реальных проблем.
Наука о данных - это наука о сборе структурированных или неструктурированных данных для извлечения из них информации, которая, в свою очередь, используется для принятия решений.
Data Science - это наука о данных
Для меня Data Science означает применение статистических инструментов для получения информации из данных и использования ее в настоящем или будущем.
Наука о данных - это процесс обработки данных и их визуализации в реальном мире.
Наука о данных - это процесс превращения необработанных данных с использованием вычислительных и статистических методов во что-то полезное для людей.
Наука о данных - это междисциплинарная область, которая использует научные методы, процессы, алгоритмы и системы для извлечения знаний и идей из зашумленных, структурированных и неструктурированных данных, а также применяет знания и практические идеи из данных в широком диапазоне областей применения.
Наука о данных - это искусство решать проблемы реального мира, делая выводы из данных.
Я считаю, что лучше всего управлять (сбор, обработка и т. Д.) Данными и манипулировать ими для достижения определенных целей с использованием любых знаний (математика, программирование, статистика и т. Д.), Которые сделают общий процесс более эффективным.
Data Science - это исследование данных, позволяющее извлечь из них понимание
Для меня Data Science использует огромные объемы данных для принятия лучших решений - используя статистику и визуальные эффекты.
Я считаю, что наука о данных - это способ использования таких данных, как статистическая информация, чтобы помочь понять и найти решение проблем, которые могут быть решены только с помощью статистики.
Наука о данных связана со сбором данных и извлечением из них значимой и интересной информации с помощью некоторых инструментов машинного обучения.
Наука о данных - это метод, используемый для анализа структурированных или неструктурированных данных.
Наука о данных - это сбор и обработка данных для получения аналитических сведений и прогнозов.
Наука о данных использует передовую аналитику, научные методы, статистику, математику и программирование для получения информации, скрытой в данных.
Лично я считаю, что наука о данных включает в себя как анализ данных, так и машинное обучение, когда проводится очистка и исследование данных, чтобы получить представление о конкретной проблеме, тем самым создавая модели, которые могут лучше всего решить проблему в будущем.
Для меня наука о данных - это исследование, в котором сочетаются навыки программирования и знания математики для извлечения значимой информации из данных.
Наука о данных - это область исследования, которая сочетает в себе опыт в предметной области, навыки программирования, а также знания математики и статистики для извлечения значимой информации из данных.
Поскольку машинное обучение - это построение моделей для решения проблем, означает ли это, что это наука о данных или это часть науки о данных?
Чтобы сделать класс еще более интересным, я спросил их, совпадают ли машинное обучение и наука о данных. Ниже приведены некоторые ответы студентов.
Я считаю, что машинное обучение относится к науке о данных, но наука о данных - это не машинное обучение, потому что это более широкая область.
Я думаю, это потому, что это гораздо больше, чем просто что-то одно. Машинное обучение - это всего лишь одна сторона - разработка новых алгоритмов на основе существующих / данных. Но Data Science включает в себя гораздо больше, включая обработку данных, гипотезы, визуализацию и т. Д.
Я думаю, что машинное обучение есть в науке о данных, потому что машинное обучение создает алгоритмы для обучения.
Наука о данных использует инструменты машинного обучения
Наука о данных - это не машинное обучение, потому что это гораздо больше, некоторые аспекты науки о данных не обязательно нуждаются в машинном обучении.
В DS больше внимания уделяется статистике, чем в ML. Типичные профили, работающие в качестве инженера машинного обучения, имеют опыт работы в CS, в то время как специалисты по данным могут иметь опыт работы в науке и бизнесе, используя статистику и бизнес-накопители.
Можно быть инженером машинного обучения, реализующим математические модели без глубокого понимания, в то время как специалисты по данным не могут / не должны разбираться в данных, не понимая математических концепций, лежащих в основе.
Я думаю, что наука о данных - это сбор данных и т. Д., В то время как машинное обучение - это использование этих данных для прогнозирования результата.
Машинное обучение - это приложение искусственного интеллекта, которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования, в то время как DS - это прогностический анализ для лучшего принятия решений.
Наука о данных - это не машинное обучение. Это гораздо шире. Машинное обучение - это разновидность науки о данных. Хотя они взаимосвязаны, когда дело доходит до прогнозирования посредством построения моделей и использования алгоритмов, поскольку машинное обучение использует данные, полученные в результате рабочего процесса науки о данных.
Наука о данных требует, чтобы человек мыслил нестандартно, пытаясь найти закономерности в данных, что требует глубокого понимания после ответа на вопросы, которые задает ситуация в реальном мире. Анализ данных, интеллектуальный анализ данных, инженерия данных, визуализация данных также являются подгруппами науки о данных, потому что машинное обучение требует результата данных, полученных в результате этих процессов.
Нам было очень весело в классе, обсуждая Data Science и что значит быть Data Scientist. Мы также рассмотрели такие инструменты, как proGender, который был разработан Беном Шмидтом, профессором истории из Северо-Восточного университета. Инструмент использует 14 миллионов отзывов с сайта RateMyProfessor.com и подсчитывает количество вхождений различных терминов на миллион слов в обзорах профессоров мужского и женского пола. Мы запрашивали такие слова, как амбициозный, строгий и т. Д. Я должен признать, что выбор слов определенно не был случайным, но, к счастью, я смог определить нашу предвзятость до того, как она поразила нас.
Мы также рассмотрели еще один инструмент, разработанный одним из наших выпускников Чизурум Олоронду, под названием NBA Players. Цель этого инструмента - ограничить время, необходимое поклоннику НБА или любознательному человеку, чтобы найти полезные факты о текущих активных игроках в НБА.
В заключение, для меня и моей команды большая честь обучать таких разнообразных, любопытных и невероятных людей. Многие из них являются экспертами в разных областях, но хотят расширить свои навыки или даже поменять карьеру. Настоящая решимость, рвение, настойчивость и сила воли наших учеников действительно вдохновляют.
Теджу, ты можешь брать все уроки… Мне нравится твоя энергия - очень добрым тоном.
Я думаю, что ученик может передумать после того, как его взорвет моя команда. У нас действительно лучшие инструкторы😌. Я с нетерпением жду работы с этой удивительной группой людей в течение следующих 14 недель.
Большое спасибо моей невероятной команде, без которой эта магия затерялась бы в пещерах простого воображения❤❤
Спасибо, что добрались до конца. Посетите наш репозиторий, чтобы узнать больше о нашей структуре cohort7. Вы используете Spotify? Какая твоя любимая песня? Послушайте наш Плейлист Spotify - вы также можете добавить в него свои любимые песни. Хотели бы вы разместить свою статью в нашем среднем издании? Посмотрите этот документ ✨
Мы социальные сети, подпишитесь на нас❤
- Twitter: https://twitter.com/aisaturdaylagos
- LinkedIn: https://www.linkedin.com/company/aisaturdayslagos
- Youtube: https://www.youtube.com/c/AISaturdaysLagos
- Github: https://github.com/AISaturdaysLagos
- Средний: https://medium.com/@AI6Lagos
- Instagram: https://www.instagram.com/aisaturdayslagos/
- Facebook: https://www.facebook.com/aisaturdayslagos
- Подпишитесь на нашу рассылку новостей: https://mailchi.mp/fac720d0b7cc/join-ai6-list
использованная литература
[1] http://www.datasciencecourse.org/notes/intro/
[2] http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf