Если вы работаете в области науки о данных или машинного обучения, вы наверняка слышали о Kaggle. Да, это тот же веб-сайт, на котором вы найдете множество наборов данных. Что ж, это не ограничивается предоставлением вам наборов данных (многие люди это уже знают). Kaggle - идеальная платформа, если вы только начинаете заниматься наукой о данных.

Выполнение множества проектов, понимание данных, мозговой штурм для повышения точности - вот некоторые из действий, которые улучшат ваши способности как ученого. Пару месяцев назад я читал о некоторых вещах, которые повлияют на мое портфолио в области науки о данных, и работа над Kaggle была одним из них. Из любопытства я вошел в систему и начал исследовать. Я понял, что в нем есть все, что нужно новичку, чтобы развить навыки или получить опыт. В нем есть учебные пособия, которые помогут вам изучить концепции. В нем есть соревнования, в которых вы можете применить свои знания. Кроме того, проводятся обсуждения для решения ваших запросов и обсуждения идей с другими начинающими специалистами по данным. Помимо этого, в нем есть наборы данных и другие инструменты (записные книжки), так что вы можете работать только там.

Новичку нужно начинать с обучающих программ. Существует множество микрокурсов по нескольким темам, таким как основы машинного обучения, средний уровень машинного обучения, базовый Python, Pandas, SQL и многое другое. Каждое руководство разделено на несколько разделов. В каждом разделе есть концептуальный текст, за которым следует упражнение по той же теме, которое можно применить сразу после изучения.

Далее идут соревнования. Я лично считаю, что это лучшая часть kaggle. Вам просто нужно принять участие в соревновании по вашему выбору и начать создавать модели. Многие люди вроде нас много работают над этими соревнованиями. Некоторые из них платят хорошую сумму, если вы выигрываете. Каждый из них хорошо оформлен с четкими объективными и достаточными данными. Вы можете кодировать только в записной книжке kaggle. Соревнования проводятся по множеству концепций, включая базовые алгоритмы машинного обучения, такие как кластеризация и SVM, и методы комплексной обработки изображений. Вам просто нужно выбрать интересующий вас конкурс. Когда вы отправляете результаты, таблица лидеров показывает ваш рейтинг и точность, чтобы вы могли обсудить недостатки своей модели и улучшить ее. Для этих вещей есть каналы для обсуждения.

Существует так называемая колонка Лента новостей, где люди показывают свои достижения, будь то победа в соревновании или высокая точность в любом соревновании или модели. Вы можете найти там множество инструментов, которые помогут повысить ваши навыки. Например, отсюда у меня есть шпаргалка по пандам и многое другое.

Вы должны знать о наборах данных, которые предоставляет kaggle. Они отсортированы по популярности. Внутри наборов данных вы можете найти задачу для выполнения, эти задачи предназначены для правильного и эффективного использования данных. Это как второстепенные проблемы реального мира.

Итак, чтобы извлечь максимальную пользу из kaggle, нужно сначала пройти обучение (ЕСЛИ НАЧИНАЮЩИЙ), а затем участие в некоторых, если соревнования, основанные на применении этих знаний, очень помогут. Наконец, обсуждение ваших идей с другими и получение их мнений было бы отличным шагом для начала.

В нем также есть раздел «Работа», где вы можете найти несколько вакансий, связанных с наукой о данных. Вы можете ознакомиться с ролями и обязанностями на конкретной должности и подать заявку на нее, если вам это подходит.

Одним словом, Kaggle - все в одном для специалистов по данным.