Семь лет назад, когда я только что приехал в Канаду, я задумался, чем бы мне заняться по профессии. К счастью, один из моих друзей привел меня на семинар SAS (SAS — мощный инструмент для обработки данных, анализа и машинного обучения и т. д.), в конце концов я прошел курс, продвигаемый семинаром, добавил много самообучения, и я работал на работах, связанных с данными.

Кто может рассмотреть возможность поиска работы, связанной с данными

У людей, уже имеющих такое образование, как информатика, машинное обучение, статистика, не будет этого вопроса, так что эта статья действительно для тех, кто абсолютно нулевой и задается вопросом, стоит ли пытаться:

Выпускники колледжа или университета — хорошая отправная точка. Даже вы специализировались в области искусства, литературы, языка и социальных наук. При условии, что вы хорошо разбираетесь в «логическом мышлении» и не любите управлять информацией в табличном режиме. Попробуйте «Наборы» в следующей части этой статьи, чтобы увидеть, читаете ли вы с интересом, с радостью, легко или без особых трудностей.

Новые иммигранты (как я семь лет назад) также являются хорошей отправной точкой. Если у вас уже есть некоторый опыт работы в стране вашего происхождения, и из-за языкового барьера вы не можете сразу начать работу на том же уровне, вы можете рассмотреть возможность проведения анализа данных в той же деловой практике, что и ваша предыдущая профессиональная сфера.

В настоящее время работаете, но любопытны и увлечены искусственным интеллектом, машинным обучением, наукой о данных и т. д.? Вы можете попробовать некоторые пути обучения, чтобы увидеть, действительно ли это ваш настоящий путь по сравнению с вашей текущей ролью.

Как долго вы можете работать на работах, связанных с данными

Во-первых, это зависит от вашей приверженности. Если вы серьезно отнесетесь к «Наборам» и будете придерживаться любого курса или пути обучения, вы можете ожидать, что отшлифуете резюме и выйдете на рынок для работы с данными начального уровня примерно через год. Как и в случае со здравым смыслом, отдельные случаи попадают в очень широкий спектр вокруг среднего значения и даже вне стандартного отклонения. Но по моему опыту один год — это все еще хорошая идея.

Во-вторых, это зависит от ваших ожиданий от вашей первой работы «Данные». В нашу эпоху данных предостаточно, каждой организации нужны люди, которые будут работать с данными, делать выводы и давать рекомендации для принятия решений. Вы найдете роли, подходящие для вашего уникального сочетания навыков и опыта, если только у вас нет нереально высоких ожиданий.

Стартовые сеты

Следуйте приведенным ниже шагам, вы можете прыгать, но обязательно вернитесь позже и выполните ВСЕ из них, прежде чем полировать резюме и выйти на рынок.

Excel: экспертный уровень

вам нужно быть главным пользователем Excel, а не простым списком из 30 строк и 12 столбцов. Вам нужно обрабатывать несколько листов, v-lookup, сводную таблицу, макрос, таблицу, формулу массива, диаграммы, ленту анализа данных, и все это легко. Этот список состоит из простых пунктов и более серьезных, по мере того, как вы выполняете их один за другим, это хороший тест вашего «логического мышления», чтобы вы знали, подходит ли вам работа, связанная с данными.

Будьте kaggler: начальный уровень

Kaggle — это платформа, на которой специалисты по данным соревнуются в своих способностях решать проблемы, но для начала вы будете использовать Kaggle только для двух целей:

загрузить данные: выберите интересующие вас темы и загрузите данные, попытайтесь выполнить очистку данных, манипулировать данными, попытайтесь сделать диаграммы, чтобы проиллюстрировать ваши выводы и идеи, и, наконец, отполируйте свое «резюме», чтобы выразить идею. . Если данные находятся в пределах 1 миллиона строк, вы можете выполнить это упражнение с помощью Excel, если выше, вам нужны собственные базы данных, язык SQL или общий компьютерный язык (например, python) для анализа и визуализации.

быть в таблице результатов: после того, как вы усердно работали над своими путями обучения, вы можете принять участие в конкурсах на Kaggle, например: Titanic. Вы можете следовать классическому учебнику, моделировать и отправлять прогнозы — только для того, чтобы попасть в таблицу результатов.

Это даст вам чувство достижения, и вы будете взволнованы и воодушевлены идти дальше!

Ранг имеет значение, но меньше, чем тот факт, что вы дошли до финиша.

Начните свой собственный проект прямо сейчас

Вы не можете абстрактно изучать анализ данных, практика — единственный способ научиться. Таким образом, вам нужна реальная проблема в контексте анализа данных. Вы можете взять набор данных kaggle и представить проблему, а затем сразу же настроить свой собственный проект для решения этой проблемы! Даже простая сортировка, максимальное, минимальное, среднее из ряда данных — это хороший набор задач, которые вам пригодятся после того, как вы закончите их решать.

Проблема, инструмент, контейнер — это 3 интерактивных элемента, составляющих проект. Теперь, когда у вас есть проблема, язык SQL или экспертное использование Excel — это ваш инструмент, база данных или лист Excel — ваш контейнер.

Управление базами данных на вашем персональном компьютере

Вы можете начать с MS Access в качестве базы данных для хранения наборов данных и промежуточных результатов во время анализа. Или вы можете начать с преобладающих баз данных: MS SQL Server, Oracle MySQL, IBM DB2.

Я рекомендую установить MS SQL Server и MySQL на свой персональный компьютер, они бесплатны. Процесс импорта набора данных в обе базы данных — это отличное упражнение и опыт, вы будете бороться, но в конечном итоге вы овладеете им, и это настоящий опыт в вашем резюме!

Язык SQL: средний уровень

Язык SQL — замечательная штука, это язык, похожий на английский, который имеет смысл для людей, не знакомых с компьютерными науками и компьютерными языками. Тем не менее, это основа реляционной базы данных, которая преобладает в работе, связанной с данными.

Школы W3 рекомендуются для изучения основных положений языка, это поднимет вас до начального уровня.

Чтобы достичь среднего уровня, нужно много практиковаться в контексте. Вот почему вы прочитали предыдущие разделы Будьте кагглером, Начните свой собственный проект и Управление базами данных. Если вы не можете самостоятельно создать проблему со скачанными данными, вы можете зайти на такие сайты, как leetcode, чтобы проверить вопросы на собеседовании, решить и решить их.

Действие! это единственное ключевое слово

Находясь на Medium, я не являюсь экспертом-писателем или гуру в науке о данных. Скорее, я ваш приятель, человек, который увлечен данными, всегда учится и рад поделиться.

Работа, связанная с данными, — это не мифы, результат зависит от усилий. Если вы хотите один день поработать в этой области, просто начните обучение и практику СЕЙЧАС.