Публикации по теме 'data-analyst'


Подготовка данных перед обучением
Этот пост в блоге является частью серии, в которой я рассказываю о концепциях и алгоритмах машинного обучения. В этой части я хочу немного поговорить о подготовке данных, прежде чем вы начнете обучать данные вашему алгоритму машинного обучения. Базовая разработка функций: выбор правильных функций В разработке функций вы обычно заботитесь о своих функциях и решаете, имеют ли они отношение к вашему вопросу, на который вы хотите ответить. Кроме того, вы также создаете новые функции из..

Понимание рабочих ролей
В наши дни очень часто можно встретить эти термины — наука о данных, искусственный интеллект, машинное обучение, глубокое обучение и многое другое. Как следствие, на нашем пути появилось множество различных ролей в науке о данных, но сложно получить общее представление о том, чем они отличаются, и какие навыки для них требуются. Цель этой статьи — представить краткие сведения о различных должностях, обязанностях каждой должности, а также о необходимых навыках/квалификациях и..

Неделя 3 Отражение #GenerasiGIGIH от YABB
В течение трех недель с #GenerasiGIGIH я чувствовал себя как большая гроза, сопровождаемая дождем, но заканчивающаяся красивой радугой. (Забавный факт: сильные ураганы и огромное количество осадков, которые они приносят с собой, также полезны для экосистем и нужд человека в сельском хозяйстве. Они могут устранить нежелательные инвазивные растения из определенных экосистем (но также могут способствовать их распространению), обогатить почвы свежие питательные вещества и поощрять..

Вас очаровало слово «Данные»? Смущаете многочисленные области карьеры, связанные с «Данными»?
Тот факт, что один только Google в среднем хранит более 20 петабайт, то есть 20971520 гигабайт 🤯 данных, хранящихся в его центрах обработки данных, показывает, насколько модной и обширной является область данных в 21 веке. Теперь можно оценить, насколько востребована эта область, учитывая, что у нас есть несколько крупных игроков, таких как Amazon, Facebook и т. Д., А также Google, жаждущие данных на рынке. Сбор, обработка, анализ, реализация моделей машинного обучения, тестирование,..

Различные типы недостающих данных.
Отсутствие данных - одна из распространенных проблем, с которой согласятся и специалисты в области науки о данных или аналитики. Статистически существует три различных типа отсутствующих данных (а именно MCAR, MAR, MNAR), но в реальных данных может быть обнаружен 4-й тип отсутствующих данных, который называется структурированными отсутствующими данными. Давайте разберемся с каждым из них по отдельности: 1.Структурированные отсутствующие данные: - Данные, которые отсутствуют..

Работа с несбалансированными классами !!!
Одной из многих проблем с классификацией в реальном мире машинного обучения является проблема несбалансированных данных. Несбалансированные данные означают, что классы, присутствующие в наших данных, непропорциональны. Это означает, что соотношение каждого класса отличается, где один из классов в основном присутствуют в наборе данных, а другие присутствуют незначительно. Проблемы с несбалансированными данными? В то время как обучение модели приводит к тому, что модель..