Публикации по теме 'data-analytics'


Кого выбрать после Криштиану Роналду? - С точки зрения анализа данных
Летом 2018 года, после последнего успешного сезона в «Реале», один из самых известных футболистов Криштиану Роналду решил перенести свой необыкновенный талант в Турин, Италия, и стать нападающим «Ювентуса». Однако, по сравнению с радостной атмосферой в Турине, «Реалу» осталось срочно заполнить вакансию, чтобы он по-прежнему добивался отличных результатов в лигах. Нам легко перечислить нескольких игроков, которые, кажется, могут заменить Роналду, поскольку в мире очень много хороших..

Введение в анализ данных Airbnb и линейную индикацию цен
Этот проект осуществляется в рамках курса Udacity и начинается с трех вопросов заинтересованных сторон к наборам данных AirBnB из Бостона за 2016/2017/2018/2019 годы. Чтобы ответить на вопросы, был реализован блокнот Juypter с использованием процесса CIRSP-DM. Данные считываются, обрабатываются, моделируются и оцениваются в этом блокноте. Подробный блокнот и соответствующий набор данных, которые использовались для анализа, можно найти по следующей ссылке:..

Как интегрировать SCADA в масштабируемую аналитику данных
Традиционные операционные системы могут выиграть от использования датчиков и современных облачных технологий, чтобы стать новым промышленным Интернетом вещей За последние пять десятилетий операционные технологии (OT), такие как SCADA, широко использовались для управления, мониторинга и контроля физических устройств и процессов на объектах в рамках промышленных операций. В то время как OT продолжают помогать таким отраслям, как горнодобывающая промышленность, производство,..

Оптимизация производительности CatBoost
Оптимизация производительности CatBoost Уловки для повышения эффективности обучения машинному обучению до 4 раз Повышение градиента для науки о данных Существует множество хорошо известных фреймворков повышения градиента, которые обеспечивают точность и эффективность в реальных приложениях. Они считаются многоцелевым инструментом для решения многих типов задач машинного обучения. Согласно последнему опросу Kaggle 2020 , 61,4% специалистов по данным регулярно используют..

Что такое переобучение и как его избежать?
Введение: Переоснащение — серьезная проблема в машинном обучении. Это происходит, когда модель фиксирует шум (случайность) вместо сигнала (реальный эффект). В результате модель хорошо работает на тренировочном наборе, но плохо работает на тестовом наборе. Весь набор данных имеет два шаблона: Случайный эффект . Случайный эффект — это случайность (шум) в наших данных. Во всех наборах данных он разный. Модель будет чрезмерно оптимистичной в обучающем наборе, потому что она будет..

Искусственная нейронная сеть: кусок пирога
Об искусственных нейронных сетях много говорят из-за их способности выполнять задачи, которые считаются сложными или сложными для компьютеров. Они решают проблемы путем самообучения, на основе проб и ошибок, а не программируются с помощью правил для конкретных задач, как в обычных компьютерах. Искусственные нейронные сети замечательно справляются с задачами, которые раньше было трудно выполнять с помощью компьютеров, например, компьютерное зрение, медицинская диагностика, обнаружение..

Создано 7-классниками с интеллектуальным любопытством и игривостью
Этим летом я впервые окунулся в индустрию образовательных технологий после того, как потратил 3 полных года на академическое изучение образовательных технологий K-12 в рамках программ магистратуры и докторантуры в Стэнфорде и Колумбийском педагогическом колледже соответственно. Более того, это был мой первый опыт работы в сфере данных, опыт, который начался с дрожи от беспокойства, но перерос в всестороннее просветление. Позвольте мне предвосхитить, что мой предыдущий опыт работы (Apple,..