Публикации по теме 'data-visualization'


Обнаружение линии разлома с помощью анализа главных компонентов (PCA)
Анализ главных компонентов (PCA) часто используется как средство уменьшения размерности в машинном обучении. Он линейно преобразует набор данных в пространство более низкой размерности, чтобы новый набор данных имел максимальную дисперсию. Это помогает упростить сложность модели и справиться с мультиколлинеарностью, сохраняя при этом тенденции / закономерности. Более простая модель означает более быстрое время выполнения, а меньшая размерность означает более простую визуализацию - в этом..

Unlocking Insights: введение в процесс науки о данных 📈
Что такое наука о данных? Наука о данных — это междисциплинарная область, которая включает в себя применение статистических методов, информатики и предметных знаний для получения информации и принятия обоснованных решений на основе данных. Это становится все более актуальным в современном мире, управляемом данными, где объем генерируемых и хранимых данных за последние годы вырос в геометрической прогрессии. Процесс Data Science можно разбить на следующие этапы: Сбор данных..

Изучение MOJO: мощный язык для науки о данных и не только
Введение В быстро развивающемся ландшафте компьютерных языков в последние годы наделало шума одно имя — MOJO. MOJO — это универсальный и мощный язык, предлагающий уникальные функции и возможности, особенно в области науки о данных. В этом блоге мы углубимся в суть MOJO, выделим его ключевые атрибуты, сравним его с другими известными языками и продемонстрируем его потенциал в области науки о данных. Понимание MOJO MOJO — это язык программирования высокого уровня,..

Показатели производительности в регрессии
Показатели производительности используются для измерения производительности моделей машинного обучения. Есть два разных приложения показателей производительности; в моделях классификации и моделях регрессии. Я продемонстрировал использование показателей производительности в регрессионной модели с использованием библиотеки Scikit-learn. В этом проекте используются следующие показатели: средняя абсолютная ошибка, среднеквадратическая ошибка и среднеквадратическая ошибка. Сбор данных:..

Прогнозирование и визуализация почасового спроса на электроэнергию в США с помощью MindsDB и Tableau
Введение MindsDB — это инструмент машинного обучения с открытым исходным кодом, который обеспечивает автоматизированное машинное обучение для вашей базы данных. MindsDB предлагает возможности прогнозирования в вашей базе данных. Tableau позволяет легко и интуитивно визуализировать ваши данные. В этом руководстве мы будем использовать MindsDB для прогнозирования почасового спроса на электроэнергию в США и визуализировать результаты в таблице. Для выполнения этого руководства вам..

3 обязательных расширения Jupyter Notebook для специалистов по данным
Добро пожаловать в нашу статью о 3 расширениях для ноутбуков Jupyter, которые помогут вам увеличить мощность ваших ноутбуков! Если вы специалист по данным, инженер по машинному обучению или любой другой специалист по работе с данными, вы, вероятно, потратили много времени на использование ноутбуков Jupyter. Хотя блокноты Jupyter уже являются мощным инструментом, существует ряд расширений, которые могут еще больше улучшить ваш опыт. В этой статье мы познакомим вас с тремя наиболее..

Присоединяйтесь к «Золотой когорте» данных будущего ✨
Присоединяйтесь к «Золотой когорте» будущих данных ✨ Будущие данные не за горами, и мы хотим, чтобы вы и вся ваша команда были там и помогли построить это новое открытое, инклюзивное сообщество данных. Наше видение Future Data - это сообщество таких людей, как вы. Люди, которые спрашивают и ищут ответы с помощью данных. Людей, которые хотят отвечать не только на вопросы «что» и «почему», но и на «что дальше». Люди, которые считают, что сотрудничество и открытое обсуждение -..