Публикации по теме 'data-visualization'
Обнаружение линии разлома с помощью анализа главных компонентов (PCA)
Анализ главных компонентов (PCA) часто используется как средство уменьшения размерности в машинном обучении. Он линейно преобразует набор данных в пространство более низкой размерности, чтобы новый набор данных имел максимальную дисперсию. Это помогает упростить сложность модели и справиться с мультиколлинеарностью, сохраняя при этом тенденции / закономерности. Более простая модель означает более быстрое время выполнения, а меньшая размерность означает более простую визуализацию - в этом..
Unlocking Insights: введение в процесс науки о данных 📈
Что такое наука о данных?
Наука о данных — это междисциплинарная область, которая включает в себя применение статистических методов, информатики и предметных знаний для получения информации и принятия обоснованных решений на основе данных. Это становится все более актуальным в современном мире, управляемом данными, где объем генерируемых и хранимых данных за последние годы вырос в геометрической прогрессии.
Процесс Data Science можно разбить на следующие этапы:
Сбор данных..
Изучение MOJO: мощный язык для науки о данных и не только
Введение
В быстро развивающемся ландшафте компьютерных языков в последние годы наделало шума одно имя — MOJO. MOJO — это универсальный и мощный язык, предлагающий уникальные функции и возможности, особенно в области науки о данных. В этом блоге мы углубимся в суть MOJO, выделим его ключевые атрибуты, сравним его с другими известными языками и продемонстрируем его потенциал в области науки о данных.
Понимание MOJO
MOJO — это язык программирования высокого уровня,..
Показатели производительности в регрессии
Показатели производительности используются для измерения производительности моделей машинного обучения. Есть два разных приложения показателей производительности; в моделях классификации и моделях регрессии.
Я продемонстрировал использование показателей производительности в регрессионной модели с использованием библиотеки Scikit-learn. В этом проекте используются следующие показатели: средняя абсолютная ошибка, среднеквадратическая ошибка и среднеквадратическая ошибка.
Сбор данных:..
Прогнозирование и визуализация почасового спроса на электроэнергию в США с помощью MindsDB и Tableau
Введение
MindsDB — это инструмент машинного обучения с открытым исходным кодом, который обеспечивает автоматизированное машинное обучение для вашей базы данных. MindsDB предлагает возможности прогнозирования в вашей базе данных. Tableau позволяет легко и интуитивно визуализировать ваши данные. В этом руководстве мы будем использовать MindsDB для прогнозирования почасового спроса на электроэнергию в США и визуализировать результаты в таблице. Для выполнения этого руководства вам..
3 обязательных расширения Jupyter Notebook для специалистов по данным
Добро пожаловать в нашу статью о 3 расширениях для ноутбуков Jupyter, которые помогут вам увеличить мощность ваших ноутбуков!
Если вы специалист по данным, инженер по машинному обучению или любой другой специалист по работе с данными, вы, вероятно, потратили много времени на использование ноутбуков Jupyter. Хотя блокноты Jupyter уже являются мощным инструментом, существует ряд расширений, которые могут еще больше улучшить ваш опыт.
В этой статье мы познакомим вас с тремя наиболее..
Присоединяйтесь к «Золотой когорте» данных будущего ✨
Присоединяйтесь к «Золотой когорте» будущих данных ✨
Будущие данные не за горами, и мы хотим, чтобы вы и вся ваша команда были там и помогли построить это новое открытое, инклюзивное сообщество данных.
Наше видение Future Data - это сообщество таких людей, как вы. Люди, которые спрашивают и ищут ответы с помощью данных. Людей, которые хотят отвечать не только на вопросы «что» и «почему», но и на «что дальше». Люди, которые считают, что сотрудничество и открытое обсуждение -..