Публикации по теме 'data-visualization'


Реализация K-ближайших соседей в scikit-learn
Пошаговое руководство по классификатору KNeighbors от scikit-learn Мы будем использовать набор данных радужной оболочки глаза, доступный здесь в UCI Machine Learning. Это небольшой набор данных с легко различимыми кластерами, который очень полезен для подобных демонстраций. Он содержит 150 наблюдений за растениями ириса трех видов: сетоза, разноцветный и вирджинский. Задача - определить вид каждого растения по ближайшим соседям. K-ближайшие соседи - это метод, который просто смотрит..

Оптимизация предложений приложений с помощью Starbucks
Обзор проекта Это краеугольный камень программы Udacity для специалистов по работе с данными. В этой задаче данный набор данных содержит воссозданную информацию, копирующую поведение клиента в портативном приложении вознаграждений Starbucks. Как по маслу, Starbucks передает клиентам предложение универсального приложения. Предложение может быть просто рекламой напитка или реальным предложением, например, уценкой или BOGO (получите один бесплатно). Некоторые клиенты, вероятно, не..

Информационная панель CIO от AnyChart и многое другое. Итоги недели — 06.12.2015
Первоначально опубликовано на www.anychart.com 7 декабря 2015 г. В этом посте вы найдете краткий обзор информации о визуализации данных и AnyChart, которой мы поделились на этой неделе на странице AnyChart в Facebook и Twitter : Kepler Orrery IV — эта потрясающая визуализация данных представляет собой новую версию анимации Kepler Orrery. Он показывает все многопланетные системы Кеплера в том же масштабе, что и Солнечная система. Информационная панель ИТ-директора — эта..

Акции, тестирование значимости и p-Hacking: насколько волатильно волатильно?
Октябрь исторически является самым нестабильным месяцем для акций, но является ли это постоянным сигналом или просто шумом в данных? Акции, тестирование значимости и взлом. За последние 32 года октябрь был самым волатильным месяцем в среднем для индекса S & P500, а декабрь - наименьшим. В этой статье мы будем использовать моделирование, чтобы оценить статистическую значимость этого наблюдения и насколько это наблюдение могло произойти случайно. Весь код включен! Этот пост..

Может ли машина определять пол?
Может ли машина определять пол? Использование matplotlib для изучения 100-летнего существования имен в США и создание модели машинного обучения для классификации гендерной принадлежности по именам. Предисловие Наши имена не всегда определяют нас, но они дают нам чувство идентичности. Обозначение себя набором букв и слов придает некую структуру нашему самоощущению и закрепляет наше присутствие в этом мире. «Это не то, что они называют вас, это то, на что вы отвечаете». - У. К...

Практический пример: анализ жалоб клиентов и обучение модели машинного обучения
Подробное изучение жалоб клиентов в фирме и обучение нескольких моделей машинного обучения. Оглавление: Введение проблемы Исследовательский анализ данных Разработка функций Модели машинного обучения (SVM, GaussianNB, дерево решений, XGBoost) Сводка моделей машинного обучения Введение в проблему Как фирма или любая компания, предоставляющая услуги, мы получаем многочисленные жалобы от клиентов. Получение жалоб — это не что иное, как еще один способ улучшить наши услуги по..

Мой опыт машинного обучения с Udacity 2
Программа Машинное обучение для инженеров-наностепеней (MLND) В моем последнем посте я объяснил, как я прошел курс Введение в машинное обучение с Udacity и был мотивирован для участия в программе MLND. Сейчас я работаю. в качестве гражданского ученого-компьютерщика в Кот-д'Ивуаре. Моя должность очень стабильна, гарантирована на несколько десятков лет, но прямо не подразумевается в ИИ. Поэтому я занимаюсь этой областью самостоятельно, поскольку я увлечен исследованиями в области..