Публикации по теме 'analytics'


Оповещение о новой функции 🚨 Извлечение правил для моделей машинного обучения
Оповещение о новой функции 🚨 Извлечение правил для моделей машинного обучения В отрасли науки о данных известно, что создавать модели ML относительно быстро и легко, но запускать их в производство сложно и дорого. Вы будете удивлены, узнав, что только небольшой процент проектов машинного обучения переходит в производство — только около 12% из них. ("источник") Вот почему, внимательно изучив, что клиенты создавали с помощью пайплайнов Datagran, мы пришли к выводу, что извлечение..

15. Триггерные правила в воздушном потоке
Мои личные заметки из книги «Конвейеры данных с Apache Airflow» Баса Харенслака и Джулиана де Рюйтера — глава 5, часть 2 Введение Эта серия постов подытоживает мои выводы из книги Баса Харенслака и Джулиана де Рюйтера. Если вам нравится содержание, вы можете приобрести книгу на Manning .

Представляем геопространственную аналитику: легко вычисляйте расстояние между двумя глобальными точками с помощью…
Если вы погружены в мир аналитики, скорее всего, вы сталкивались с разочаровывающими сценариями, когда расчет расстояния между двумя точками на Земле становится необходимостью. Однако вы быстро обнаруживаете серьезное препятствие — каждый ваш запрос имеет свою цену. Но не бойтесь, товарищи аналитики! В этом увлекательном блоге мы раскрываем подход, который может помочь вам рассчитать расстояние поездки с учетом маршрутов, ограничения скорости, одностороннего/двустороннего движения и..

MachineX: повышение производительности с помощью XGBoost
мы столкнулись со многими древовидными алгоритмами, такими как деревья решений, в тех, которые мы использовали для обучения нашей единственной модели на определенном наборе данных, возможно, с некоторой настройкой параметров. Также в ансамблевых моделях мы обучали все модели отдельно. Повышение также является методом ансамбля, который объединяет множество моделей для получения окончательного результата, но вместо того, чтобы оценивать все модели по отдельности, повышает модели поездов..

Как вы опережаете игру, используя внешние данные?
Пандемия COVID-19 сильно изменила поведение потребителей и рыночный спрос, что привело к тому, что многие модели искусственного интеллекта и машинного обучения устарели. В результате некоторые компании активизировали свои усилия по использованию внешних данных вместо того, чтобы сосредоточиться на внутренних операционных данных. Хотя многие компании очень хорошо используют свои внутренние операционные данные, относительно немногие компании осознали ценность использования сторонних или..

Формула статистики Z Test и реализация Python
Формула, определение, примеры и реализация Python 1. Цель Статистический тест, называемый z-тестом, выполняется для данных, которые примерно соответствуют нормальному распределению, то есть для данных, которые не искажены. Z-критерий можно применять для проверки различий в пропорциях между двумя выборками или даже одной выборкой для оценки гипотез. Для совокупности с известной дисперсией он определяет, различаются ли средние значения двух обширных выборок. В зависимости от нашего..

Каптаан в свете данных: исследовательский анализ и анализ настроений — часть 2
Рехан Ахмед Это вторая часть серии, посвященной анализу мнений об Имране Кхане в более чем восьмистах статьях, написанных о нем в Dawn с 2004 года. Чтобы прочитать первую часть, посетите здесь . Один из самых интересных инструментов в наборе инструментов специалиста по данным — анализ настроений. Анализ настроений, относящийся к области обработки естественного языка, — это способность оценивать мнение людей о чем-то или, в данном случае, о ком-то. ЧТО ТАКОЕ СЕНТИМЕНТНОСТЬ?..