Публикации по теме 'analytics'


Все о статистике для Data Science(часть 1)
Слишком много статистики? Что ж, этот пост даст вам точный ответ на поставленный выше вопрос. В этом посте я постараюсь осветить ключевые темы статистики для науки о данных. Поскольку мы много раз читали повсюду, что 80% времени аналитик данных или специалист по данным посвящают предварительной обработке данных, чтобы построить точную модель машинного обучения. Нельзя недооценивать важность статистики. Если бы мы извлекли информацию из данных, мы, по сути, извлекли бы из данных..

Выборка!
Подход к решению задачи подсчета птиц Что вы делаете, когда у вас большой набор данных, а выполнение ваших алгоритмов занимает вечность? Или, скажем, вы хотите узнать общее количество людей, пьющих Starbucks за день? Собираетесь ли вы простоять весь день вне Starbucks и считать людей, входящих в Starbucks? Что ж, это было бы абсурдно и отнимало бы много времени! Итак, здесь мы используем методы выборки и выбираем подмножество данных для анализа. Получение всего набора интересующих..

Стандартный SQL в Google BigQuery
Стандартный SQL в Google BigQuery Преимущества и примеры использования в маркетинге В 2016 году Google BigQuery представил новый способ взаимодействия с таблицами: стандартный SQL. До этого у BigQuery был собственный язык структурированных запросов под названием BigQuery SQL (теперь он называется Legacy SQL). На первый взгляд, между Legacy и Standard SQL нет большой разницы: имена таблиц записываются немного по-другому; Стандарт имеет несколько более строгие требования к..

Полное руководство по датам и времени уборки
Дата и время являются часто используемыми типами данных. Итак, вы думаете, что с ними будет просто работать, верно? Правильно? В ISO (Международной организации по стандартам) даже есть модуль , посвященный тому, как следует писать дату и время. Но, как и все данные, дата и время часто появляются в самых разных форматах. В этом руководстве мы рассмотрим наиболее распространенные форматы даты и времени. Также будут подробные инструкции о том, как лучше всего справиться с ними в..

Создавайте быстрые и универсальные визуализации с графиками Unicode от Julia
Обзор замечательных функций в пакете Джулии UnicodePlots.jl Введение Во многих отношениях те, кто больше занимается вычислительными областями и наукой о данных, отличаются от других программистов. Прежде всего, мы обычно не компилируем всю нашу работу сразу. Мы бы предпочли какой-то уровень интерактивности, так как вам нужно получать постоянную обратную связь от ваших данных, чтобы по-настоящему понять их. Отсюда, конечно же, идея блокнотов. Однако, несмотря на то, что эти..

Что такое корреляция
Согласно Merriam Websters — корреляция — это отношение, существующее между явлениями или вещами или между математическими или статистическими переменными, которые имеют тенденцию изменяться, быть связанными или встречаться вместе таким образом, который не ожидается на основе случайности. один. В большинстве случаев корреляция проводится между двумя переменными. (Хотя можно найти корреляцию между более чем двумя переменными. — Множественная корреляция ) Типы корреляции Пирсон..

Подготовка данных к развертыванию: генеративный искусственный интеллект с ClearScape Analytics™ и поставщиками облачных услуг
ClearScape Analytics, неотъемлемая часть Teradata Vantage™, предлагает значительную ценность для организаций, желающих воспользоваться преимуществами генеративного искусственного интеллекта. ClearScape Analytics оптимизирует каждый этап жизненного цикла машинного обучения, включая понимание и определение проблемы, предварительную обработку соответствующих данных, обучение модели, развертывание модели и операции с моделью. В этом посте мы исследуем комплексный конвейер генеративного..