Публикации по теме 'analytics'


Не доверяйте аналитикам данных устанавливать показатели эффективности
Как согласовать продукт машинного обучения с бизнесом Важность выбора правильных показателей Вы являетесь основателем стартапа электронной коммерции по продаже велосипедов и аксессуаров для них. Ваш веб-сайт сейчас одинаков для всех пользователей, но вы хотите ввести функцию персонализации, которая показывает 3 наиболее актуальных продукта в верхней части страницы. Вы подходите к столу группы Data Science и объясняете им проблему. «Как мне решить, какие товары показывать?» -..

Введение в анализ данных для всех - Часть 1
Анализ данных является частью повседневной работы любого специалиста по данным (наряду с изменением и очисткой данных). Это также важно для многих других людей из числа современных сотрудников, системных аналитиков, владельцев бизнеса, финансовых команд и руководителей проектов. Однако большинство курсов бакалавриата не учит (или, по крайней мере, не учат) основам анализа данных ни на одном из своих курсов. Существуют курсы математики и статистики, а также курсы компьютерного..

Спор о Кабире Сингхе в Твиттере: подход к науке о данных
Все мы знаем, что за последние несколько месяцев фильм «Кабир Сингх» вызвал много споров из-за неоднозначной реакции зрителей. Было много обзоров, статей, твитов и мемов, в которых фильм назывался « жестоким праздником женоненавистничества », а некоторые называли его « праздником любви ». Давайте воспользуемся наукой о данных, чтобы, наконец, ответить на некоторые вопросы: Какой была первая реакция на Кабира Сингха? С чего начались все эти споры? Сколько инакомыслия мы..

Наши обновленные методы работы с Диспетчером тегов Google
Вот некоторые из вещей, которые мы реализовали в недавнем обновлении нашей реализации GTM, и мы думаем, что им стоит поделиться. Отделение GTM от приложения Вся цель GTM - отделить проблемы отслеживания от проблем вашего приложения. Вместо того, чтобы добавлять push-уведомления о событиях для каждой отдельной библиотеки отслеживания (например, gaq, fbq, snaptr,…), вы отправляете пользовательские события в уровень данных GTM, а затем настраиваете GTM для выполнения всего остального...

Мастерство НЛП, часть 3
Итак, в предыдущей статье мы узнали об основных концепциях предварительной обработки токенизации и стоп-слов, почему нам нужно их использовать, почему они важны, методах выполнения токенизации и стоп-слов. Если вы не проверяли предыдущие 2 статьи - › Часть-1 , Часть-2 В этой статье мы узнаем о стемминге, лемматизации, мешке слов (BOG) , который помогает нам создавать элементы из текста. Итак, зачем нам стемминг и лемматизация По грамматическим причинам в документах..

Начало работы с SQL - часть 1
Зачем использовать SQL? Мир, управляемый данными Благодаря развитию технологий и связи мы проводим все больше и больше жизни в Интернете. В 2019 году средний американец, пользующийся интернетом, проводил в сети 6 часов 31 минуту в день ! К 2021 году каждый день будет отправляться 320 миллиардов писем. Все, от наших автомобилей до холодильников и шлепанцев , подключено к Интернету. Что все это значит? Каждый день с каждым днем ​​создается все больше и больше данных - и..

10 практических действий, которые могут улучшить вашу модель
После первого прохода обучения и оценки модели вы можете обнаружить, что вам нужно улучшить ее результаты. Вот контрольный список, взятый из главы 13 Руководства по приложениям статистического анализа и интеллектуального анализа данных , из десяти практических действий, которые, по моему мнению, обычно помогают: 1. Преобразуйте входные данные с действительными значениями, чтобы они были приблизительно нормальными в распределении. Регрессия, например, ведет себя лучше, если входные..