Публикации по теме 'analytics'
Не доверяйте аналитикам данных устанавливать показатели эффективности
Как согласовать продукт машинного обучения с бизнесом
Важность выбора правильных показателей
Вы являетесь основателем стартапа электронной коммерции по продаже велосипедов и аксессуаров для них. Ваш веб-сайт сейчас одинаков для всех пользователей, но вы хотите ввести функцию персонализации, которая показывает 3 наиболее актуальных продукта в верхней части страницы.
Вы подходите к столу группы Data Science и объясняете им проблему. «Как мне решить, какие товары показывать?» -..
Введение в анализ данных для всех - Часть 1
Анализ данных является частью повседневной работы любого специалиста по данным (наряду с изменением и очисткой данных). Это также важно для многих других людей из числа современных сотрудников, системных аналитиков, владельцев бизнеса, финансовых команд и руководителей проектов.
Однако большинство курсов бакалавриата не учит (или, по крайней мере, не учат) основам анализа данных ни на одном из своих курсов. Существуют курсы математики и статистики, а также курсы компьютерного..
Спор о Кабире Сингхе в Твиттере: подход к науке о данных
Все мы знаем, что за последние несколько месяцев фильм «Кабир Сингх» вызвал много споров из-за неоднозначной реакции зрителей.
Было много обзоров, статей, твитов и мемов, в которых фильм назывался « жестоким праздником женоненавистничества », а некоторые называли его « праздником любви ».
Давайте воспользуемся наукой о данных, чтобы, наконец, ответить на некоторые вопросы:
Какой была первая реакция на Кабира Сингха?
С чего начались все эти споры?
Сколько инакомыслия мы..
Наши обновленные методы работы с Диспетчером тегов Google
Вот некоторые из вещей, которые мы реализовали в недавнем обновлении нашей реализации GTM, и мы думаем, что им стоит поделиться.
Отделение GTM от приложения
Вся цель GTM - отделить проблемы отслеживания от проблем вашего приложения. Вместо того, чтобы добавлять push-уведомления о событиях для каждой отдельной библиотеки отслеживания (например, gaq, fbq, snaptr,…), вы отправляете пользовательские события в уровень данных GTM, а затем настраиваете GTM для выполнения всего остального...
Мастерство НЛП, часть 3
Итак, в предыдущей статье мы узнали об основных концепциях предварительной обработки токенизации и стоп-слов, почему нам нужно их использовать, почему они важны, методах выполнения токенизации и стоп-слов.
Если вы не проверяли предыдущие 2 статьи - › Часть-1 , Часть-2
В этой статье мы узнаем о стемминге, лемматизации, мешке слов (BOG) , который помогает нам создавать элементы из текста.
Итак, зачем нам стемминг и лемматизация
По грамматическим причинам в документах..
Начало работы с SQL - часть 1
Зачем использовать SQL?
Мир, управляемый данными
Благодаря развитию технологий и связи мы проводим все больше и больше жизни в Интернете. В 2019 году средний американец, пользующийся интернетом, проводил в сети 6 часов 31 минуту в день ! К 2021 году каждый день будет отправляться 320 миллиардов писем. Все, от наших автомобилей до холодильников и шлепанцев , подключено к Интернету.
Что все это значит? Каждый день с каждым днем создается все больше и больше данных - и..
10 практических действий, которые могут улучшить вашу модель
После первого прохода обучения и оценки модели вы можете обнаружить, что вам нужно улучшить ее результаты. Вот контрольный список, взятый из главы 13 Руководства по приложениям статистического анализа и интеллектуального анализа данных , из десяти практических действий, которые, по моему мнению, обычно помогают:
1. Преобразуйте входные данные с действительными значениями, чтобы они были приблизительно нормальными в распределении.
Регрессия, например, ведет себя лучше, если входные..