Публикации по теме 'data-driven'


Всем моим коллегам по исследованию данных: прекратите использовать так много жаргонизмов!
Не будьте специалистом по данным/аналитиком, который использует только жаргон и/или термины, непонятные большинству людей. От этого ты умнее не кажешься. На самом деле, вы отталкиваете людей, выглядите высокомерно и, вероятно, затрудняете реализацию своих собственных объектов (поскольку вы знаете, чего хотите от этого). Вместо того, чтобы говорить "модель получила показатель f1 0,75" или "все оценки значимы": 1. Предпочитайте осязаемые примеры: «Как видите, все оценщики..

Нахождение оптимальных параметров в модели RF с использованием каналов для повторного использования кода
Этот рассказ - вторая часть этого , где мы выбираем модель после оценки множества результатов. После выбора модели для обучения мы должны выбрать, какие гиперпараметры работают лучше, обучить окончательную модель и отправить наши прогнозы. Как выбрать лучшие гиперпараметры? В scikit-learn есть два основных метода: GridSearch и RandomizedSearch . GridSearch: исчерпывающий поиск В GridSearch мы генерируем кандидатов гиперпараметров из сетки параметров, и внутренне тестируем все..

Три шага для создания нового источника дохода (с использованием данных)
Вопросы, вопросы, вопросы Данные. С его помощью вы можете быстро создавать предложения, которые последовательно расширяют ваши услуги. И, если ваша организация только начинает работать в этой области, я порекомендую путь, по которому я уже успешно пошел на рынке, обслуживая клиентов всех размеров.

Примечания к исследованию: Регрессия законов физики на основе данных с использованием бритвы Оккама
Управляемая данными регрессия динамики Лоренца с экономией Резюме В предыдущей заметке мы имитируем динамику Лоренца, используя 4-слойную нейронную сеть. Несмотря на то, что в большинстве случаев он работает успешно, он по-прежнему склонен к тем, которые находятся далеко от тренировочного набора. Это распространенная проблема почти во всех видах техники регрессии и в значительной степени является формой переобучения. На рисунке ниже показан наглядный пример того, как модель..

PE на основе данных: создание ценности с помощью повторяемой аналитики и машинного обучения
DragonFly - это уникальный набор технологий и инструментов, который поддерживает нашу инвестиционную стратегию в WovenLight, от поиска поставщиков и тщательности до создания стоимости в нашей собственности. Здесь мы рассмотрим одну из ключевых задач разработки DragonFly - создание решений для анализа повторяемых данных и машинного обучения. Авторы: Томас Френч , руководитель отдела разработки продуктов, A ngus Taylor , главный менеджер по продукту WovenLight. Для..

Привет, Келли, отлично!
Привет, Келли, отлично! Вы думали об использовании магазинов shopify, таких как tubella’s , для более полного набора данных? вы можете получить красивую json-версию любой страницы продукта, которая выглядит примерно так. было бы действительно интересно посмотреть, как далеко вы можете продвинуться с рекомендателем на основе контента с более полным набором данных.

Астрономия, управляемая данными. Мои первоначальные мысли…..
Удивительно, как данные, которые мы собираем о небесных объектах во Вселенной, экспоненциально растут каждое десятилетие! Например, многочисленные обзоры неба показали, как объем данных вырастет с терабайтов до сотен петабайтов в следующем десятилетии! Использование только экспериментальных и теоретических подходов в астрономии не поможет нам эффективно интерпретировать данные. Данные становятся настолько большими и сложными, что ученые могут быть не в состоянии интерпретировать данные..