5 минут на 5 часов чтения

Я провел большую часть недели в походах по Альпам со своей семьей. Это было совершенно фантастично — ограниченный доступ к электричеству вынудил меня перевести телефон в режим полета и посвятить все свое внимание детям и жене. А природа вокруг Санкт-Морица и перевала Бернина такая красивая.

В любом случае, это также означает, что у меня не было много времени для чтения, и мне удалось прочитать только три статьи ниже в поезде, когда дети уже спали.

Первый очень важен. Он показывает оценку данных как экономическое, а не бухгалтерское упражнение. Присвоение ценности данным на основе предоставленных вариантов использования (или запланированных, или даже пока только возможных) — очень мощный подход.

Но знайте, что подразумевается под вариантом использования. Это не простая панель инструментов или модель машинного обучения. Сценарий использования – это набор решений вокруг общих КПЭ или показателей, направленных на достижение четко определенного бизнес- или операционного результата в поддержка ключевой бизнес-инициативы организации. говорит Билл Шмарзо в одной из своих статей о построении стратегии данных, ориентированной на ценность.

  • Какова ценность моих данных? Самый важный вопрос сегодняшнего дня, на который трудно ответить.Билл Шмарцо является сторонником экономической ценности данных, поэтому неудивительно, что предлагаемая им методология оценки данных сосредоточена вокруг ценности вариантов использования данных. Достижение ценности варианта использования (подумайте о снижении стоимости запасов или повышении надежности продукта поставщика) — задача для финансовых аналитиков. Затем необходимо приписать ценность отдельных вариантов использования источникам данных и необходимым аналитическим модулям. Прямолинейный, но очень мощный. (Центр науки о данных)
  • Ваше мнение имеет значение. Использование отзывов клиентов, предоставленных в виде свободного текста, очень важно, но невероятно сложно. Еще раз мы видим силу наличия больших выборок обучающих данных, отобранных экспертами. Имея данные, можно использовать общедоступные современные модели НЛП, такие как GPT-3. Это именно то, что сделала команда Stitch Fix. Я считаю, что это путь, которым должны следовать многие компании. Создавайте собственные наборы данных и используйте доступные технологии и машинное обучение. (Многопоточный)
  • Управление проектами на основе σ: когда лучше всего сдаться? Блог построен на следующей предпосылке: время завершения программных проектов подчиняется логарифмически нормальному распределению, что означает логарифм отношения оценка по сравнению с фактической будет следовать нормальному распределению с нулевым средним значением и стандартным отклонением σ. σ зависит от сложности проекта. Чем меньше неопределенности в проекте, тем ниже сигма и тем точнее оценки. Настоящий вопрос заключается не в том, насколько плохим станет расчетное и фактическое соотношение, а в том, когда следует отказаться от проекта. Эрик утверждает, что это происходит, когда предельный ROI (коэффициент успеха на затраченное время) проекта падает ниже первоначального предельного ROI. В любом случае, разбивайте свои большие проекты на более мелкие — их легче оценивать и управлять ими, и они будут выполнены с большей вероятностью. (Эрик Бернхардссон)

Завтра я занимаюсь небольшим триатлоном. Надеюсь, тело будет помнить, как плавать. Прошло много времени. Остальное должно быть ок — приятно покататься и пробежаться по Цюрихскому озеру.

На случай, если вы пропустили выпуск журнала Keeping up with data за последнюю неделю



Спасибо, что прочитали!

Пожалуйста, поделитесь своими мыслями или советами по чтению в комментариях.

Подпишитесь на меня в Medium, LinkedIn и Twitter.