Встаньте на плечи гигантов, как Ешимабейт Милнер!

Одна из самых больших проблем, с которыми сталкивается множество студентов, изучающих науку о данных, — это связать воедино все сложные технические навыки, полученные из обширного интернет-ресурса, с значимыми социально-экономическими, экологическими и бизнес-проблемами.

Это мягкий навык? Это навык, который определяется «коммуникацией» или «рассказыванием историй на основе данных»?

Я думаю, что это не что-то из вышеперечисленного. На мой взгляд, установление связи между жесткими навыками обработки данных и реальной ценностью — это самый сложный навык из всех. Это сложно, потому что требует большего, чем просто навыки общения или рассказывания историй. Также требуются предварительные знания, вдохновение, чтобы мотивировать ваши вопросы и поиск более глубоких решений, и творческий подход, чтобы исследовать сферу возможного.

Один из способов вдохновиться — «стоять на плечах гигантов» и узнавать о значимых усилиях других, изучая, как их увлечения материализуются в науке о данных. Один из таких людей, на котором я сосредоточусь здесь, это Ешимабейт Милнер.

Милнер известна своей работой в качестве соучредителя и директора Data 4 Black Lives.

Организация Data 4 Black Lives работает над выявлением пробелов в данных о чернокожих, которые влияют на наше понимание важных социальных результатов и результатов, связанных со здоровьем. Когда существуют пробелы в данных, модели, которые мы строим для понимания, прогнозирования и, в конечном счете, попыток решить некоторые аспекты этих проблем, неизбежно оказываются предвзятыми.

Например, Data 4 Black Lives создала набор данных, показывающий, какие штаты не предоставили точных отчетов и не предоставили данные об инфекциях COVID-19 в разбивке по расам. Попытка понять и решить проблему пандемии COVID в этих штатах относительно невозможна без полных данных.

На социальном фронте организация написала открытое письмо в Facebook с просьбой взять на себя обязательство делиться анонимными данными, сотрудничать с исследователями и нанимать чернокожих специалистов по данным.

Каждая инициатива имеет значение для ученых, занимающихся данными, которые хотят разрабатывать значимые проекты в области науки о данных. Фокус Милнера вдохновляет сам по себе, но он также информативен, поскольку указывает на особое внимание к пониманию того, что для серьезных медицинских и социальных проблем не хватает важных данных, которые можно было бы решить.

И для любого проекта по науке о данных наиболее важным аспектом решения является возможность сбора правильных данных.

Немного углубившись в сайт Data 4 Black Lives, в разделе Блог есть рассказ о концепции Data Weapons. По словам Милнера, информационное оружие — это данные и модели искусственного интеллекта, которые используются для дальнейшего оправдания нацеливания на социально уязвимые сообщества.

Информационное оружие включает в себя прогностические модели, которые используют исторические данные о преступлениях, чтобы предсказать, где может произойти преступление, кто, скорее всего, совершит новые преступления, а также распознать лица в прошлой криминальной истории. Проблема в том, что данные, на которых основаны эти модели, сами по себе предвзяты, потому что полицейские тоже были предвзяты в своей работе. Таким образом, модели являются самоисполняющимися пророчествами, и мы должны сделать профессионалов, использующих и продающих эти решения, более общеизвестными.

Цели #NoMoreDataWeapons также дают тем ученым, занимающимся данными, которые интересуются этими проблемами, действительно хорошие идеи для создания решений для обработки данных, которые могут помочь в достижении этих целей. Даже если вас не интересует этот конкретный вопрос, некоторые идеи для науки о данных, которые я привожу ниже, могут вдохновить вас на то, чтобы вы задумались над собственным стремлением к более значимым проектам в области науки о данных.

Цели:

1. Способствуйте самоопределению чернокожих

а. Цель: информирование общественности о том, что представляют собой различные виды информационного оружия и как организовать борьбу с ними.

б. Идеи науки о данных

я. Разработайте серию оповещений Google на основе науки о данных в полиции (например, «полиция науки о данных», «наблюдение с помощью машинного обучения», «распознавание лиц AI в полиции») и доставьте их на фиктивный адрес электронной почты. Соберите результаты и разработайте аналитику НЛП, которая поможет получить представление о тенденциях в этой области, и напишите о результатах или сотрудничайте с другими исследователями.

II. Определите более технологичные полицейские управления и извлеките данные в этих областях, чтобы выявить различия с менее технологичными полицейскими управлениями.

2. Изменить национальный нарратив

а. Цель: задокументировать и продвигать рассказы чернокожих сообществ и отдельных лиц, непосредственно затронутых информационным оружием.

б. Идеи науки о данных

я. Определите доски общественного обсуждения в Интернете, где сообщества меньшинств могут сообщать об опыте работы полиции и создавать аналитические данные для выявления потенциального информационного оружия.

II. Разработайте сбор данных для источников из сообществ меньшинств и из сообществ большинства, чтобы продемонстрировать, как они по-разному говорят об одних и тех же проблемах, используя инструменты НЛП.

3. Консолидация и сбор данных

а. Цель: создать набор данных об используемых технологиях содержания под стражей и наблюдения на основе местоположения в США. Информируйте и поддерживайте политические инновации: развивайте и поддерживайте целевые кампании для продвижения политики в отношении использования информационного оружия.

б. Идеи науки о данных

я. Убедитесь, что сбор данных, разработанный на основе вашей идеи, остается «горячим» (например, продолжайте собирать данные и помещайте их в полезную аналитическую форму (например, в таблицу).

II. Общайтесь через блоги, информационно-пропагандистскую деятельность и сотрудничество, чтобы повысить осведомленность и создать ценную историю о своих усилиях.

Я надеюсь, что вы нашли это упражнение как информативным, так и вдохновляющим для ваших собственных занятий значимыми проектами по науке о данных.

Хотите узнать о науке о данных, карьерном росте, жизни или неправильных бизнес-решениях? Подпишитесь на мою рассылку здесь и получите ссылку на мою бесплатную электронную книгу.