Свою любовь к аналитике данных я обнаружил некоторое время назад. Тем не менее, он продолжает достигать новых высот, и с начала года он зашел так далеко, что я использую Жизненный цикл инструмента для анализа практически всего, что я сделал, и когда, где и как долго я это делал. . Что я могу сказать? Я люблю аналитику данных!

Вот почему я был очень взволнован Porsche Hackathon в Штутгарте, где компьютерные ученые, математики и другие знатоки данных взялись за решение проблемы больших данных.

48 часов, эксклюзивные данные, полученные за более чем 4500 дней испытаний автомобилей, 26 человек, 7 команд - это был случай с сухими данными. Но на первый взгляд это не показывает, насколько образовательным на самом деле был хакатон. Было интересно наблюдать, как команды структурируют и анализируют данные о транспортных средствах, и я сделал три важных вывода для моей работы в Porsche Digital Lab:

Проблема выглядит совершенно иначе, если рассматривать ее сверху, а не сбоку.

1. Данные - это искусство. Визуализация данных чрезвычайно важна для лучшего понимания баз данных и новых перспектив. Фактически, они только преобразуют сложные данные в мир изображений, переводя измерения и статистику в цвета, узоры и формы. И все же то, что возникает, - это намного больше, чем простая визуализация. На хакатоне команда Die FIXen красиво визуализировала данные, как вы можете видеть на изображении заголовка этой статьи - для меня это искусство. Искусство, которое может принимать самые разные формы, как продемонстрировали студенты Потсдамского университета прикладных наук: они визуализировали результаты Индекса социальной справедливости Фонда Бертельсманна как интерактивную инсталляцию. Они использовали ряд различных песчаных форм, чтобы проиллюстрировать состояние детской бедности в 28 европейских странах. Представление результатов исследования на другом уровне упрощает их усвоение и понимание.

2. Все зависит от точки зрения: семь команд имеют по крайней мере 26 разных точек зрения на одну и ту же проблему - в результате все участники получают стимул к новым подходам. Проблема выглядит совершенно иначе, если рассматривать ее сверху, а не сбоку. При этом нет правильных или неправильных ответов - только разные точки зрения.

Мне любопытно посмотреть, какие перспективы станут реальностью в будущем благодаря новым технологиям и интерфейсам. И какую точку зрения примет искусственный интеллект при анализе данных - и какую визуализацию и интерпретацию он выберет, чтобы подготовить свои выводы для потребления человеком.

И все же то, что возникает, - это намного больше, чем простая визуализация.

3. Деревья помогают классифицировать данные. Я также много узнал о классификации данных, то есть о том, как структурировать и организовывать данные, чтобы сделать скрытые в них результаты более доступными. Это включает, например, повышение, когда несколько слабых классификаторов автоматически объединяются в хороший классификатор. А процедура случайного леса - очень демократичный способ классификации данных. Случайный лес состоит из разных деревьев решений, каждое из которых принимает решение, каждое голосование осуществляется демократическим способом (простите за смешанные метафоры). И побеждает категория с наибольшим количеством голосов. Это означает: затем он принимает решение об окончательной классификации данных.

Хорошо, хорошо, называй меня ботаником, если хочешь.

Но тем, кто утверждает, что это волнует только технарей, я говорю: даже в Музее современного искусства была выставка, на которой были представлены результаты визуализации данных. И деревья решений используются в бесчисленных условиях - они, помимо прочего, являются отличным инструментом для принятия более сложных личных решений как в личной, так и в рабочей жизни.

Если вы любите аналитику данных так же, как и я, или хотите узнать больше, просто подпишитесь на Porsche Digital Lab в Берлине и я в Твиттере и будьте первым, кто узнает о последних проектах и ​​событиях.

#NextLevelGermanEngineering