С резким увеличением количества умных вещей, подключенных к Интернету, объем данных, генерируемых такими устройствами, увеличивается в геометрической прогрессии. Однако большая часть этих данных бесполезна, и поэтому фильтрация бесполезных данных является важной задачей. Как мы отфильтровываем важную часть и удаляем шум из потоков данных датчиков, чтобы генерировать полезную информацию?

В этой рецензии на доклад я хочу указать на интересное и важное пересечение Data Science и IoT.

Аннотация

Основная цель этого доклада — описать, как мы используем python и sklearn для моделирования и анализа данных датчиков временных рядов. В частности, я расскажу, как мы используем Python для обработки данных с датчика с поддержкой IoT, прикрепленного к бите для крикета, построения моделей машинного обучения на данных и использования инструментов с открытым исходным кодом для развертывания наших моделей в сенсорном устройстве в качестве интеллектуального IoT. применение.

Схема

Сессия начнется с изучения некоторой базовой терминологии, чтобы помочь аудитории лучше понять выступление. За этим последует изучение того, как мы формируем характеристики продукта (которые являются не чем иным, как ответами на большинство потребностей клиентов), быстро создавая и подтверждая гипотезу. Эта часть будет в основном о том, как поделиться некоторыми подходами к базовому коду в python. Следующее, что мы обсудим, — это то, как можно использовать инструменты Python с открытым исходным кодом для создания и развертывания моделей машинного обучения в автономном устройстве обнаружения движения IoT. Мы завершаем выступление тем, что оставляем аудитории пищу для размышлений и указываем на интересную и важную область науки о данных и умного мира IoT.

Описание

Чтобы продемонстрировать проблему, мы помещаем сенсорное устройство на биту для крикета. Устройство IoT представляет собой миниатюрный беспроводной инерциальный измерительный блок MEMS (IMU). IMU включает в себя трехосное измерение ускорения и угловой скорости летучей мыши с маломощным Bluetooth для передачи этих данных на мобильный телефон.

Во-первых, мы собираем данные на основе событий, а не сохраняем весь поток. Это снова ставит вопрос: как мы определяем событие? Что отличает событие от окружающего «несобытийного» контекста? Вот некоторые из вопросов, на которые необходимо ответить, чтобы определить событие. Наблюдая, как игрок с битой в крикет стоит и готовится к замаху, человеческий мозг постоянно фильтрует свое визуальное восприятие и способен обнаруживать и отличать замах от активности до и после замаха. Нам нужно иметь возможность автоматизировать тот же самый процесс. Некоторые экземпляры данных могут быть помечены, а другие нет. Это помогает в обучении и оценке моделей машинного обучения позже.

Во-вторых, после того, как мы извлекли данные временных рядов на основе экземпляров, мы можем приступить к анализу этих основанных на событиях наборов данных, чтобы понять язык данных датчиков. Для этого мы используем Jupyter Lab для интерактивной работы с данными. Как данные акселерометра отображают физическое движение в реальном мире? Этот шаг помогает нам найти связь между действиями в реальном мире и набором данных датчика. Ну, процесс извлечения будет подвержен шумам.

Данные поступают в файлы CSV, и Python кажется нам правильным выбором для чтения и анализа данных. Популярная библиотека обработки данных Pandas предлагает фреймы данных, которые удобны для быстрого интерактивного формирования и проверки гипотез в блокнотах Jupyter. Любой анализ будет неполным без визуализации, поэтому Matplotlib помогает нам лучше понять данные. Мы быстро тестируем модели машинного обучения с помощью Sklearn, в котором уже реализовано большинство стандартных алгоритмов. В этом ключевом докладе будет описан некоторый анализ (вместе с кодом Python), чтобы показать, как мы предприняли несколько шагов прямо от формирования гипотезы до реализации решения на уровне устройства. Все это демонстрирует, как Python и его богатый набор библиотек помогают формировать решения для некоторых функций, связанных с продуктом.

В-третьих, нам нужно автоматизировать задачу выделения конкретного экземпляра из потока. Чтобы это произошло, мы можем либо передать модель машинного обучения, либо создать алгоритм на основе правил, который может классифицировать события по сегментам.

Теперь каждый шаг имеет свой собственный набор проблем. Во-первых, приложение, над которым мы работаем, предполагает использование датчиков движения, прикрепленных к задней части биты для крикета. В поле есть сетевые ограничения. Если спортсмен хочет получать аналитику в реальном времени с устройства, разделение должно происходить в автономном режиме. Нам приходится размещать модели на миниатюрных сенсорных устройствах, потому что иногда игроки даже не носят свои мобильные телефоны на игровую площадку. Поэтому наша цель — позволить устройствам оставаться независимыми при выполнении алгоритмов машинного обучения самостоятельно.

Какое отношение это выступление имеет к аудитории?

Это выступление важно для аудитории, поскольку оно указывает на интересное и важное измерение Интернета вещей и науки о данных. Контекст крикетной биты и качелей представляет собой интересный пример для работы. И, конечно же, один и тот же подход можно использовать для решения множества задач в сходных и связанных областях. Беседа — это конкретный вариант использования (крикет) для более широкого круга проблем.

Мы решили проблему?

Мы предприняли некоторые начальные шаги к решению проблемы, даже близко не подойдя к решению всей проблемы.

Это представляет интересную основу для игрока с битой, который может преобразовать результативность игры в данные, а затем извлечь уроки из этой информации, чтобы стать лучше в игре! Даже средний игрок может улучшить спорт, изучая аналитику. Решение имитирует личного помощника, сидящего прямо у вас в кармане и рассказывающего вам, как улучшить вашу производительность раз за разом. Это может создать еще одно измерение, в котором игроки могут учиться у лучших исполнителей. Итак, вы хотите улучшить свою игру?

Если вам интересно поговорить об этом подробнее, я буду рад поговорить с вами.

Дайте мне знать, понравилась ли вам эта статья, нажав кнопку аплодисментов и оставив комментарий.