Teachable Machine (TM) — это щедрый способ Google сделать машинное обучение более доступным. Вы можете обучать модели распознавать изображения, звуки и позы тела, классифицируя свои собственные входные изображения. Например, вы можете научить ТМ идентифицировать ваши движения левой и правой головы как два отдельных класса, которые затем можно использовать для управления мини-игрой в змею в мл5 в вашем браузере. О, подождите, это именно то, что сделал мой интернет-герой Кодинг-поезд. Крутая вещь!

При создании проекта позы (с использованием отслеживания тела) TM дает вам возможность загружать изображения или вводить живые изображения с помощью веб-камеры для определения поз человека. Обычно это более точно, когда вы используете камеру, потому что вы можете ввести гораздо больше данных с меньшими усилиями. Однако это может стать проблемой, если вы хотите, чтобы ваш продукт использовали люди, не являющиеся вашими прямыми клонами! Если ваша колония клонов будет целевыми пользователями, то это идеально для вас! Извините, если вы разрабатываете дизайн для людей. Эх, люди!! Худшее, да?

Чтобы получить более широкий диапазон входных данных и человеческих форм, цветов и размеров, я хотел посмотреть, смогу ли я создать модель с вводом изображения, используя множество разных изображений. Чтобы вводить изображения, мне нужно было много фотографий с разными людьми… но где взять такие изображения? Если бы только был какой-то способ ввести поисковый запрос и получить какой-то репозиторий изображений, который появится в ответ. Это было бы отличным бизнес-предприятием для всех, кто заинтересован. О, подождите, Google Images. Ах! Он уже существует.

Следующей моей мыслью было: «Как мне использовать этот репозиторий изображений, чтобы облегчить себе работу?» Что ж, интернет-незнакомец, на самом деле это довольно просто. После поиска «как загрузить изображения для обучения машинному обучению» все выглядело… Python-y. Я решил, что 16:00 вторника — не самое подходящее время, чтобы начать учиться программировать на Python. Об этом не могло быть и речи, одного дня, который я провел в университете, пытаясь использовать Python, мне было более чем достаточно. НО я нашел расширение Chrome, которое делало то, что мне нужно, и оно называется «Загрузить все изображения». Я возношу безмолвную молитву создателям расширений Chrome, которые значительно упрощают мою привилегированную жизнь.

Вот как я это сделал.

Установите расширение Chrome

Сделай это здесь

Найдите что-нибудь в Google Images

Чем универсальнее, тем лучше. Идея состоит в том, чтобы получить МНОГО изображений. Итак, если вы ищете что-то вроде «Джим Керри рисует в своем доме в Лос-Анджелесе», у вас будет хороший опыт, но он не очень полезен для модели машинного обучения. Если только вы не Джим Керри и не хотите, чтобы компьютер проигрывал ваши рисунки каждый раз, когда видит, как вы рисуете. Привет, Джим Керри! Большой поклонник.

Я отвлекся… где мы были? Я погуглил «Поза дерева в йоге», чтобы все было просто и дзен.

Как ни странно, я хотел использовать Google Images, чтобы получить более разнообразный набор данных, но когда вы вводите слова, связанные с йогой, происходит обратное. Это просто тощие белые дамы, бросающие вызов человеческой гибкости. Виноват. Возможно, мне следовало выбрать более разнообразную в расовом отношении человеческую позу.

Нажмите на расширение и откройте zip-файл.

Нажмите на расширение «Загрузить все изображения» во время поиска изображений (для этого щелкните маленькую головоломку в правом верхнем углу браузера Chrome, чтобы найти расширение). Это автоматически сохранит zip-файл со всеми изображениями на странице в папку загрузок на вашем Mac (или что-то вроде эквивалента Windows, я на самом деле не знаю, как работают компьютеры).

Вот что я распаковал:

Удалите все ненужные изображения

В итоге у меня получилось 140 изображений людей в позе дерева. Вы можете продолжать прокручивать пропасть Google и повторять процесс, пока не сделаете хороший выбор. Расширение также сканировало значки на веб-странице, поэтому избавьтесь от них.

Создайте новый проект на Teachable Machine

Перейдите сюда и нажмите начать. Выберите, какой проект вы хотите сделать. Ваши загруженные изображения не будут очень полезны, если вы хотите сделать аудиопроект, но все же стоит проверить. Боже, разве мы не любим Google? И под Богом я подразумеваю Ларри Пейджа и Сергея Брина.

Перетащите изображения в свой первый класс

Дайте своему классу классное название, например «Поза дерева» или «Мои слезы». Загрузите их! Вы также можете вводить изображения своего лица/тела через веб-камеру.

Сделайте свои собственные образцы

После прохождения хромированного расширения, распаковки и системного расизма я решил встать на свои настоящие ноги и позволить им поддерживать вес моего тела, чтобы делать живые изображения. Делайте это на свое усмотрение. Проконсультируйтесь со своим дизайнером, чтобы узнать, безопасно ли вам отводить взгляд от каркасов Figma более чем на минуту.

* Измените настройки, если вы не можете одновременно удерживать мышь и позировать.

Обучите модель

Следующее, что вам нужно сделать, это обучить вашу модель. Не закрывайте вкладку, пока это происходит. В зависимости от количества ваших образцов это может занять некоторое время. После того, как вы обучили модель, вы можете проверить, может ли она различать два класса. Или, может быть, вы хотите три или четыре класса! Это зависит от вас.

Тестирование модели

После того, как вы обучили свою модель, вы можете протестировать ее и посмотреть, узнаваемы ли ваши позы. В конце концов, мне пришлось заново обучать позу дерева с моими входными изображениями вручную. Я не уверен, насколько хорошо эта массовая загрузка изображений работает для поз, мне придется когда-нибудь попробовать еще раз. Несмотря на это, я думаю, что Teachable Machine — это такой мощный инструмент для людей из всех дисциплин. Интерфейс позволяет действительно понять, как обрабатываются ваши данные, и это определенно стоит попробовать! Я обязательно надену более длинную юбку в следующий раз, когда буду экспериментировать с Teachable Machine!

Если вам это показалось интересным, ознакомьтесь с другими Экспериментами с Google, чтобы увидеть несколько очень крутых применений этой технологии и множество других интересных экспериментов! Кроме того, не стесняйтесь, дайте мне знать, если я что-то объяснил неправильно или не совсем понял какой-то жаргон. Я хочу продолжать учиться и развиваться в этой области, и я открыт для любых исправлений в комментариях!