Чтобы приступить к созданию классификатора, я сразу же наткнулся на проблему: у меня нет фотографий моего набора данных.

Создать набор данных может быть сложно, особенно если у вас мало свободного времени. К счастью, обычно вам может сойти с рук сбор ресурсов с помощью Интернета.

Прежде чем вы начнете, важно помнить, что Google всегда ваш друг и набрав: «база данных монет», вероятно, может дать вам набор данных, который может сэкономить вам часы работы. В моем случае, к сожалению, это было не так.

Прежде всего, зайдя в мой терминал, предполагая, что у вас уже настроен Python 3, я установил скрипт Python, который будет загружать первые 100 изображений из изображений Google: здесь.

Документация даст вам немного аргументов, которые, несомненно, будут полезны в будущем сокращении. Например, исключаемые ключевые слова, ограничение на количество загружаемых изображений и путь к каталогу. По умолчанию вы будете загружать 100 изображений, которые будут помещены в папку с названием downloads. Поскольку мне понадобятся 4 небольших набора данных, я могу вырезать несколько строк, просто вставив запятую после каждой, автоматически указав моему терминалу загрузить еще один набор из 100 изображений после пенни монеты.

Вот скрипт, который я запустил:

# install google images downloader
pip install google_images_download
# download with the keywords penny, nickel, dime, and quarter.
googleimagesdownload -k "penny coin, nickel coin, dime coin, quarter coin"

Ресурсы, предлагаемые изображениями Google, могут быть не самыми лучшими, но они предлагают отличный старт для участия в проекте. Прокрутив вниз, вы можете найти знаменитостей по имени «Пенни» или раковины из никеля. Который вам нужно будет удалить вручную. В моем случае мне также нужно было удалить канадские монеты. (Просьба Google не включать ничего, что говорит, что Канадец дает мне около 4 монет, прежде чем дать мне мусор)

Хотя это не может быть отличной альтернативой для всех. Мой альтернативный способ работы над проектом заключался в том, чтобы делать снимки вручную. Если ваша конечная цель — набор данных о фруктах, отправляйтесь в продуктовый магазин; нужен набор данных рубашек иди в магазин одежды. Нужен набор данных по самолетам, я даже не знаю, что вам сказать. Дело в том, что этот альтернативный вариант не будет работать во всех ситуациях. У меня дома есть маленькая копилка. Поэтому мне пришлось пройти весь путь до своей комнаты и сделать снимок.

Вы можете делать фотографии одну за другой или, как я, вы можете сфотографировать все монеты как один раз, а затем обрезать каждую одну за другой.

Во многом этот процесс требует здравого смысла в отношении того, что использовать, а что нет. Машинное обучение — это процесс, созданный людьми. Все, что вы можете сделать, — это проработать его и подумать, могу ли я использовать это изображение. Это отличается от моих других изображений. Если это не так, вы можете избавиться от него, чтобы избежать чрезмерной подгонки.