Распознавание рукописных цифр с помощью машинного обучения

Машинное обучение и глубокое обучение играют важную роль в инновациях ПК и искусственном интеллекте. С использованием машинного обучения и ИИ можно уменьшить человеческое усилие в восприятии, обучении, прогнозировании и многих других областях. Теперь на сцену выходит компьютерное зрение.Компьютерное зрение — это междисциплинарная научная область, изучающая, как компьютеры могут получать высокоуровневое понимание цифровых изображений или видео. С инженерной точки зрения он стремится понять и автоматизировать задачи, которые может выполнять зрительная система человека. Теперь давайте узнаем больше о машинном обучении. Машинное обучение — это приложение искусственного интеллекта (ИИ), которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования. Машинное обучение фокусируется на разработке компьютерных программ, которые могут получать доступ к данным и использовать их для самостоятельного обучения.

В этой статье мы собираемся выполнить нашу задачу на наборе данных распознавания рукописных цифр, представленном в библиотеке sklearn.dataset, и мы проверим, должны ли мы принять нулевую гипотезу или нет. Здесь наша нулевая гипотеза такова: «Предсказывает ли набор данных digits библиотеки scikit-learn цифру точно в 95 % случаев или нет»?

Что такое распознавание рукописных цифр?

Распознавание рукописных цифр — это способность компьютеров распознавать рукописные цифры человека. Это сложная задача для машины, потому что рукописные цифры не идеальны и могут быть сделаны разными способами. Распознавание рукописных цифр является решением этой проблемы, которое использует изображение цифры и распознает цифру, присутствующую на изображении.

Здесь, чтобы проверить свидетельство нулевой гипотезы, мы делаем наш прогноз, используя 2 алгоритма. Если в обоих случаях, если модель достигнет точности 0,95, мы примем нашу нулевую гипотезу, иначе мы ее отвергнем.

Сначала мы импортируем все необходимые библиотеки. Затем мы загружаем набор данных, который находится в sklearn, с помощью datasets.load_digits() . Чтобы узнать содержимое набора данных, мы будем использовать функцию dir().

Этот набор данных состоит из 1797 изображений размером 8x8 пикселей. Каждое изображение представляет собой рукописную цифру в оттенках серого. Теперь давайте проверим длину набора данных.

Теперь давайте проверим целевой набор данных.

Ниже мы нанесли несколько случайных изображений из набора данных.

После всего этого давайте создадим модель. Сначала мы выбираем алгоритм машины опорных векторов для создания нашей модели. Итак, мы импортируем SVC из sklearn.svm. Затем мы создадим объект SVC. Затем мы применим GridSearchCV, чтобы найти лучшие параметры для обучения нашей модели и использовать best_params_ .

Для обучения и тестирования мы возьмем 1257 изображений для обучения и остальных для тестирования. Затем мы построим матрицу путаницы.

Теперь напечатаем точность .

Теперь проверим точность другого алгоритма. Мы будем использовать случайный лес. Мы будем следовать тому же процессу. Сначала мы создадим модель. Для этого мы импортируем RandomForestClassifier из библиотеки sklearn.ensemble. Затем мы применим GridSearchCV, чтобы выбрать наилучшие параметры для нашего обучения.

Теперь мы будем обучать наши данные.

Используя тепловую карту, мы построим матрицу путаницы.

Распечатаем результат теста.

Из приведенных выше результатов двух тестов ясно, что мы получаем точность 95% в случае метода опорных векторов. Так что это верно не для всех алгоритмов. Следовательно, мы отклоним нулевую гипотезу и примем альтернативную.

Рабочий код вы можете найти на Github.

Я благодарен наставникам на «https://internship.suvenconsultants.com за отличные формулировки задач и предоставление многим из нас опыта стажировки по программированию. Спасибо www.suvenconsultants.com'

Распознавание рукописных цифр с помощью машинного обучения

Что такое распознавание рукописных цифр?

Вопросы по теме