Распознавание рукописных цифр с помощью scikit-learn

Распознавание рукописного текста — это проблема, которая восходит к первым автоматическим машинам, которым нужно было распознавать отдельные символы в рукописных документах. Подумайте, например, о почтовых индексах на письмах в почтовом отделении и об автоматизации, необходимой для распознавания этих пяти цифр. Безупречное распознавание этих кодов необходимо для автоматической и эффективной сортировки почты.

Развитие CNN вывело распознавание вещей на новый уровень. Но в этой статье мы собираемся использовать простой классификатор RandomForest для распознавания рукописных цифр.

Приступим к импорту необходимых библиотек и наборов данных.

Давайте посмотрим, как выглядят наши цифры, используя matplotlib.imshow().

Теперь пришло время обучить нашу модель и оценить ее. Как было сказано ранее, мы собираемся использовать простую модель классификатора случайного леса из библиотеки scikit-learn. Мы будем использовать данные от 1 до 1000 для обучения и от 1000 до 1796 для оценки.

После обучения и получения прогнозируемых результатов давайте сравним результаты с исходными значениями.

Наша модель показала себя неплохо. Он правильно предсказал 94% цифр, что весьма впечатляет.

Я благодарен наставникам на https://internship.suvenconsultants.com за то, что они предоставили отличные формулировки задач и дали многим из нас опыт стажировки по кодированию. Спасибо www.suvenconsultants.com.

Распознавание рукописных цифр с помощью scikit-learn

Вопросы по теме