Я использовал OCR в своих онлайн-экзаменах, и это значительно упростило их

Спасатель для студентов вузов

Приятно, когда ты проходишь тяжелую работу с оружием, которое есть только у тебя, а у других - нет.

Вот как я использовал оптическое распознавание текста на своих онлайн-экзаменах и упростил их для себя, в то время как другим пришлось с ними бороться.

Во-первых, что такое OCR и для чего оно используется?

OCR (оптическое распознавание символов) - важное программное решение, которое преобразует рукописный текст или текст изображения в редактируемый текст.

То есть он распознает текст, и вы можете его редактировать. После того, как бумажный документ прошел обработку OCR, текст можно было сохранять, искать и редактировать с помощью текстовых процессоров, таких как MS Word.

До того, как он стал доступен, единственным вариантом оцифровки печатных документов было сесть перед компьютером и перепечатать его, что занимает много времени и сводится к неточностям и человеческим ошибкам.

Это менее известная технология, но очень важная. Он широко используется для автоматизации ввода данных, распознавания номерных знаков на платных воротах и ​​в почтовых отделениях.

OCR в почтовых отделениях - пример:

В почтовой службе США более 95% рукописных писем сортируются автоматически.

Как это работает?

⬜⬜⬜⬜⬜⬜🔳🔳⬜⬜⬜⬜⬜⬜⬜
⬜⬜⬜⬜⬜⬜🔳🔳⬜⬜⬜⬜⬜⬜⬜
⬜⬜⬜⬜⬜🔳🔳🔳🔳⬜⬜⬜⬜⬜⬜
⬜⬜⬜⬜⬜🔳🔳⬜🔳⬜⬜⬜⬜⬜⬜
⬜⬜⬜⬜🔳🔳⬜⬜🔳🔳⬜⬜⬜⬜⬜
⬜⬜⬜⬜🔳🔳⬜⬜🔳🔳⬜⬜⬜⬜⬜
⬜⬜⬜🔳🔳⬜⬜⬜⬜🔳🔳⬜⬜⬜⬜
⬜⬜⬜🔳🔳⬜⬜⬜⬜🔳🔳⬜⬜⬜⬜
⬜⬜⬜🔳🔳⬜⬜⬜⬜🔳⬜🔳⬜⬜⬜
⬜⬜🔳⬜⬜🔳🔳🔳🔳⬜⬜🔳⬜⬜⬜
⬜⬜🔳🔳🔳🔳🔳🔳🔳🔳🔳🔳🔳⬜⬜
⬜🔳🔳⬜⬜⬜⬜⬜⬜⬜⬜🔳🔳⬜⬜
⬜🔳🔳⬜⬜⬜⬜⬜⬜⬜⬜⬜🔳🔳⬜
🔳🔳⬜⬜⬜⬜⬜⬜⬜⬜⬜⬜🔳🔳⬜
🔳🔳⬜⬜⬜⬜⬜⬜⬜⬜⬜⬜⬜🔳🔳

Все квадраты здесь представляют пиксели на экране. Это пиксельный узор буквы «А». Механизм OCR содержит каждую букву, цифру, символ каждого языка, предварительно загруженного.

Когда он перемещается по документу, если пиксели определенного символа близко совпадают с любым из предварительно загруженных символов, он подтверждает символ. Если подтвердить персонажа не удалось (что случается редко), он просит вас ввести данные, чтобы его обучили.

Как я использовал OCR в своих интересах - Мои онлайн-экзамены

Наш образец экзамена:

Наши онлайн-экзамены были ОТКРЫТЫМ ИНТЕРНЕТОМ (возможно, вы слышите это впервые). Это означает, что мы могли искать ответы в Интернете. Однако это не так просто, как вы думаете. В вопроснике задан очень высокий уровень, который мы называем HOTS (высшие навыки мышления).

Мы должны были тщательно подготовиться к каждой концепции, чтобы хорошо сдавать экзамены. Студенты, которые планировали не учиться и просто полагаться на интернет на экзамене, буквально завалили его.

Материалы нашего факультета - как они выглядят?

Это изображение, а не текст. Итак, если возникает вопрос о «подходе к кремниевому острову», вы не можете нажать Ctrl + F и выполнить поиск по ключевому слову, чтобы перейти на нужную страницу.

Я знаю, что во время экзамена это утомительно - искать на 2000 страницах одну тему.

Что студенты (нетехники) делают на экзамене?

Наши факультеты загружают около 30 ppt и pdf в раздел материалов. Мы должны были, по крайней мере, знать расположение тем, на которые нужно ссылаться и писать во время экзамена. Студенты загружают их все в папку, оставляя надежду, что они смогут найти правильные страницы для вопросов на экзамене.

Пункты содержат много информации, и большинство из них не текст, это изображения. Таким образом, они не могут вовремя определить правильную страницу для ответа, а позже сильно сожалеют. Хотя для одаренных студентов есть исключения.

Что я сделал, чтобы преодолеть это? OCR!

Я использую Abbyy FineReader 15, который является одним из самых мощных и точных инструментов для обработки текста. Я объединяю и открываю все свои файлы PDF и PPT в редакторе OCR, и он сканирует каждую мелочь в документах.

Программа также корректирует ориентацию документа, если он изображен по горизонтали или по диагонали. Теперь я мог легко искать слово, и оно переводило меня на эту страницу.

Это требует много времени, батареи и возможностей обработки. Мой ноутбук также немного нагревается во время работы. Окончательный PDF-файл очень велик (около 200–300 МБ), потому что теперь в него добавлено много дополнительных деталей.

Как это выглядит?

В процессе:

Конечный результат:

Фотография учебника теперь преобразована в текст с возможностью поиска и редактирования. Теперь вы ищете какое-нибудь слово, и оно приведет вас на эту страницу.

Abbyy работает в автономном режиме - все еще мощно:

Вы также можете выполнить OCR онлайн в Google Фото и Lens. Abbyy может выполнять невероятное распознавание текста только в автономном режиме. Онлайн-движки OCR не такие мощные, как сейчас. Программное обеспечение работает на основе искусственного интеллекта и машинного обучения и было обучено на большом количестве обучающих данных.

Так что вероятность ошибки очень мала. Вы также можете сообщить им, если обнаружите ошибку, чтобы они снова обучили программное обеспечение и исправили ошибку в следующих обновлениях.

На самом деле это не дало мне ответов непосредственно на экзамене, но облегчило их поиск за два часа времени, когда я грыз гвоздь. Так что это очень помогло.

Вот что вкратце представляет собой OCR и что оно делает в случае использования моих онлайн-экзаменов. Надежда… не надежда. Вам понравилось.