Публикации по теме 'text-recognition'
Распознавание текста с помощью TensorFlow и CTC Network
В этом руководстве мы рассмотрим, как распознавать текст на изображениях с помощью TensorFlow и потери CTC с помощью модели нейронных сетей.
Самые продвинутые планы развития науки о данных, которые вы когда-либо видели! Поставляется с тысячами бесплатных учебных ресурсов и интеграцией ChatGPT! https://aigents.co/learn/roadmaps/intro
Если вы пришли к этой статье, то должны знать, что извлечение текста из изображений — сложная задача. Извлечение текста разных размеров, форм и..
Обзор технологий — «Компьютерное зрение» и как мы можем использовать его в энергетическом секторе?
Обзор технологий — компьютерное зрение и как мы можем его использовать в энергетическом секторе?
Автор Кристьян Эльянд | Разведчик технологий
Computer Vision – это направление искусственного интеллекта, целью которого является извлечение информации из цифровых изображений и видео. Наиболее распространенными функциями Computer Vision являются:
Обнаружение и классификация объектов; Распознавание текста с изображений (возможна идентификация как цифрового, так и рукописного..
Распознавание многозначных последовательностей с потерей CRNN и CTC с использованием PyTorch Framework
Распознавание многозначных последовательностей с потерей CRNN и CTC с использованием PyTorch Framework
Теория
Задача оптического распознавания символов (OCR) - довольно старая проблема, датируемая назад в 1970-е годы , когда была разработана первая технология омни-шрифтового распознавания текста. Сложность этой задачи обусловлена многими естественными особенностями текстов:
В некоторых алфавитах (например, в арабском языке, особенно в курсиве) буквы намного сложнее найти..
Декодирование поиска луча в нейронных сетях, обученных CTC
Быстрый и эффективный алгоритм со встроенной языковой моделью для декодирования выходных данных нейронной сети в контексте распознавания текста
Нейронные сети (NN), состоящие из сверточных слоев NN и повторяющихся слоев NN в сочетании с окончательным слоем временной классификации (CTC), являются хорошим выбором для распознавания (рукописного) текста.
Результатом NN является матрица, содержащая вероятности символов для каждого временного шага (положение по горизонтали), пример..
Распознавание текста Firebase: извлекайте нужный текст из изображений.
Распознавание текста — это один из API, который очень часто используют разработчики. К счастью, Firebase предоставляет эту функцию через свой SDK. Распознавание текста Firebase может распознавать все латинские языки. Если вам нужна дополнительная языковая поддержка, вы можете переключиться на облачное распознавание, которое поддерживает больше языков.
Есть бесконечные варианты использования и возможности распознавания текста Firebase. Его можно использовать для извлечения текста из..
Слово морфинг
В этом посте я опишу, как я использовал вложения word2vec и алгоритм поиска A * для преобразования слов.
Чтобы выполнить морфинг слов, мы определим граф G , где набор узлов N представляет слова, и есть некоторая функция неотрицательного веса f : N × N → ℝ. Учитывая начальное слово S и конечное слово E , наша цель - найти путь в графе, который минимизирует сумму весов, индуцированных f :
Обычно, когда говорят о морфинге слов, они имеют в виду поиск пути между S и..
Вопросы по теме 'text-recognition'
Повышение точности распознавания отсканированных документов
Я сканирую много документов формата A3 с помощью стандартного многофункционального устройства Brother A3, а затем использую FineReader Pro для распознавания изображений.
Однако я получаю много ошибок в распознаваемых символах и много странных не...
1900 просмотров
schedule
02.02.2023
Какую библиотеку использовать для извлечения текста из изображений?
Я пишу программу, которая при получении изображения математической задачи низкого уровня (например, 98 * 13) должна иметь возможность вывести ответ. Цифры будут черными, а фон - белым. Не капча, просто изображение математической задачи.
В...
34043 просмотров
schedule
08.07.2023
android - распознанный текст из библиотеки tess-two неверен
Я пытаюсь использовать библиотеку tess-two для распознавания текста с изображений.
Вот мой код:
load.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View v) {
// recognize...
2204 просмотров
schedule
01.04.2023
Пример текстового API Google Mobile Vision
В настоящее время я пишу код, который должен иметь возможность просматривать изображение текста, а затем извлекать текст из изображения для устройств на базе Android. Я провел небольшое исследование в Интернете и обнаружил, что Google предоставляет...
12798 просмотров
schedule
08.04.2024
Tesseract - Как извлечь текст из изображения для входных координат?
Мне нужно ввести изображение и координаты. Текст, присутствующий во входной координате, должен быть прочитан как вывод. Как это сделать с помощью node-tesseract?
4670 просмотров
schedule
02.10.2023
Приложение для распознавания текста
теперь я пытаюсь сделать приложение для камеры, которое может распознавать текст. Для этого я использую информацию из руководств от Google . На этом сайте описывается, как сделать полноэкранный ридер. Но мне нужно активировать текстовый сканер...
531 просмотров
schedule
31.07.2023
При распознавании текста с помощью AWS Rekognition не удается обнаружить большую часть текста
Я использую AWS Rekognition для обнаружения текста из PDF-файла, преобразованного в jpeg. На изображении, которое я использую, есть текст размером примерно 10-12 или обычная буквенная страница. Однако шрифт меняется по всему изображению несколько...
332 просмотров
schedule
21.09.2022
Распознавание текста с Unity
Я изо всех сил пытаюсь использовать распознавание текста. Когда я пытаюсь это сделать, он возвращает эту ошибку,
"An assembly with the same name `Vuforia.UnityExtensions' has already been imported. Consider removing one of the references or sign...
899 просмотров
schedule
27.06.2022
Преобразование изображений в черно-белые для распознавания изображений в R
Я пытаюсь получить некоторый опыт работы с автоматическим распознаванием текста и использую пакет tesseract для выполнения ocr на некоторых изображениях (например, на некоторых скриншотах, которые я сделал).
Чтобы повысить производительность...
3977 просмотров
schedule
24.05.2023
ML Kit - Android - Распознавание текста - Ориентация текста
Я запустил новое приложение для распознавания текста номеров файлов на полках и использовал следующее приложение ML Kit Text Recognition на Youtube: Учебное пособие по распознаванию текста ML KIT
Он отлично работает, пока номера файлов написаны...
1249 просмотров
schedule
04.05.2023
в чем разница между getCornerPoints() и getBoundingBox() в TextBlock (Android Vision)
Я не понимаю, какая разница между getCornerPoints() и getBoundingBox() в TextBlock, поскольку они оба возвращают координаты угловых точек ограничивающей рамки?? любой орган может уточнить?
540 просмотров
schedule
18.10.2022
Проблема с CountVectorizer из пакета scikit-learn
У меня есть набор данных обзоров фильмов. Он имеет два столбца: 'class' и 'reviews' . Я сделал большую часть рутинной предварительной обработки, например: уменьшил количество символов, удалил стоп-слова, удалил знаки препинания. В конце...
1426 просмотров
schedule
04.04.2023
Есть ли способ ускорить распознавание текста MLVision?
Я использую облачное распознавание текста MLVision для своего приложения. Я снимаю / загружаю фото, а затем запускаю процесс. Когда он распознает изображение и извлекает текст, я разделяю его и добавляю каждый отдельный блок в массив.
Код ниже...
281 просмотров
schedule
17.11.2022
Как использовать облачное зрение Google вместе с Unity для распознавания текста с помощью мобильной камеры?
Я тестирую проект о том, как читать текст с объектов и изображений с помощью облачного зрения Google. Используя мобильную камеру (iphone, ipad предпочтительно или телефоны Android), я хотел бы получить требуемый текст. Приложение Samsung bixby...
791 просмотров
schedule
22.10.2022
Может ли Google Vision API извлечь многоязычный код для соответствующего текста на изображении
Может ли Google Vision API сказать нам, к какому языку принадлежит текст на изображении?
Например, изображение содержит "Hello" на разных языках, например
https://pocketcultures.com/2008/10/30/say-hello-in-20-languages/
Можно ли получить...
308 просмотров
schedule
04.06.2022
как я могу обнаружить весь текст внутри блока с помощью Google Vision Api
Я пытаюсь извлечь текст из изображения с помощью google vision api, это работает. Но я просто хочу обнаружить часть изображения, чтобы получить определенный текст.
это изображение, которое я использовал
Я просто хочу извлечь весь текст...
1903 просмотров
schedule
04.03.2023
Граничная рамка для рукописного текста
У меня есть заполненная рукописная форма (однако форма напечатана, она заполнена рукописной информацией), и я хотел извлечь из формы только рукописный текст....
В настоящее время я жестко запрограммировал ограничивающую рамку с помощью openCV и...
597 просмотров
schedule
13.12.2023
Как использовать обнаружение текста ML Kit для нелатиноазиатских (бенгальский/хинди) языков
У меня есть визитная карточка содержит имя и адрес. они написаны на двух разных языках (бенгальском и английском). Используя MLKIt, я могу извлечь только английский язык. Теперь я хочу извлечь бенгальский текст из захваченного изображения визитной...
739 просмотров
schedule
31.10.2022
Извлечь письмо из капчи с помощью opencv
Я пытаюсь извлечь буквы из особенно раздражающей капчи.
Я пытаюсь сделать это с помощью opencv2, и пока это не дает мне потрясающих результатов. Возможно, я не выполнил правильные операции. Вот один из моих входов:...
501 просмотров
schedule
08.01.2023
проблема с чтением изображений набора данных mjsynth
недавно я пытаюсь обучить сеть распознавания текста. Я попытался начать обучение, передав набор данных mjsynth сеть. Тем не менее, кажется, что в наборе данных есть несколько пустых изображений. Итак, во время обучения, если я напрямую передаю...
219 просмотров
schedule
04.12.2022