Публикации по теме 'text-recognition'


Распознавание текста с помощью TensorFlow и CTC Network
В этом руководстве мы рассмотрим, как распознавать текст на изображениях с помощью TensorFlow и потери CTC с помощью модели нейронных сетей. Самые продвинутые планы развития науки о данных, которые вы когда-либо видели! Поставляется с тысячами бесплатных учебных ресурсов и интеграцией ChatGPT! https://aigents.co/learn/roadmaps/intro Если вы пришли к этой статье, то должны знать, что извлечение текста из изображений — сложная задача. Извлечение текста разных размеров, форм и..

Обзор технологий  — «Компьютерное зрение» и как мы можем использовать его в энергетическом секторе?
Обзор технологий — компьютерное зрение и как мы можем его использовать в энергетическом секторе? Автор Кристьян Эльянд | Разведчик технологий Computer Vision – это направление искусственного интеллекта, целью которого является извлечение информации из цифровых изображений и видео. Наиболее распространенными функциями Computer Vision являются: Обнаружение и классификация объектов; Распознавание текста с изображений (возможна идентификация как цифрового, так и рукописного..

Распознавание многозначных последовательностей с потерей CRNN и CTC с использованием PyTorch Framework
Распознавание многозначных последовательностей с потерей CRNN и CTC с использованием PyTorch Framework Теория Задача оптического распознавания символов (OCR) - довольно старая проблема, датируемая назад в 1970-е годы , когда была разработана первая технология омни-шрифтового распознавания текста. Сложность этой задачи обусловлена ​​многими естественными особенностями текстов: В некоторых алфавитах (например, в арабском языке, особенно в курсиве) буквы намного сложнее найти..

Декодирование поиска луча в нейронных сетях, обученных CTC
Быстрый и эффективный алгоритм со встроенной языковой моделью для декодирования выходных данных нейронной сети в контексте распознавания текста Нейронные сети (NN), состоящие из сверточных слоев NN и повторяющихся слоев NN в сочетании с окончательным слоем временной классификации (CTC), являются хорошим выбором для распознавания (рукописного) текста. Результатом NN является матрица, содержащая вероятности символов для каждого временного шага (положение по горизонтали), пример..

Распознавание текста Firebase: извлекайте нужный текст из изображений.
Распознавание текста — это один из API, который очень часто используют разработчики. К счастью, Firebase предоставляет эту функцию через свой SDK. Распознавание текста Firebase может распознавать все латинские языки. Если вам нужна дополнительная языковая поддержка, вы можете переключиться на облачное распознавание, которое поддерживает больше языков. Есть бесконечные варианты использования и возможности распознавания текста Firebase. Его можно использовать для извлечения текста из..

Слово морфинг
В этом посте я опишу, как я использовал вложения word2vec и алгоритм поиска A * для преобразования слов. Чтобы выполнить морфинг слов, мы определим граф G , где набор узлов N представляет слова, и есть некоторая функция неотрицательного веса f : N × N → ℝ. Учитывая начальное слово S и конечное слово E , наша цель - найти путь в графе, который минимизирует сумму весов, индуцированных f : Обычно, когда говорят о морфинге слов, они имеют в виду поиск пути между S и..

Вопросы по теме 'text-recognition'

Повышение точности распознавания отсканированных документов
Я сканирую много документов формата A3 с помощью стандартного многофункционального устройства Brother A3, а затем использую FineReader Pro для распознавания изображений. Однако я получаю много ошибок в распознаваемых символах и много странных не...
1900 просмотров

Какую библиотеку использовать для извлечения текста из изображений?
Я пишу программу, которая при получении изображения математической задачи низкого уровня (например, 98 * 13) должна иметь возможность вывести ответ. Цифры будут черными, а фон - белым. Не капча, просто изображение математической задачи. В...
34043 просмотров
schedule 08.07.2023

android - распознанный текст из библиотеки tess-two неверен
Я пытаюсь использовать библиотеку tess-two для распознавания текста с изображений. Вот мой код: load.setOnClickListener(new View.OnClickListener() { @Override public void onClick(View v) { // recognize...
2204 просмотров

Пример текстового API Google Mobile Vision
В настоящее время я пишу код, который должен иметь возможность просматривать изображение текста, а затем извлекать текст из изображения для устройств на базе Android. Я провел небольшое исследование в Интернете и обнаружил, что Google предоставляет...
12798 просмотров

Tesseract - Как извлечь текст из изображения для входных координат?
Мне нужно ввести изображение и координаты. Текст, присутствующий во входной координате, должен быть прочитан как вывод. Как это сделать с помощью node-tesseract?
4670 просмотров

Приложение для распознавания текста
теперь я пытаюсь сделать приложение для камеры, которое может распознавать текст. Для этого я использую информацию из руководств от Google . На этом сайте описывается, как сделать полноэкранный ридер. Но мне нужно активировать текстовый сканер...
531 просмотров

При распознавании текста с помощью AWS Rekognition не удается обнаружить большую часть текста
Я использую AWS Rekognition для обнаружения текста из PDF-файла, преобразованного в jpeg. На изображении, которое я использую, есть текст размером примерно 10-12 или обычная буквенная страница. Однако шрифт меняется по всему изображению несколько...
332 просмотров

Распознавание текста с Unity
Я изо всех сил пытаюсь использовать распознавание текста. Когда я пытаюсь это сделать, он возвращает эту ошибку, "An assembly with the same name `Vuforia.UnityExtensions' has already been imported. Consider removing one of the references or sign...
899 просмотров
schedule 27.06.2022

Преобразование изображений в черно-белые для распознавания изображений в R
Я пытаюсь получить некоторый опыт работы с автоматическим распознаванием текста и использую пакет tesseract для выполнения ocr на некоторых изображениях (например, на некоторых скриншотах, которые я сделал). Чтобы повысить производительность...
3977 просмотров

ML Kit - Android - Распознавание текста - Ориентация текста
Я запустил новое приложение для распознавания текста номеров файлов на полках и использовал следующее приложение ML Kit Text Recognition на Youtube: Учебное пособие по распознаванию текста ML KIT Он отлично работает, пока номера файлов написаны...
1249 просмотров

в чем разница между getCornerPoints() и getBoundingBox() в TextBlock (Android Vision)
Я не понимаю, какая разница между getCornerPoints() и getBoundingBox() в TextBlock, поскольку они оба возвращают координаты угловых точек ограничивающей рамки?? любой орган может уточнить?
540 просмотров

Проблема с CountVectorizer из пакета scikit-learn
У меня есть набор данных обзоров фильмов. Он имеет два столбца: 'class' и 'reviews' . Я сделал большую часть рутинной предварительной обработки, например: уменьшил количество символов, удалил стоп-слова, удалил знаки препинания. В конце...
1426 просмотров

Есть ли способ ускорить распознавание текста MLVision?
Я использую облачное распознавание текста MLVision для своего приложения. Я снимаю / загружаю фото, а затем запускаю процесс. Когда он распознает изображение и извлекает текст, я разделяю его и добавляю каждый отдельный блок в массив. Код ниже...
281 просмотров

Как использовать облачное зрение Google вместе с Unity для распознавания текста с помощью мобильной камеры?
Я тестирую проект о том, как читать текст с объектов и изображений с помощью облачного зрения Google. Используя мобильную камеру (iphone, ipad предпочтительно или телефоны Android), я хотел бы получить требуемый текст. Приложение Samsung bixby...
791 просмотров

Может ли Google Vision API извлечь многоязычный код для соответствующего текста на изображении
Может ли Google Vision API сказать нам, к какому языку принадлежит текст на изображении? Например, изображение содержит "Hello" на разных языках, например https://pocketcultures.com/2008/10/30/say-hello-in-20-languages/ Можно ли получить...
308 просмотров

как я могу обнаружить весь текст внутри блока с помощью Google Vision Api
Я пытаюсь извлечь текст из изображения с помощью google vision api, это работает. Но я просто хочу обнаружить часть изображения, чтобы получить определенный текст. это изображение, которое я использовал Я просто хочу извлечь весь текст...
1903 просмотров

Граничная рамка для рукописного текста
У меня есть заполненная рукописная форма (однако форма напечатана, она заполнена рукописной информацией), и я хотел извлечь из формы только рукописный текст.... В настоящее время я жестко запрограммировал ограничивающую рамку с помощью openCV и...
597 просмотров

Как использовать обнаружение текста ML Kit для нелатиноазиатских (бенгальский/хинди) языков
У меня есть визитная карточка содержит имя и адрес. они написаны на двух разных языках (бенгальском и английском). Используя MLKIt, я могу извлечь только английский язык. Теперь я хочу извлечь бенгальский текст из захваченного изображения визитной...
739 просмотров

Извлечь письмо из капчи с помощью opencv
Я пытаюсь извлечь буквы из особенно раздражающей капчи. Я пытаюсь сделать это с помощью opencv2, и пока это не дает мне потрясающих результатов. Возможно, я не выполнил правильные операции. Вот один из моих входов:...
501 просмотров
schedule 08.01.2023

проблема с чтением изображений набора данных mjsynth
недавно я пытаюсь обучить сеть распознавания текста. Я попытался начать обучение, передав набор данных mjsynth сеть. Тем не менее, кажется, что в наборе данных есть несколько пустых изображений. Итак, во время обучения, если я напрямую передаю...
219 просмотров