Публикации по теме 'extraction'
Работа с вложениями в PDF с помощью C#
Основная цель стандарта PDF — упростить обмен документами между различными операционными системами и устройствами при сохранении содержания и дизайна этих документов. Обычно PDF-документ содержит шрифты, изображения, страницы и метаданные, и этих функций достаточно для представления печатных документов.
Однако следует отметить, что мы можем более эффективно использовать PDF-документы. Например, в некоторых юридических случаях нам нужна дополнительная информация , например, ксерокопия..
Вопросы по теме 'extraction'
Как извлечь вложения из ZFO?
Кто-нибудь знает, как извлечь вложения из файла .zfo (заполнитель формы 602). Это формат, основанный на openXML.
Спасибо
1241 просмотров
schedule
10.09.2022
эффективное извлечение тайлов TIFF C++
Я работаю с большими tiff-изображениями размером 1 ГБ размером около 20000 x 20000 пикселей. Мне нужно извлечь несколько плиток (примерно 300x300 пикселей) из изображений в случайных позициях.
Я попробовал следующие решения:
Libtiff...
3991 просмотров
schedule
01.11.2023
Какой лучший Zip-модуль Python для обработки больших файлов?
РЕДАКТИРОВАТЬ: В частности, скорости сжатия и извлечения.
Какие-либо предложения?
Спасибо
8514 просмотров
schedule
03.01.2023
Как извлечь ссылки с веб-страницы с помощью lxml, XPath и Python?
У меня есть этот запрос xpath:
/html/body//tbody/tr[*]/td[*]/a[@title]/@href
Он извлекает все ссылки с атрибутом title и выдает href в средстве проверки FireFox Xpath. надстройка .
Однако я не могу использовать его с lxml .
from...
21619 просмотров
schedule
04.04.2024
Извлечение текста с помощью парсеров java html
Я хочу использовать синтаксический анализатор html, который делает следующее красивым и элегантным способом.
Извлечь текст (это самое важное)
Извлечение ссылок, мета-ключевых слов
Реконструировать исходный документ (необязательная, но...
3850 просмотров
schedule
19.03.2022
улучшение извлечения данных из текстового файла в Java
У меня есть файл CSV с образцами данных в этой форме:
220 30 255 0 0 Javascript
200 20 0 255 128 Thinking in java
, где первый столбец — высота, второй — толщина, следующие три — значения RGB для цвета, а последний —...
852 просмотров
schedule
11.01.2023
Как извлечь текст из PDF?
Может ли кто-нибудь порекомендовать библиотеку/API для извлечения текста и изображений из PDF? Нам нужно иметь возможность получить текст, который содержится в заранее известных областях документа, поэтому API должен будет предоставить нам информацию...
273255 просмотров
schedule
18.10.2022
Регулярное выражение (Python) для извлечения строк текста внутри ‹ и › — например. ‹stringone›‹string-two› и т. д.
В настоящее время я играю с дампами данных переполнения стека и пытаюсь построить (как я себе представляю) простое регулярное выражение для извлечения имен тегов из символов < и > . Итак, для каждого вопроса у меня есть список из одного или...
1380 просмотров
schedule
04.06.2023
Извлечение текста PDF в местах гиперссылок
Кто-нибудь знает о каком-то (БЕСПЛАТНОМ) SDK, который может начать извлечение текста в той точке PDF-документа, куда ведет гиперссылка (в том же PDF-документе)? Ссылки в конечном итоге ведут нас к определенным точкам на определенных страницах.
В...
2424 просмотров
schedule
16.07.2022
Мониторинг извлечения ZIP-файла Python
Мне нужно разархивировать ZIP-архив. Я уже знаю, как его разархивировать, но это огромный файл, и его распаковка занимает некоторое время. Как мне напечатать процент завершения извлечения? Я хотел бы что-то вроде этого:
Extracting File
1%...
6307 просмотров
schedule
08.01.2023
Libarchive для извлечения в указанную папку?
Кто-нибудь может помочь показать примеры использования libarchive для извлечения ZIP-файлов в указанную папку? Похоже, что предоставленные примеры программ ( untar.c , tarfilter.c и minitar ) извлекают архив в текущий рабочий каталог. Есть ли...
3147 просмотров
schedule
22.09.2022
Как получить 3D-модели из Google Earth?
Я хочу получить все 3D-модели в некоторой области из Google Планета Земля. Как этого добиться?
3544 просмотров
schedule
12.01.2023
Regex — извлечение номеров томов и глав из названий книг
Привет! Я пытаюсь импортировать устаревшие данные в совершенно новую систему. Почти готово, но возникла огромная проблема! Предполагая эти любопытные данные:
Blabla Vol.1 chapter 2
ABCD in the era of XYZ volume 2 First Chapter
A really useless...
1061 просмотров
schedule
08.02.2023
использование карты для извлечения хэш-набора (ключ, значение), соответствующего указанному значению
Я искал способ выполнить следующее действие с помощью функции Perl map : учитывая хэш, я хочу извлечь пары (ключ, значение), в которых значение равно или соответствует указанному параметру.
В моем примере я хочу извлечь пары (ключ, значение), где...
11743 просмотров
schedule
22.08.2022
Существуют ли библиотеки для извлечения структуры AutoCAD?
Мне нужно запросить модели AutoCAD, чтобы извлечь структуры и соединения (например, питание, данные) между ними для хранения в базе данных. Из опыта и исследований я знаю, что работа с исходным файлом AutoCAD .dwg проблематична из-за проприетарного...
144 просмотров
schedule
20.07.2022
Регулярные выражения VB.Net - извлечение значения подстановочного знака
Мне нужна помощь в извлечении значения подстановочного знака из совпадения регулярных выражений. Например:
Регулярное выражение: "мне нравится *"
Ввод: "Я люблю шоколад"
Я хотел бы иметь возможность извлечь строку «шоколад» из совпадения...
5876 просмотров
schedule
04.08.2022
C # WPF обнаруживает завершение извлечения с помощью DotNetZip?
Я пытался работать с Ionic.Zip (DotNetZip) для извлечения загруженных zip-файлов через программу. Но я застрял, пытаясь определить, когда процесс извлечения завершен. Библиотека содержит событие ExtractProgress, поэтому я попытался обнаружить его с...
3358 просмотров
schedule
26.03.2023
как получить указанный текст pos через xpdf или mupdf?
Я хочу извлечь определенный текст в pdf-файлах и позицию текста.
Я знаю, что xpdf и mupdf могут анализировать файлы PDF, поэтому я думаю, что они могут помочь мне выполнить эту задачу.
Но как использовать эти две библиотеки для получения позиции...
2434 просмотров
schedule
21.01.2023
Как извлечь аудио из видео с помощью ffmpeg на С++?
Я использую FFmpeg для извлечения информации о видеофайле. Но я хочу извлечь аудиоканалы, чтобы прочитать их с помощью FMOD.
Как я могу это сделать ? Это просто?
Знаете ли вы хороший учебник по FFmpeg на C++?
Спасибо
1851 просмотров
schedule
14.07.2022
строки выглядят как странные символы
У меня были проблемы с этим с другим заданием, где мои строки печатались как бессмысленные символы, такие как вопросительный знак в ромбе или случайные символы.
На этот раз я пытаюсь сделать
char *word = "blah";
printf("word: %s", word);...
6650 просмотров
schedule
24.11.2022