Публикации по теме 'extraction'


Работа с вложениями в PDF с помощью C#
Основная цель стандарта PDF — упростить обмен документами между различными операционными системами и устройствами при сохранении содержания и дизайна этих документов. Обычно PDF-документ содержит шрифты, изображения, страницы и метаданные, и этих функций достаточно для представления печатных документов. Однако следует отметить, что мы можем более эффективно использовать PDF-документы. Например, в некоторых юридических случаях нам нужна дополнительная информация , например, ксерокопия..

Вопросы по теме 'extraction'

Как извлечь вложения из ZFO?
Кто-нибудь знает, как извлечь вложения из файла .zfo (заполнитель формы 602). Это формат, основанный на openXML. Спасибо
1241 просмотров
schedule 10.09.2022

эффективное извлечение тайлов TIFF C++
Я работаю с большими tiff-изображениями размером 1 ГБ размером около 20000 x 20000 пикселей. Мне нужно извлечь несколько плиток (примерно 300x300 пикселей) из изображений в случайных позициях. Я попробовал следующие решения: Libtiff...
3991 просмотров
schedule 01.11.2023

Какой лучший Zip-модуль Python для обработки больших файлов?
РЕДАКТИРОВАТЬ: В частности, скорости сжатия и извлечения. Какие-либо предложения? Спасибо
8514 просмотров

Как извлечь ссылки с веб-страницы с помощью lxml, XPath и Python?
У меня есть этот запрос xpath: /html/body//tbody/tr[*]/td[*]/a[@title]/@href Он извлекает все ссылки с атрибутом title и выдает href в средстве проверки FireFox Xpath. надстройка . Однако я не могу использовать его с lxml . from...
21619 просмотров

Извлечение текста с помощью парсеров java html
Я хочу использовать синтаксический анализатор html, который делает следующее красивым и элегантным способом. Извлечь текст (это самое важное) Извлечение ссылок, мета-ключевых слов Реконструировать исходный документ (необязательная, но...
3850 просмотров
schedule 19.03.2022

улучшение извлечения данных из текстового файла в Java
У меня есть файл CSV с образцами данных в этой форме: 220 30 255 0 0 Javascript 200 20 0 255 128 Thinking in java , где первый столбец — высота, второй — толщина, следующие три — значения RGB для цвета, а последний —...
852 просмотров
schedule 11.01.2023

Как извлечь текст из PDF?
Может ли кто-нибудь порекомендовать библиотеку/API для извлечения текста и изображений из PDF? Нам нужно иметь возможность получить текст, который содержится в заранее известных областях документа, поэтому API должен будет предоставить нам информацию...
273255 просмотров

Регулярное выражение (Python) для извлечения строк текста внутри ‹ и › — например. ‹stringone›‹string-two› и т. д.
В настоящее время я играю с дампами данных переполнения стека и пытаюсь построить (как я себе представляю) простое регулярное выражение для извлечения имен тегов из символов < и > . Итак, для каждого вопроса у меня есть список из одного или...
1380 просмотров
schedule 04.06.2023

Извлечение текста PDF в местах гиперссылок
Кто-нибудь знает о каком-то (БЕСПЛАТНОМ) SDK, который может начать извлечение текста в той точке PDF-документа, куда ведет гиперссылка (в том же PDF-документе)? Ссылки в конечном итоге ведут нас к определенным точкам на определенных страницах. В...
2424 просмотров
schedule 16.07.2022

Мониторинг извлечения ZIP-файла Python
Мне нужно разархивировать ZIP-архив. Я уже знаю, как его разархивировать, но это огромный файл, и его распаковка занимает некоторое время. Как мне напечатать процент завершения извлечения? Я хотел бы что-то вроде этого: Extracting File 1%...
6307 просмотров
schedule 08.01.2023

Libarchive для извлечения в указанную папку?
Кто-нибудь может помочь показать примеры использования libarchive для извлечения ZIP-файлов в указанную папку? Похоже, что предоставленные примеры программ ( untar.c , tarfilter.c и minitar ) извлекают архив в текущий рабочий каталог. Есть ли...
3147 просмотров
schedule 22.09.2022

Как получить 3D-модели из Google Earth?
Я хочу получить все 3D-модели в некоторой области из Google Планета Земля. Как этого добиться?
3544 просмотров
schedule 12.01.2023

Regex — извлечение номеров томов и глав из названий книг
Привет! Я пытаюсь импортировать устаревшие данные в совершенно новую систему. Почти готово, но возникла огромная проблема! Предполагая эти любопытные данные: Blabla Vol.1 chapter 2 ABCD in the era of XYZ volume 2 First Chapter A really useless...
1061 просмотров
schedule 08.02.2023

использование карты для извлечения хэш-набора (ключ, значение), соответствующего указанному значению
Я искал способ выполнить следующее действие с помощью функции Perl map : учитывая хэш, я хочу извлечь пары (ключ, значение), в которых значение равно или соответствует указанному параметру. В моем примере я хочу извлечь пары (ключ, значение), где...
11743 просмотров
schedule 22.08.2022

Существуют ли библиотеки для извлечения структуры AutoCAD?
Мне нужно запросить модели AutoCAD, чтобы извлечь структуры и соединения (например, питание, данные) между ними для хранения в базе данных. Из опыта и исследований я знаю, что работа с исходным файлом AutoCAD .dwg проблематична из-за проприетарного...
144 просмотров

Регулярные выражения VB.Net - извлечение значения подстановочного знака
Мне нужна помощь в извлечении значения подстановочного знака из совпадения регулярных выражений. Например: Регулярное выражение: "мне нравится *" Ввод: "Я люблю шоколад" Я хотел бы иметь возможность извлечь строку «шоколад» из совпадения...
5876 просмотров
schedule 04.08.2022

C # WPF обнаруживает завершение извлечения с помощью DotNetZip?
Я пытался работать с Ionic.Zip (DotNetZip) для извлечения загруженных zip-файлов через программу. Но я застрял, пытаясь определить, когда процесс извлечения завершен. Библиотека содержит событие ExtractProgress, поэтому я попытался обнаружить его с...
3358 просмотров
schedule 26.03.2023

как получить указанный текст pos через xpdf или mupdf?
Я хочу извлечь определенный текст в pdf-файлах и позицию текста. Я знаю, что xpdf и mupdf могут анализировать файлы PDF, поэтому я думаю, что они могут помочь мне выполнить эту задачу. Но как использовать эти две библиотеки для получения позиции...
2434 просмотров
schedule 21.01.2023

Как извлечь аудио из видео с помощью ffmpeg на С++?
Я использую FFmpeg для извлечения информации о видеофайле. Но я хочу извлечь аудиоканалы, чтобы прочитать их с помощью FMOD. Как я могу это сделать ? Это просто? Знаете ли вы хороший учебник по FFmpeg на C++? Спасибо
1851 просмотров
schedule 14.07.2022

строки выглядят как странные символы
У меня были проблемы с этим с другим заданием, где мои строки печатались как бессмысленные символы, такие как вопросительный знак в ромбе или случайные символы. На этот раз я пытаюсь сделать char *word = "blah"; printf("word: %s", word);...
6650 просмотров
schedule 24.11.2022