Преобразование таблицы HTML в текст с помощью perl

У меня есть содержимое таблицы html, которое я пытаюсь преобразовать в текст с той же структурой с помощью use HTML::TreeBuilder и use HTML::FormatText в perl. Я пробовал с этим кодом

use strict;
use warnings;
use HTML::TreeBuilder;
use HTML::FormatText;
my $raw_html='';
my $tree = HTML::TreeBuilder->new_from_content($raw_html); 
print $tree->format(HTML::FormatText->new);

ожидаемый результат:

data1            data1_value

data2            data2_value

data3            data3_value

но вывод, который я получаю, выглядит так:

data1

data1_value

data2

data2_vaue

data3

data3_value

Мне нужно какое-то предложение.


person Balakumar    schedule 25.03.2014    source источник


Ответы (1)


В документации HTML::FormatText указано "Форматирование Таблицы и формы HTML не реализованы."

Поэтому вам нужно будет найти другой подход. HTML::TableExtract является вероятным кандидатом.

person Community    schedule 25.03.2014