Мне нужно прочитать файл .vcf.gz с сайта pentaho. Я могу прочитать это из «Ввод текстового файла» на вкладке «Контент», установив «сжатый» на «GZ».
-Прежде всего, мне нужно пропустить заголовки (в основном каждую строку с # в начале).
-Во-вторых, мне нужно вставить новый столбец, где в каждой строке я вставляю имя файла.
E.g.
Мой файл:
#header
#header
#header
# chr pos ref alt
chr1 3 A A
Я хочу:
chr1 3 A A id_001 (Taken readeing file name)
Как я могу этого добиться?