У меня есть текстовый файл в следующем формате:
2014-05-13 03:35 PM 48,841 SUR2-**C01**-00-000-PCE-1001-002.pdf
2014-05-13 03:36 PM 43,599 SUR2-**C01**-00-000-PCE-1002-001.pdf
2014-05-13 03:35 PM 51,900 SUR2-**C02**-00-000-PCE-1000-001.pdf
2014-05-13 03:35 PM 53,622 SUR2-**C02**-00-000-PCE-1000-002.pdf
2014-05-13 03:35 PM 52,145 SUR2-**C02**-00-000-PCE-1000-003.pdf
2014-05-13 03:35 PM 50,426 SUR2-**C02**-00-000-PCE-1000-004.pdf
Мне нужно проанализировать этот файл и извлечь файлы, соответствующие C01 или C02, и отправить эти файлы в объединенный файл PDF, один для C01 и один для C02.
Как я могу проанализировать файл и строку, соответствующую именам файлов на C01 или C02?
Затем, как я могу взять приведенный выше результат синтаксического анализа и, используя найденные имена файлов, объединить их в PDF-файл из командной строки или в сценарии?