У меня есть текстовый файл (точнее, CSV-файл в немецком стиле, т. е. разделенный точкой с запятой десятичная запятая), в каждой строке которого есть дата и значение измерения.
Есть фрагменты ошибочных значений, которые я хочу удалить перед дальнейшей работой. Я хотел бы сохранить эти нарезки в каком-нибудь сценарии, чтобы мои исправления были задокументированы, и я мог бы воспроизвести эти исправления, если это необходимо.
Строки выглядят так:
28.01.2005 14:48:38;5,166
28.01.2005 14:50:38;2,916
28.01.2005 14:52:38;0,000
28.01.2005 14:54:38;0,000
(long stretch of values that should be removed; could also be something else beside 0)
01.02.2005 00:11:43;0,000
01.02.2005 00:13:43;1,333
01.02.2005 00:15:43;3,250
Теперь я хотел бы сохранить список начальных и конечных шаблонов, таких как 28.01.2005 14:52:38
+ 01.02.2005 00:11:43
, и скрипт вырезал бы строки, соответствующие этим парам начала/конца, и все, что находится между ними.
Я думаю о том, чтобы взломать awk-скрипт, но, возможно, мне не хватает уже существующего инструмента.