У меня есть двоичный файл, из которого я пытаюсь извлечь строки, и у меня достаточно времени для этого. :(
Моя текущая стратегия заключается в чтении файла с помощью Python (используя одну из следующих функций: read(), readline() или readlines()). Затем я анализирую строку (символ за символом) и ищу специальный символ 'ô', который в большинстве случаев непосредственно следует за нужными мне строками! Наконец, я анализирую в обратном порядке специальный символ, записывая все символы, которые я идентифицировал как «действительные».
В конце дня мне нужна передняя отметка времени и следующие 3 строки в строке.
Полученные результаты:
Во входной строке примера № 1 функции «чтения» не будут читать всю строку (показано на выходном изображении). Я считаю, что это связано с тем, что функция интерпретирует двоичный файл как символ EOF, а затем перестает читать.
В строке № 2 примера есть моменты, когда появляется «специальный символ», однако это не после строки, которую я хочу извлечь. :(
Есть ли лучший способ проанализировать эти данные? Если нет, есть ли способ решить проблему, показанную в строке примера № 1?
Примеры входных данных и результирующих выходных данных, когда я просто печатаю строки как прочитанные. Как видите, при использовании readlines()
Мой алгоритм извлечения строк, который не очень надежен.
К вашему сведению, эффективность не обязательно важна.