Мне нужно проанализировать большой файл журнала (2 ГБ), используя reg ex в python. В файле журнала регулярное выражение соответствует строке, которая меня интересует. Файл журнала также может содержать нежелательные данные.
Вот пример из файла:
"#DEBUG:: BFM [L4] 5.4401e+08ps MSG DIR:TX SCB_CB TYPE:DATA_REQ CPortID:'h8 SIZE:'d20 NumSeg:'h0001 Msg_Id:'h00000000"
Мое регулярное выражение ".DEBUG.*MSG."
Сначала я разделю его с помощью пробелов, затем шаблоны «поле: значение» будут вставлены в базу данных sqlite3; но для больших файлов анализ файла занимает от 10 до 15 минут.
Пожалуйста, предложите лучший способ сделать вышеуказанную задачу за минимальное время.
sed
. - person Burhan Khalid   schedule 29.08.2013