Заполнение отсутствующих строк с помощью nan с переиндексацией pandas

Благодаря Джеффу я смог найти недостающие строки в своей файловой структуре данных и заполнить недостающие строки.

Однако заполненные отсутствующие строки в выводе показывают «2013-07-01 00:00:00,,,,,,,,,,,,,,,,,», а не с nan. Я хотел бы заполнить «NaN» или «nan» внутри запятых.

Мой код:

filin = DataPath + 'SKP_AWS_MIN_QC_10001_2013.07-09.DAT'
pd.set_option('max_rows',10)
data=pd.read_csv(filin,sep='#',index_col=[1],parse_dates=[1])
print data
index = pd.date_range('2013-07-01 00:00:00','2013-09-30 23:59:00',freq="T")
df = data
sk_f = df.reindex(index)
print sk_f
sk_f.to_csv("sample1.csv")

Насколько я знаю из информации о функции переиндексации, недостающие дыры должны быть чем-то заполнены (по умолчанию "NaN"). Я не могу найти причину, по которой недостающая дыра в моих файлах результатов не заполнена.

Любая идея или комментарий будут действительно оценены.

Спасибо, Исаак


person Isaac    schedule 27.06.2014    source источник


Ответы (1)


Это не имеет ничего общего с reindex(), когда вы to_csv, укажите строку для отсутствующих значений, если вы не хотите, чтобы они отображались как пробелы. Что-то вроде df.to_csv('temp.csv',na_rep='NaN') поможет.

Если не указано, na_rep= по умолчанию равно ''.

person CT Zhu    schedule 27.06.2014
comment
@Исаак, вы должны пометить этот ответ как правильный, проверьте meta.stackexchange.com/questions/5234/ - person Andy Hayden; 27.06.2014
comment
@Энди Хейден Спасибо за комментарий, но я не могу найти способ проверить лучший или правильный ответ. - person Isaac; 27.06.2014
comment
@Isaac Вы видели изображение здесь: meta.stackexchange.com/a/5235 (вы должны увидеть серую галочку -mark / tick: нажмите, чтобы он стал зеленым.) - person Andy Hayden; 28.06.2014