Как преобразовать столбец строк DataFrame (в формате дд / мм / гггг) в дату и время?
Преобразование типа столбца DataFrame из строки в формат datetime, дд / мм / гггг
Ответы (4)
Самый простой способ - использовать to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Он также предлагает dayfirst
аргумент для европейских времен (но будьте осторожны, это не строго).
Вот он в действии:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Вы можете передать определенный формат:
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
datetime
объекты, а не в numpy.datetime64
объекты?
- person ryanjdillon; 29.03.2014
datetime
объекты, с которыми я работаю, это помешает мне изменить код для обработки numpy.datetime64
объектов.
- person ryanjdillon; 29.03.2014
DatetimeIndex(df['col']).to_pydatetime()
, должны работать.
- person Andy Hayden; 29.03.2014
SettingWithCopyWarning
дает достаточно материала
- person Sundeep; 09.02.2017
Если столбец даты представляет собой строку формата «2017-01-01», вы можете использовать pandas astype, чтобы преобразовать ее в datetime.
df['date'] = df['date'].astype('datetime64[ns]')
или используйте datetime64 [D], если вам нужна точность дня, а не наносекунды
print(type(df_launath['date'].iloc[0]))
дает
<class 'pandas._libs.tslib.Timestamp'>
так же, как при использовании pandas.to_datetime
Вы можете попробовать это с другими форматами, кроме "% Y-% m-% d", но, по крайней мере, это работает.
Вы можете использовать следующее, если хотите указать сложные форматы:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
Подробнее о format
здесь:
- Python 2 https://docs.python.org/2/library/datetime.html#strftime-strptime-behavior.
- Python 3 https://docs.python.org/3.7/library/datetime.html#strftime-strptime-behavior.
Если у вас на свидании разные форматы, не забудьте установить infer_datetime_format=True
, чтобы облегчить жизнь.
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Источник: pd.to_datetime < / а>
или если вам нужен индивидуальный подход:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)
.apply
, который не имеет быстрого кеша и будет затруднен при преобразовании миллиарда значений. Альтернатива, но не лучшая - col = pd.concat([pd.to_datetime(col, errors='coerce', format=f) for f in formats], axis='columns').bfill(axis='columns').iloc[:, 0]
- person Acumenus; 04.12.2020
infer_datetime_format=True
, поскольку это предполагает единый формат. Просто пропустите этот аргумент. Чтобы понять почему, попробуйте pd.to_datetime(pd.Series(['1/5/2015 8:08:00 AM', '1/4/2015 11:24:00 PM']), infer_datetime_format=True)
с errors='coerce'
и без него. См. эту проблему.
- person Acumenus; 09.12.2020