выбор наблюдения типа datetime64[ns] в определенном временном диапазоне

У меня есть кадр данных pandas (dfnew), в котором один столбец (отметка времени) имеет тип datetime64[ns]. Теперь я хочу посмотреть, сколько наблюдений находится в определенном временном диапазоне, скажем, с 10:00:00 до 12:00:00.

    dfnew['timestamp'] = dfnew['timestamp'].astype('datetime64[ns]')
    dfnew['timestamp]
0    2013-12-19 09:03:21.223000
1    2013-12-19 11:34:23.037000
2    2013-12-19 11:34:23.050000
3    2013-12-19 11:34:23.067000
4    2013-12-19 11:34:23.067000
5    2013-12-19 11:34:23.067000
6    2013-12-19 11:34:23.067000
7    2013-12-19 11:34:23.067000
8    2013-12-19 11:34:23.067000
9    2013-12-19 11:34:23.080000
10   2013-12-19 11:34:23.080000
11   2013-12-19 11:34:23.080000
12   2013-12-19 11:34:23.080000
13   2013-12-19 11:34:23.080000
14   2013-12-19 11:34:23.080000
15   2013-12-19 11:34:23.097000
16   2013-12-19 11:34:23.097000
17   2013-12-19 11:34:23.097000
18   2013-12-19 11:34:23.097000
19   2013-12-19 11:34:23.097000
Name: timestamp

    dfnew['Time']=dfnew['timestamp'].map(Timestamp.time)
    t1 = datetime.time(10, 0, 0)
    t2 = datetime.time(12, 0, 0)
    print len(dfnew[t1<dfnew["Time"]<t2])

Это приводит к ошибке TypeError: не удается сравнить datetime.time с Series. Я новичок в кадре данных pandas. Думаю, я делаю здесь очень глупую ошибку. Любая помощь приветствуется.


person sau    schedule 21.01.2014    source источник


Ответы (1)


Вы можете использовать DatetimeIndex indexer_between_time метод, поэтому трюк, чтобы использовать его, состоит в том, чтобы передать Series/column конструктору DatetimeIndex:

from datetime import time

# s is your datetime64 column

In [11]: pd.DatetimeIndex(s).indexer_between_time(time(10), time(12))
Out[11]: 
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

Получается положение времени между 10 и 12 (включительно*), поэтому используйте iloc для фильтрации:

In [12]: s.iloc[pd.DatetimeIndex(s).indexer_between_time(time(10), time(12))]
Out[12]: 
1    2013-12-19 11:34:23.037000
2    2013-12-19 11:34:23.050000
3    2013-12-19 11:34:23.067000
4    2013-12-19 11:34:23.067000
5    2013-12-19 11:34:23.067000
6    2013-12-19 11:34:23.067000
7    2013-12-19 11:34:23.067000
8    2013-12-19 11:34:23.067000
9    2013-12-19 11:34:23.080000
10   2013-12-19 11:34:23.080000
11   2013-12-19 11:34:23.080000
12   2013-12-19 11:34:23.080000
13   2013-12-19 11:34:23.080000
14   2013-12-19 11:34:23.080000
15   2013-12-19 11:34:23.097000
16   2013-12-19 11:34:23.097000
17   2013-12-19 11:34:23.097000
18   2013-12-19 11:34:23.097000
19   2013-12-19 11:34:23.097000
Name: timestamp, dtype: datetime64[ns]

* include_start и include_end — необязательные логические аргументы indexer_between_time.

person Andy Hayden    schedule 21.01.2014