Что такое python, эквивалентный R's NA?

Что такое python, эквивалентный R's NA?

Чтобы быть более конкретным: R имеет NaN, NA, NULL, Inf и -Inf. NA обычно используется, когда отсутствуют данные. Что такое эквивалент Python?

Как библиотеки, такие как numpy и pandas, обрабатывают отсутствующие значения?

Как scikit-learn обрабатывает пропущенные значения?

Отличается ли он для python 2.7 и python 3?


person power    schedule 22.02.2015    source источник
comment
Вероятно None, если я правильно вас понял.   -  person Makoto    schedule 22.02.2015
comment
Numpy использует маскированные массивы.   -  person Veedrac    schedule 22.02.2015


Ответы (3)


В настоящее время Scikit-learn не обрабатывает отсутствующие значения. Для большинства алгоритмов машинного обучения неясно, как обрабатывать пропущенные значения, поэтому мы полагаемся на то, что пользователь обработает их, прежде чем передать их алгоритму. Numpy не имеет «отсутствующего» значения. Pandas использует NaN, но внутри числовых алгоритмов, что может привести к путанице. Можно использовать маскированные массивы, но мы не делаем этого в scikit-learn (пока).

person Andreas Mueller    schedule 23.02.2015
comment
NaN в Pandas — это значение nan numpy. - person stidmatt; 16.07.2021

nan в numpy хорошо обрабатывается многими функциями:

>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False,  True, False, False], dtype=bool)
person N1B4    schedule 22.02.2015

для pandas взгляните на это.

http://pandas.pydata.org/pandas-docs/dev/missing_data.html

панды используют NaN. Вы можете проверить нулевые значения, используя isnull() или not null(), удалить их из фрейма данных, используя dropna() и т. д. Эквивалентом для datetime объектов является NaT

person JAB    schedule 22.02.2015
comment
Возможно, стоит отметить, что целые панды Series (или столбец) должны иметь значения. Невозможно представить пропущенное значение в целочисленной серии; обычной альтернативой является преобразование с повышением частоты в тип с плавающей запятой, который имеет NaN. - person Paul; 22.02.2015