Вопросы по теме 'fillna'

Панды: заполнение пропущенных значений средним в каждой группе
Это должно быть просто, но ближе всего, что я нашел, это сообщение: pandas : Заполнение пропущенных значений внутри группы , и я все еще не могу решить свою проблему .... Предположим, у меня есть следующий фрейм данных df =...
86667 просмотров

Панды: Groupby Fillna не работает
У меня есть следующий кадр данных, в котором около 4000 тикеров и всего около 2 миллионов строк: Ticker Date Rank 1 01/01/2000 5 1 01/02/2000 NaN 2...
1064 просмотров
schedule 12.03.2024

Прямое заполнение на месте в многоуровневом фрейме данных столбца
У меня есть следующий фреймворк: arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['first',...
1396 просмотров
schedule 04.02.2024

Метод Pandas fillna не работает на месте
У меня есть dataframe Problem_data, который имеет значения NaN в некоторых ячейках. Я запустил следующий код. problem_data[problem_data['level_type'] == 5.0] Это привело к этому: problem_id level_type points tags 5...
1699 просмотров
schedule 07.08.2022

Как преобразовать столбец dataframe в строку и заменить nans (fillna не работает)
У меня есть фреймворк pandas со столбцом целых чисел, который содержит некоторые nans. Я хочу преобразовать их из целого числа в строку и заменить nans описанием типа «недоступно». Основная причина в том, что мне нужно запустить groupbys для этого...
4359 просмотров
schedule 20.04.2023

Условное прямое заполнение панд
У меня есть фрейм данных: >>> k Out[87]: Date S E cp Last Q code 30 2017-11-10 22500 2017-11-17 P 170.00 828.47 11/17/2017P22500 32 2017-11-10 22625 2017-11-17 P...
2680 просмотров
schedule 27.10.2023

Заполнение пропущенных значений Pandas Dataframe по определенному значению
У меня есть набор данных, и я хочу заполнить недостающие данные в столбце «значение» с помощью bfill, добавив к нему строку. Вот код, который у меня есть: import pandas as pd import numpy as np df = pd.DataFrame( { 'category': ['X',...
722 просмотров
schedule 30.06.2023

Заполните последовательные NaN в серии Pandas
Я хочу заполнить отсутствующие значения в моей серии pandas, если имеется менее 3 последовательных NAN. Исходная серия с пропущенными значениями: s=pd.Series(pd.np.random.randn(20)) s[[1,3,5,7,12,13,14,15, 18]]=pd.np.nan Дает: 0...
1324 просмотров
schedule 19.03.2022

Панды: переименование Безымянный: * или NaN во фрейме данных
Вот мой код: import numpy as np import pandas as pd df = pd.read_excel(r'file.xlsx', index_col=0) Вот как это выглядит: Я хочу переименовать столбцы «Без имени: *» на последнее действительное имя. Вот что я пробовал и результаты:...
2211 просмотров
schedule 13.06.2024

Заполните NaN в пределах 1 столбца df через поиск другого df через pandas
Я видел различные версии этого вопроса, но ни одна из них не соответствует тому, что я пытаюсь сделать: вот мои данные: Вот df с NaN s: df = pd.DataFrame({"A": ["10023", "10040", np.nan, "12345", np.nan, np.nan, "10033", np.nan, np.nan],...
247 просмотров
schedule 06.07.2022

Заполните строки кадра данных Pandas, значение которых равно 0 или NaN, формулой, которая должна быть рассчитана для определенных строк другого столбца.
У меня есть датафрейм, в котором значения в столбце "цена" различаются в зависимости от оба значения в столбцах "количество" и "год". Например, для количества, равного 2, у меня есть цена, равная 2 в 2017 году и равная 4 в 2018 году. Я хотел бы...
733 просмотров
schedule 20.08.2022

Pandas fillna () на месте не работает с .loc
* РЕДАКТИРОВАТЬ Также не работает с .loc Я не решался создать еще один пост о том, что fillna не работает, так как их уже много. Но я застрял на хороший день, работая над этим. Я использую python с pandas и numpy, и у меня есть фрейм данных, в...
596 просмотров
schedule 20.03.2023

R Функция, которая заменяет NA на запаздывающие значения
Я пытаюсь написать функцию, которая заменяет отсутствующие значения выбранных переменных во фрейме данных их запаздывающими значениями (я использую задержку на одно наблюдение) в R. Я успешно написал для этого следующий цикл for: testdata <-...
431 просмотров
schedule 30.05.2023

Pandas fillna с использованием groupby и mode
Я недавно начал работать с Pandas, и в настоящее время я пытаюсь вменять некоторые недостающие значения в свой набор данных. Я хочу вменять недостающие значения на основе медианы (для числовых записей) и режима (для категориальных записей). Однако...
2661 просмотров

Создайте новый столбец в Pyspark DataFrame, взяв соотношение существующих столбцов
У меня есть два столбца в PySpark DataFrame, и я хочу получить соотношение этих двух столбцов после заполнения нулевых значений (не на месте). В настоящее время мой DataFrame выглядит следующим образом: +----+----+---+----+----+----+----+ |Acct|...
629 просмотров

Присвоение как fillna(), так и loc(), по-видимому, не работает
Я искал ответ вокруг, но я не могу их найти. Моя цель: я пытаюсь заполнить некоторые пропущенные значения в DataFrame , используя контролируемое обучение, чтобы решить, как его заполнить. Мой код выглядит так: ПРИМЕЧАНИЕ. ЭТА ПЕРВАЯ ЧАСТЬ НЕ...
64 просмотров

Как мне заменить значения пропорционально значениям «NaN» во фрейме данных, используя другой столбец?
Я пытаюсь заполнить данные NaN соответствующими данными на основе наблюдаемых отношений между двумя категориальными данными в кросс-таблице. До сих пор я научился заменять его по этой формуле: train.loc[train.Outlet_Type =='Grocery...
62 просмотров
schedule 17.09.2022

Проблема, когда я группирую и заполняю na минимальным значением даты сгруппированным элементом
Это мой набор данных, и я пытаюсь заполнить столбцы дат, содержащие NaN, минимальным значением. Я пытаюсь заполнить NaN в столбцах даты минимальным значением из этого столбца даты для ag_id (элемент, сгруппированный по). Когда я делаю...
48 просмотров
schedule 05.04.2023

Замените значение 0 на NaN в нескольких столбцах одновременно [дубликаты]
Я новичок в анализе данных. У меня есть набор данных со значениями NaN во многих столбцах. Мне нужно заменить 0 на те, у которых есть значения NaN. Мой вопрос заключается в том, как несколько столбцов заменить одновременно. Я могу заменить одну...
12 просмотров
schedule 28.10.2022

Заполните столбцы Pandas NaN значениями массива numpy
Извините, если этот вопрос кажется слишком для новичков, но я искал ответ, но не нашел его. Итак, у меня есть набор данных с большим количеством значений NaN, и я работал над некоторыми регрессиями, чтобы предсказать эти нули, и, поскольку прогноз...
416 просмотров