модификация пропуска пустого списка и продолжения функции

Фон

Следующий код немного изменен из пропуска пустого списка и продолжения функции

import pandas as pd
Names =    [list(['Jon', 'Smith', 'jon', 'John']),
               list([]),
               list(['Bob', 'bobby', 'Bobs']),
               list([]),
               list([])]
df = pd.DataFrame({'Text' : ['Jon J Smith is Here and jon John from ', 
                                       'get nothing from here', 
                                       'I like Bob and bobby and also Bobs diner ',
                                        'nothing here too',
                                        'same here'
                            ], 

                          'P_ID': [1,2,3, 4,5], 
                          'P_Name' : Names

                         })

    #rearrange columns
df = df[['Text', 'P_ID', 'P_Name']]
df

                                 Text         P_ID  P_Name
0   Jon J Smith is Here and jon John from       1   [Jon, Smith, jon, John]
1   get nothing from here                       2   []
2   I like Bob and bobby and also Bobs diner    3   [Bob, bobby, Bobs]
3   nothing here too                            4   []
4   same here                                   5   []

Рабочий код

Следующий фрагмент кода взят из пропуска пустого списка и продолжения функции

m = df['P_Name'].str.len().ne(0)
df.loc[m, 'New'] = df.loc[m, 'Text'].replace(df.loc[m].P_Name,'**BLOCK**',regex=True)

И создает следующий столбец New в df

            Text   P_ID  P_Name   New
0                                 **BLOCK** J **BLOCK** is Here and **BLOCK** **BLOCK** ...
1                                 NaN
2                                 I like **BLOCK** and **BLOCK** and also **BLOCK** d..
3                                 NaN 
4                                 NaN

Желаемый результат

Однако вместо NaN в строке 1, 3, 4 я хотел бы сохранить исходный текст, например. get nothing from here как показано ниже

            Text   P_ID  P_Name   New
0                                 **BLOCK** J **BLOCK** is Here and **BLOCK** **BLOCK** ...
1                                 get nothing from here
2                                 I like **BLOCK** and **BLOCK** and also **BLOCK** d..
3                                 nothing here too 
4                                 same here

Вопрос

Как настроить приведенный ниже код для достижения желаемого результата?

m = df['P_Name'].str.len().ne(0)
df.loc[m, 'New'] = df.loc[m, 'Text'].replace(df.loc[m].P_Name,'**BLOCK**',regex=True)

SFC 28.07.2019 источник

Ответы (2)

arrow_upward
1
arrow_downward

@tawab_shakeel рядом. Просто добавь:

df['New'].fillna(df['Text'], inplace=True)

fillna поймает правильное значение из df['Text'].

Я также могу предложить альтернативное решение, используя модуль re для регулярных выражений.

def replacing(x):
    if len(x['P_Name']) > 0:
        return re.sub('|'.join(x['P_Name']), '**BLOCK**', x['Text'])
    else:
        return x['Text']

df['New'] = df.apply(replacing, axis=1)

Метод apply применяет функцию replacing к каждой строке, а подстановка выполняется с помощью re.sub функция.

Valentino 28.07.2019

arrow_upward
2
arrow_downward

Просто добавьте эту строку в конец fillna

df['New'].fillna(df['Text'],inplace=True)

tawab_shakeel 28.07.2019

comment

Я обновил свой код, чтобы отразить то, что я ищу. Этот код будет работать для одной строки в этом примере, но у меня есть настоящий df длиной в несколько тысяч строк. Поэтому я обновил свой пример здесь, чтобы отразить этот факт. - SFC; 28.07.2019

comment

@ ER_18 вы хотите, чтобы каждая няня имела разные значения? - tawab_shakeel; 28.07.2019

Вопросы по теме

Как правильно переопределить недоступный HTML-контент с помощью CSS?
Emacs тормозит и создает 0-байтовые файлы в рабочем каталоге
Скрытое переполнение элементов с переменной высотой?
отправить электронное письмо в качестве параметра в URL-адресе в ошибке Rails
Ханойские башни с использованием списков Prolog
Хранение подписей в кодировке base64 в базе данных
Редактирование CSV-файла — удаление всей строки похожих значений на основе условия VIA Powershell
Как начать новый подсчет, когда значение категориальной переменной изменилось в R
Настройте параметры прокси-сервера HTTP в инструменте командной строки Android
Разбор кода JavaScript в модуле Node.js
Почему в С++ возврат указателя частной переменной разных объектов приводит к ошибке сегментации?
Рассчитать минимальное, максимальное и среднее значение в столбце данных
Как применить несколько фильтров в таблице данных угловых материалов?
Конфигурация конкретного узла в JBoss Clustering
Подчеркивания не считываются компонентом сценария в службах интеграции Microsoft
как настроить struts2 с помощью tomcat и apache с mod_jk?
Как использовать REST API RSA Archer для получения отчета?
JMH: не учитывать время внутреннего метода
Время жизни временного объекта, связанного с константной ссылкой (цепочка методов)
фильтр сканирования по подстроке