Кажется, вам нужно groupby
с пользовательской функцией f
:
np.random.seed(100)
df2 = pd.DataFrame(np.random.randint(0,3,size=(10, 4)),columns=['ONE', 'TWO', 'CARS', 'FOUR'])
df2['NAMES'] = ['Peter','Jon','Mary','Mary','Peter','Peter','BONIFACE','Michael','Lucy','Gilari']
df2['CARS'] = ['Mercedes','BMW','Ford','BMW','BMW','Dacia','Ford','Pontiac','Chevrolet','Tesla']
print (df2)
ONE TWO CARS FOUR NAMES
0 0 0 Mercedes 2 Peter
1 2 0 BMW 1 Jon
2 2 2 Ford 2 Mary
3 1 0 BMW 0 Mary
4 0 2 BMW 1 Peter
5 1 2 Dacia 0 Peter
6 0 1 Ford 1 BONIFACE
7 0 0 Pontiac 1 Michael
8 1 2 Chevrolet 2 Lucy
9 1 1 Tesla 2 Gilari
def f(x):
if (x.name == 'BMW'):
x.loc[x.ONE == 2, 'FOUR'] = x.TWO
return x
agrupe = df2.groupby('CARS').apply(f)
print (agrupe)
ONE TWO CARS FOUR NAMES
0 0 0 Mercedes 2 Peter
1 2 0 BMW 0 Jon
2 2 2 Ford 2 Mary
3 1 0 BMW 0 Mary
4 0 2 BMW 1 Peter
5 1 2 Dacia 0 Peter
6 0 1 Ford 1 BONIFACE
7 0 0 Pontiac 1 Michael
8 1 2 Chevrolet 2 Lucy
9 1 1 Tesla 2 Gilari
Лучшее решение - сначала выбрать все строки, где столбец CARS
равен BMW
, а столбец ONE
равен 2
, а затем изменить FOUR
на столбец TWO
:
df2.loc[(df2.CARS == 'BMW') & (df2.ONE == 2), 'FOUR'] = df2.TWO
print (df2)
ONE TWO CARS FOUR NAMES
0 0 0 Mercedes 2 Peter
1 2 0 BMW 0 Jon
2 2 2 Ford 2 Mary
3 1 0 BMW 0 Mary
4 0 2 BMW 1 Peter
5 1 2 Dacia 0 Peter
6 0 1 Ford 1 BONIFACE
7 0 0 Pontiac 1 Michael
8 1 2 Chevrolet 2 Lucy
9 1 1 Tesla 2 Gilari
Или, если нужно изменить, если 2
в столбце ONE
, измените столбец FOUR
на столбец TWO
:
np.random.seed(13)
df2 = pd.DataFrame(np.random.randint(0,3,size=(10, 4)),columns=['ONE', 'TWO', 'CARS', 'FOUR'])
df2['NAMES'] = ['Peter','Jon','Mary','Mary','Peter','Peter','BONIFACE','Michael','Lucy','Gilari']
df2['CARS'] = ['Mercedes','BMW','Ford','BMW','BMW','Dacia','Ford','Pontiac','Chevrolet','Tesla']
print (df2)
ONE TWO CARS FOUR NAMES
0 2 0 Mercedes 0 Peter
1 2 2 BMW 1 Jon
2 0 2 Ford 0 Mary
3 2 2 BMW 2 Mary
4 1 1 BMW 1 Peter
5 0 2 Dacia 1 Peter
6 2 1 Ford 2 BONIFACE
7 0 0 Pontiac 0 Michael
8 2 2 Chevrolet 0 Lucy
9 1 1 Tesla 2 Gilari
df2.loc[df2.ONE == 2, 'FOUR'] = df2.TWO
print (df2)
ONE TWO CARS FOUR NAMES
0 2 0 Mercedes 0 Peter
1 2 2 BMW 2 Jon
2 0 2 Ford 0 Mary
3 2 2 BMW 2 Mary
4 1 1 BMW 1 Peter
5 0 2 Dacia 1 Peter
6 2 1 Ford 1 BONIFACE
7 0 0 Pontiac 0 Michael
8 2 2 Chevrolet 2 Lucy
9 1 1 Tesla 2 Gilari
person
jezrael
schedule
09.12.2016
TWO
или второй столбец =CARS
? Кроме того, приведенный пример не соответствует тому, что вы говорите - person MMF   schedule 09.12.2016TWO
или df.columns[2]? - person MMF   schedule 09.12.2016ONE
нет2
, есть только1,3,4
. Вам нужна работа с группойBMW
послеagrupe.get_group('BMW')
? Или работает со строками сBMW
вdf2
? - person jezrael   schedule 09.12.2016ONE
есть0
, тогда замените столбецFOUR
на столбецTWO
, верно? - person jezrael   schedule 09.12.2016