У меня дф1 и дф2. Я хочу использовать fuzzywuzzy, чтобы сопоставить столбец A в df1 со столбцом A в df2 и вернуть идентификатор в столбце B df2 на основе определенного соотношения соотношений.
Например:
df1 выглядит так:
Имя
Салли продает ракушки
дф2 выглядит так:
Имя | Я БЫ
Салли продает ракушки | 28904
Я пытаюсь сравнить все в столбце A в df1, найти совпадение в столбце A в df2 и вернуть идентификатор из столбца B в df2.
Я хотел бы иметь возможность установить критерии нечеткого соотношения. Например: я хочу, чтобы он возвращал идентификатор только в том случае, если соотношение выше 50.
Мой текущий код:
import pandas as pd
import numpy as np
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
df1=pd.read_csv('C:\\Users\\nkurdob\\Desktop\\Sheet1.csv')
df2=pd.read_csv('C:\\Users\\nkurdob\\Desktop\\Sheet2.csv')
for i in range(len(df1)):
em = df1['A'][i]
test = fuzz.partial_ratio(em, df2['A'])
if test > 50:
print df1['A'][i]==df2['B']