Я пытаюсь написать код, который возьмет два списка имен из двух CSV-файлов и использует библиотеку fuzzywuzzy
, чтобы найти наиболее похожие сравнения и экспортировать их в третий CSV-файл.
Две проблемы с моим кодом:
- Во-первых, это не оптимизация, а просто экспорт всех коэффициентов, которые я рассчитываю.
Во-вторых, все это экспортируется в один столбец, а не вставляет все значения в свои собственные соответствующие столбцы, например CSV1, CSV2, Fuzz Ratio.
from fuzzywuzzy import fuzz import csv with open('Documents/test_CSV_1.csv', 'r') as t1, open('Documents/test_CSV_2.csv', 'r') as t2: fileone = t1.readlines() filetwo = t2.readlines() with open('update.csv', 'w') as outFile: for i in fileone: for j in filetwo: outFile.write(i + j+ str(fuzz.ratio(i,j)) + ", " + "\n")