У меня есть данные, которые включают группу (область), а затем также предоставляют имя. Я пытаюсь объединить два фрейма данных. Один кадр намного меньше и является кадром данных «отображения». Он имеет одну строку для каждого имени в области. Другой фрейм намного больше и является фреймом данных «экземпляры». В нем много строк с вариациями названий с Районом. Я хочу, чтобы информация из фрейма сопоставления была объединена с фреймом экземпляров, чтобы каждый экземпляр имел информацию, которую ему предоставляет фрейм сопоставления.
Я изучил пакет Fuzzy, но не нашел способа реализовать его в группах (столбец «Область») или как эффективно использовать его с ячейками, содержащими несколько строк, и пытаться сопоставить их на основе этого.
Ниже приведен пример аналогичных данных. Слияние должно извлекать соответствующую информацию из фрейма данных экземпляров, чтобы сопоставить ее с фреймом данных сопоставления.
Сопоставление кадра данных
Area Name
A Apple
A Orange Strawberry
A Blackberry Rasberry
B Blackberry
C Kiwi
C Apple
Экземпляры
Area Locale
A Apple Pear Tomato
A Orange Potato Strawberry Zuccini
A Blackberry Rasberry
B Blackberry Onion
B Lettuce Blackberry Cucumber
C Kiwi Spinach Pineapple
C Kiwi Potato
C Apple Cucumber
C Apple Potato
Цель состоит в том, чтобы получить кадр, который выглядит как показано ниже.
Датафрейм
Area Locale Name
A Apple Pear Tomato Apple
A Orange Potato Strawberry Zuccini Orange Strawberry
A Blackberry Rasberry Blackberry Rasberry
B Blackberry Onion Blackberry
B Lettuce Blackberry Cucumber. Blackberry
C Kiwi Spinach Pineapple Kiwi
C Kiwi Potato Kiwi
C Apple Cucumber Apple
C Apple Potato Apple