Я хотел бы сопоставить строки из моего первого набора данных со всеми их ближайшими общими совпадениями.
Данные выглядят так:
набор данных1:
California
Texas
Florida
New York
набор данных2:
Californiia
callifoornia
T3xas
Te xas
texas
Fl0 rida
folrida
New york
new york
желаемый результат:
col_1 col_2 col_3 col4
California Californiia callifoornia
Texas T3xas texas Te xas
Florida folrida Fl0 rida
New York New york new york
Вопрос в том:
- Как найти общие строки между первым набором данных и вторым набором данных и создать список терминов во втором наборе данных, которые совпадают с каждым термином в первом?
Заранее спасибо.
stringdist
пакет иdcast
вdata.table
. Есть способ сделать это красиво в R, но у меня нет времени писать код прямо сейчас.stringdist
относительно легко использовать с некоторыми базовыми отбивными R. - person JMT2080AD   schedule 23.04.2019