У меня есть набор данных с повторным появлением фрагментов данных в группах наблюдений одинаковой длины, таких как:
data have;
input name $ identifier ;
cards;
mary 1
mary 2
mary 2
mary 4
mary 5
mary 7
mary 6
adam 2
adam 3
adam 3
adam 7
/*remove*/
mary 1
mary 2
mary 2
mary 4
mary 5
mary 7
mary 6
/*remove*/
adam 8
mary 1
mary 2
mary 3
mary 4
mary 5
mary 7
mary 6
adam 9
mary 1
mary 2
mary 3
;
Я надеюсь удалить фрагмент повторного появления Мэри, отмеченный /remove/ с упорядоченным идентификатором. Результат должен быть примерно следующим:
mary 1
mary 2
mary 4
mary 5
mary 6
mary 7
adam 2
adam 3
adam 7
adam 8
mary 1
mary 2
mary 3
mary 4
mary 5
mary 6
mary 7
adam 9
mary 1
mary 2
mary 3
Спасибо за любую помощь! Кто-то подсказал метод по Hash table, но я подозреваю, что у меня может не хватить памяти для обработки кода. Можно ли это сделать с помощью datasteps или proc sql?