У меня есть коллекция наборов 2D-координат (в масштабе 100–500 000 точек в каждом наборе), и я ищу наиболее эффективный способ измерить сходство одного набора с другим. Я знаю обычные: косинус, Жаккард/Танимото и т. д. Однако я надеюсь на некоторые предложения по любым быстрым/эффективным для измерения сходства, особенно те, которые могут группироваться по сходству.
Редактировать 1: изображение показывает, что мне нужно сделать. Мне нужно сгруппировать все красные, синие и зеленые цвета по их форме/ориентации и т.д.
замещающий текст http://img402.imageshack.us/img402/8121/curves.png< /а>