Я использую dbscan для кластеризации точек, так как у меня больше 1 миллиона точек, я также использую r*-tree.
Я использую ELKI в командной строке:
java -cp elki.jar
de.lmu.ifi.dbs.elki.application.KDDCLIApplication
-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory
-algorithm clustering.DBSCAN
-dbc.in points1.txt
-dbscan.epsilon 20
-dbscan.minpts 10
-out results3/DBSCANeps20min10
для небольших файлов все в порядке, но для 4 миллионов файлов произошла ошибка:
at de.lmu.ifi.dbs.elki.database.ids.integer.DoubleIntegerArrayQuickSort.quickSort(Unknown Source)