У меня есть коллекция из 50 миллионов строк, каждая из которых содержит около 100 символов. Я ищу очень эффективную (время работы и использование памяти) реализацию обобщенного дерева суффиксов.
Я пробовал https://github.com/npgall/concurrent-trees, но это занимает огромное количество памяти, хотя время работы эффективно. С 2,5 миллионами строк длиной 100. Это заняло уже около 50 ГБ памяти.