У меня есть текстовый файл следующего вида:
1 3
2 5
3 6
4 5
5 4
6 1
7 2
Приведенный выше файл представляет ребра в неориентированном графе. Я хочу удалить повторяющиеся ребра на графике. В приведенном выше примере я хочу удалить либо 4,5 or 5,4
, поскольку они представляют одно и то же ребро в графе и, следовательно, вызывают дублирование. Я пытаюсь визуализировать график из файла, используя Graphstream
, используя библиотеку GraphX
в Apache Spark. Но из-за наличия повторяющихся узлов, как описано выше, выдается следующая ошибка.
org.graphstream.graph.EdgeRejectedException: Edge 4[5--4] was rejected by node 5
Как лучше всего удалить такие дубликаты из текстового файла?