Я новичок в графических фреймах, здесь я пытаюсь найти иерархию сотрудников с помощью bfs. src и dst - это empid и managerid соответственно.
`from graphframes import GraphFrame
vertices = spark.createDataFrame([('1', 'Carter', 'Derrick', 50),
('2', 'May', 'Derrick', 26),
('3', 'Mills', 'Jeff', 80),
('4', 'Hood', 'Robert', 65),
('5', 'Banks', 'Mike', 93),
('98', 'Berg', 'Tim', 28),
('99', 'Page', 'Allan', 16)],
['id', 'name', 'firstname', 'age'])
edges = spark.createDataFrame([('2', '1'),
('3', '1'),
('4', '1'),
('5', '2'),
('6', '3'),
('7', '2'),
('8', '5'),
('9', '7')],
['src', 'dst'])
g1 = GraphFrame(vertices, edges)
result5 = g1.bfs(fromExpr = "id == '5'", toExpr = "id == '1'", maxPathLength = 10)
result5.show()`
**** Out put****
+--------------------+------+--------------------+------+--------------------+
| from| e0| v1| e1| to|
+--------------------+------+--------------------+------+--------------------+
|[5, Banks, Mike, 93]|[5, 2]|[2, May, Derrick,...|[2, 1]|[1, Carter, Derri...|
+--------------------+------+--------------------+------+--------------------+
На данный момент я передаю единственный идентификатор в fromExpr = id == '5', как зациклить весь список идентификаторов из столбца Edge src и сохранить все пути вывода в кадре данных результата. пожалуйста, дайте мне знать, что вы вкладываете.