Графические рамки bfs в pyspark

Я новичок в графических фреймах, здесь я пытаюсь найти иерархию сотрудников с помощью bfs. src и dst - это empid и managerid соответственно.

`from graphframes import GraphFrame
  vertices = spark.createDataFrame([('1', 'Carter', 'Derrick', 50), 
                              ('2', 'May', 'Derrick', 26),
                             ('3', 'Mills', 'Jeff', 80),
                              ('4', 'Hood', 'Robert', 65),
                              ('5', 'Banks', 'Mike', 93),
                             ('98', 'Berg', 'Tim', 28),
                             ('99', 'Page', 'Allan', 16)],
                             ['id', 'name', 'firstname', 'age'])
  edges = spark.createDataFrame([('2', '1'), 
                           ('3', '1'),
                          ('4', '1'),
                          ('5', '2'),
                           ('6', '3'),
                           ('7', '2'),
                           ('8', '5'),
                           ('9', '7')],
                          ['src', 'dst'])
 g1 = GraphFrame(vertices, edges)

  result5 = g1.bfs(fromExpr = "id == '5'", toExpr =  "id == '1'", maxPathLength = 10)
  result5.show()`
 **** Out put****
  +--------------------+------+--------------------+------+--------------------+
  |                from|    e0|                  v1|    e1|                  to|
  +--------------------+------+--------------------+------+--------------------+
  |[5, Banks, Mike, 93]|[5, 2]|[2, May, Derrick,...|[2, 1]|[1, Carter, Derri...|
  +--------------------+------+--------------------+------+--------------------+

На данный момент я передаю единственный идентификатор в fromExpr = id == '5', как зациклить весь список идентификаторов из столбца Edge src и сохранить все пути вывода в кадре данных результата. пожалуйста, дайте мне знать, что вы вкладываете.


person Mohammad shaik    schedule 02.10.2020    source источник