Это следующий вопрос к потенциальному ответу на один из моих предыдущих вопросов об использовании Dask, вычисляемого как доступ к одному элементу в большом массиве.
Почему использование вычислений Dask приводит к зависанию выполнения ниже? Вот фрагмент рабочего кода:
#Suppose you created a scheduler at the ip address of 111.111.11.11:8786
from dask.distributed import Client
import dask.array as da
# client1
client1 = Client("111.111.11.11:8786")
x = da.ones(10000000, chunks=(100000,)) # 1e7 size array cut into 1e5 size chunks
x = x.persist()
client1.publish_dataset(x=x)
# client2
client2 = Client("111.111.11.11:8786")
x = client2.get_dataset('x') #get the lazy collection x
result = x[0].compute() #code execution hangs here
print(result)