Я пытаюсь использовать DASK для быстрых вычислений, поскольку логистическая регрессия прервана через 17 часов в моей системе. Мой набор данных составляет около 1 миллиона строк.
Сначала я выполнил эти команды:
import dask.array as da
import dask.dataframe as dd
from dask.distributed import Client
client = Client()
from dask.distributed import Client
client = Client()
Вышеупомянутые команды выполнялись, но с предупреждением:
C: \ ProgramData \ Anaconda3 \ lib \ site-packages \ distribution \ bokeh \ core.py: 57: UserWarning: порт 8787 уже используется. Возможно, у вас уже работает кластер? Вместо этого разместите диагностическую панель на случайном порте. warnings.warn ('\ n' + сообщение)
Затем я выполнил эти команды:
import dask_ml.joblib
from sklearn.externals import joblib
Ошибка: AttributeError: модуль dask.array не имеет атрибута blockwise
Может ли кто-нибудь помочь мне решить эту проблему?