Я хочу запустить модель машинного обучения с некоторыми данными. Перед обучением модели с этими данными мне нужно обработать ее, поэтому я читал несколько способов сделать это.
Прежде всего создайте конвейер потока данных, чтобы загрузить его в Bigquery или Google Cloud Storage, а затем создайте конвейер данных с помощью Google Dataprep, чтобы очистить его.
Другой способ, которым я могу это сделать, - это Data Fusion, который может создавать конвейеры данных проще, но я не знаю, и вот я сомневаюсь, Data Fusion предназначен только для создания конвейера, такого как Dataflow, а затем я должен использовать DataPrep, чтобы очистить данные, или если Data Fusion может очистить данные и подготовить их для использования в моей модели машинного обучения.
Если Data Fusion может очищать данные как DataPrep, когда мне следует использовать DataPrep?