Я использую Spark 2.2.0
Я читаю файл csv следующим образом:
val dataFrame = spark.read.option("inferSchema", "true")
.option("header", true)
.option("dateFormat", "yyyyMMdd")
.csv(pathToCSVFile)
В этом файле есть один столбец даты, и все записи имеют значение, равное 20171001
для этого конкретного столбца.
Проблема в том, что искра делает вывод, что тип этого столбца integer
, а не date
. Когда я удаляю параметр "inferSchema"
, тип этого столбца - string
.
В этом файле нет значений null
или неверно отформатированных строк.
В чем причина / решение этой проблемы?