Я использую оттенок Cloudera. В файловом браузере я загружаю файл .csv, содержащий около 3000 строк (мой файл небольшой, ‹400k).
После загрузки файла я захожу в браузер данных, создаю таблицу и импортирую в нее данные.
Когда я иду в Hive и выполняю простой запрос (например, SELECT * FROM table), я вижу результаты только для 99 строк. В исходном CSV-файле больше этих строк.
Когда я делаю другие запросы, я замечаю, что несколько строк данных отсутствуют, хотя они отображаются в предварительном просмотре в браузере файлов Hue.
Я пробовал с другими файлами, и они также иногда усекались до 65 или 165 строк.
Я также удалил все "," из данных .csv перед загрузкой файла.