Я пытаюсь загрузить данные в таблицу Kudu, но получаю странный результат.
В консоли Impala я создал внешнюю таблицу из четырех файлов HDFS, импортированных Sqoop:
drop table if exists hdfs_datedim;
create external table hdfs_datedim
( ... )
row format
delimited fields terminated by ','
location '/user/me/DATEDIM';
SELECT COUNT(*) говорит мне, что имеется много строк. Данные выглядят хорошо при запросе.
Я использую стандартный выбор, чтобы скопировать результаты
INSERT INTO impala_kudu.DATEDIM
SELECT * FROM hdfs_datedim;
SELECT COUNT(*) говорит мне, что impala_kudu.DATEDIM имеет четыре строки (количество файлов в HDFS не количество строк в таблице.
Любые идеи?
select * from hdfs_datedim limit 10
, чтобы убедиться, что результат действительно имеет правильную форму? - person Amos   schedule 20.12.2017