как загрузить файлы .tsv в cassandra

Я пытаюсь загрузить файл .csv в Cassandra с помощью "|" в качестве разделителя, но одна из записей имеет это и есть ошибка несоответствия записи. Я пробовал другие разделители, но они присутствуют в записях. Когда я использую табуляцию или специальные символы в качестве разделителей, я получаю эту ошибку:

"разделитель" должен быть строкой из 1 символа"

Есть ли способ загрузить файлы .tsv непосредственно в Cassandra?


person Pavan Chakravarthy    schedule 02.08.2014    source источник


Ответы (1)


Какую версию Кассандры вы используете?

В проекте Cassandra JIRA есть тикет (CASSANDRA-6773). . Судя по заявке, похоже, что исправление зафиксировано и применяется начиная с версии 2.0.7.

Я только что попробовал, и у меня это сработало (версия 2.0.9):

[cqlsh 4.1.1 | Cassandra 2.0.9 | CQL spec 3.1.1 | Thrift protocol 19.39.0]

cqlsh> use stackoverflow;
cqlsh:stackoverflow> COPY trainsbydeparturetime(identifier, train_number,
    origin_train_station, dest_train_station, departure_time, total_travel_time )
    FROM '~/trainTimes.tsv' WITH DELIMITER='\t';

2 rows imported in 0.116 seconds.

Обратите внимание на использование WITH DELIMITER='\t' в конце.

person Aaron    schedule 08.08.2014