У меня есть csv, разделенный ;
. Мне нужно удалить строки, в которых содержимое 2-го и 3-го столбца не уникально, и вывести материал на стандартный вывод.
Пример ввода:
irrelevant;data1;data2;irrelevant;irrelevant
irrelevant;data3;data4;irrelevant;irrelevant
irrelevant;data5;data6;irrelevant;irrelevant
irrelevant;data7;data8;irrelevant;irrelevant
irrelevant;data1;data2;irrelevant;irrelevant
irrelevant;data9;data0;irrelevant;irrelevant
irrelevant;data1;data2;irrelevant;irrelevant
irrelevant;data3;data4;irrelevant;irrelevant
Желаемый результат
irrelevant;data5;data6;irrelevant;irrelevant
irrelevant;data7;data8;irrelevant;irrelevant
irrelevant;data9;data0;irrelevant;irrelevant
Я нашел решения, в которых на выходе печатается только первая строка:
sort -u -t ";" -k2,1 file
Но этого недостаточно.
Я пытался использовать uniq -u
, но не могу найти способ проверить только несколько столбцов.
col2, col3
появляется только один раз во всем файле. - person anubhava   schedule 22.08.2014