Объединить списки частот с awk

Я хочу объединить два списка частот, и частоты должны агрегироваться. Я заметил, что есть несколько тем, похожих на эту, но я также хотел бы обсудить свой подход, если это нормально?

Итак, вот что я пытался сделать в cygwin:

Я собрал несколько рекомендаций, которые нашел в Интернете, и в итоге использовал sort uniq и awk, которые показались мне полезными. Я пробовал несколько вещей, но покажу вам только первое и последнее:

sort testcf.txt | uniq -c  | awk '{  print $2 + $3 "\t" $1 }' > testcf-sorted.txt

...

sort testcf.txt | uniq -c  | awk '{  print $2 "\t" $1 }' > testcf-sorted.txt

Список выглядит так:

foo 1
bar 3
foo 2
fnord 2
foo 1
fnord 2

Я хочу получить:

bar 3
fnord 4
foo 4

но я получаю:

первый подход:

Последний подход:

bar 1
fnord   1
fnord   1
foo 2
foo 1

Largo 18.07.2014 источник

Ответы (1)

arrow_upward
3
arrow_downward

Если вы используете sort и uniq и ваш ввод дважды содержит «foo 1», то один из них будет потерян. Я думаю, вы просто ищете:

awk '{a[$1] += $2} END {for( i in a ) print i, a[i]}' testcf.txt

William Pursell 18.07.2014

comment

Возможно с сортировкой потом. - ooga; 18.07.2014

Объединить списки частот с awk

Ответы (1)

Вопросы по теме