Публикации по теме 'awk'


Общий язык рабочего процесса
КВЛ Общий язык рабочего процесса для проектов с интенсивным использованием данных. Общий язык рабочих процессов (CWL) — это открытый стандарт для описания рабочих процессов и инструментов анализа таким образом, чтобы сделать их переносимыми и масштабируемыми в различных программных и аппаратных средах, от рабочих станций до кластеров, облачных сред и сред высокопроизводительных вычислений (HPC). . CWL разработан для удовлетворения потребностей наук с интенсивным использованием..

Вопросы по теме 'awk'

Поиск/чтение другого файла из awk на основе содержимого текущего файла, возможно ли это?
Я обрабатываю огромный файл с помощью (GNU) awk (другие доступные инструменты: инструменты оболочки Linux, некоторые старые (> 5.0) версии Perl, но не могу устанавливать модули). Моя проблема: если некоторые поля field1, field2, field3 содержат...
1483 просмотров

Может ли awk пропускать несуществующие файлы без гонок?
Есть ли способ заставить awk (gawk) игнорировать или пропускать отсутствующие файлы? То есть файлы, переданные в командной строке, которые больше не существуют в файловой системе (например, быстро появляющиеся/исчезающие файлы в /proc/[1-9]*)....
3225 просмотров
schedule 30.05.2022

В чем разница между Perl, Python, AWK и sed?
просто хотите знать, каковы основные различия между ними? и сила каждого языка (где его лучше использовать). Изменить: это не "против." как тема, просто информация.
82620 просмотров
schedule 20.07.2022

Как вычислить p-значение при проверке гипотез (линейная регрессия)
В настоящее время я работаю над скриптом awk для статистического анализа данных измерений. Я использую линейную регрессию для получения оценок параметров, стандартных ошибок и т. д., а также хотел бы вычислить p-значение для проверки нулевой...
3214 просмотров
schedule 09.02.2023

Как выполнить расчет по лог-файлу
У меня это выглядит так: I, [2009-03-04T15:03:25.502546 #17925] INFO -- : [8541, 931, 0, 0] I, [2009-03-04T15:03:26.094855 #17925] INFO -- : [8545, 6678, 0, 0] I, [2009-03-04T15:03:26.353079 #17925] INFO -- : [5448, 1598, 185, 0] I,...
378 просмотров
schedule 08.07.2023

Случайным образом выбирайте строки из файла, не пропуская их с помощью Unix
У меня есть файл из 10 ^ 7 строк, в котором я хочу случайным образом выбрать 1/100 строк из файла. Это код AWK, который у меня есть, но он заранее убирает все содержимое файла. Память моего компьютера не справляется с такими ласками. Есть ли другой...
40945 просмотров

Как читать и обрабатывать двоичные (с основанием 2) логические представления из файла
У меня есть файл, содержащий 800 строк, например: id binary-coded-info --------------------------- 4657 001001101 4789 110111111 etc. где каждый 0 или 1 означает наличие некоторой функции. Я хочу прочитать этот файл и выполнить...
1906 просмотров
schedule 29.11.2022

Оболочка: вставьте пустую/новую строку на две строки выше шаблона
Чтобы добавить пустую строку над каждой строкой, соответствующей вашему регулярному выражению, вы можете использовать: sed '/regexp/{x;p;x;}' Но я хочу добавить пустую строку, не одну строку выше, а две строки выше строки, которая...
7361 просмотров
schedule 25.08.2023

оптимизация sed (модификация большого файла на основе меньшего набора данных)
Мне приходится иметь дело с очень большими текстовыми файлами (более 10 гигабайт, да, я знаю, это зависит от того, что мы должны называть большими) с очень длинными строками. Моя последняя задача связана с редактированием строк на основе данных из...
2121 просмотров
schedule 22.09.2022

Как я могу подсчитывать уникальные термины в текстовом файле без учета регистра?
Это может быть любой язык высокого уровня, который может быть доступен в типичной Unix-подобной системе (Python, Perl, awk, стандартные утилиты unix {sort, uniq} и т. д.). Надеюсь, это достаточно быстро, чтобы сообщить общее количество уникальных...
4853 просмотров
schedule 20.08.2022

проблема с тем, что элементы массива в awk не сохраняются
Я использую awk для обработки почасовых данных о погоде, сохраняя 10 массивов с 8784 элементами данных. Если массив неполный, т.е. останавливается на 8250 и т.д., то после команды "КОНЕЦ" я заполняю оставшиеся элементы массива последним доступным для...
345 просмотров
schedule 02.09.2022

Использование awk для удаления нежелательного текста из файла CSV
У меня есть такой CSV-файл: SUPPORT 07/30/2008-10:59:54 Eastern Daylight Time 123 07/03/2009-08:56:42 Eastern Daylight Time DC321 07/10/2009-20:16:56 Eastern Daylight Time где дата представляет собой целый столбец. как я могу удалить...
28897 просмотров
schedule 13.02.2023

нужна помощь в удалении времени из файла csv
я пытаюсь обработать csv и упростить сортировку, и мне нужно удалить из него время и тире. в файле есть такие записи: James,07/20/2009-14:40:11 Steve,08/06/2006-02:34:37 John,11/03/2008-12:12:34 и разберите его на это: James,07/20/2009...
197 просмотров
schedule 08.08.2023

Использование awk с NSTask
Как бы я использовал эту команду awk: awk 'NR>1{print $1}' string-to-modify с НСтаском? Я уже пытался установить /usr/bin/awk в качестве пути запуска, 'NR>1{print $1}' в качестве аргумента, затем строку для изменения в качестве...
609 просмотров
schedule 23.03.2022

Как искать шаблон внутри файла и удалять строки в Unix в командной строке?
Мне нужно найти шаблон в файлах. Например, содержимое файла ниже: 3555005!K!00630000078!C!20090805235959!47001231000000!16042296!336344324!A!1!ENG!0!00630000078!NO!00630000078!...
2215 просмотров
schedule 20.08.2022

как вы анализируете значения, разделенные запятыми (csv), с помощью awk?
Я пытаюсь написать awk-скрипт для преобразования электронной таблицы в формате CSV в XML для ошибок Bugzilla. Формат входного CSV следующий (созданный из электронной таблицы XLS и сохраненный как CSV): tag_1,tag_2,...,tag_N...
4070 просмотров
schedule 18.06.2022

awk и printf в bash
Я пытаюсь получить округленное число средней нагрузки за последние 5 минут. Итак, вот моя команда: uptime | awk -F, '{print $5}'|printf "%.0f\n" Это кажется неверным, так как всегда дает мне 0. Если бы я пытался использовать переменную...
15591 просмотров
schedule 01.02.2024

Как переставить столбцы
В файле, который я переформатирую, я хотел бы поместить последний столбец в качестве первого, а остальные столбцы остались прежними. Я мог бы легко сделать это на питоне, но подумал, что сегодня вечером я изучу awk. Вот пример: (до)...
4145 просмотров
schedule 10.06.2024

создать файл xml с помощью сценария оболочки
У меня есть таблица с двумя столбцами column_1 column_1 12345 12345 73255 73255 71377 71377 Теперь я хочу создать xml, например <header> <value>12345</value> <value>73255</value>...
3381 просмотров
schedule 08.02.2023

Закомментируйте N строк с помощью sed/awk
Как я могу закомментировать строки из определенного шаблона и N строк и далее? int var1; int var2; int var3; int var4; int var5; Хочу закомментировать 3 строки включая var2 (а не по их содержанию!): int var1; // int var2; // int var3; //...
4443 просмотров
schedule 26.11.2022