Вопросы по теме 'snakemake'

Всегда запускать правило в Snakefile (snakemake)
Я пишу файл Snakefile для рабочего процесса создания змейки. В рамках моего рабочего процесса мне нужно проверить, изменился ли набор записей в базе данных и не загружали ли они их повторно. Я думал написать правило, которое проверяет временную...
1627 просмотров
schedule 20.05.2022

Доступ к файлам журналов, созданным правилами snakemake
есть ли способ программно перечислить файлы журнала, созданные для каждого правила, из Snakefile? Придется ли мне подключаться к DAG, и если да, то как? Справочная информация: я хотел бы объединить и удалить все созданные файлы журналов (только...
1057 просмотров
schedule 25.07.2023

snakemake: как работать с переменным количеством выходных данных правила
Я хочу запустить bcl2fastq для создания файлов fastq из формата bcl. В зависимости от настройки последовательности в отношении режима последовательности и количества использованных индексов, он может генерировать либо read1, read2, index1, либо...
1406 просмотров
schedule 09.05.2023

bioconda: нет такого файла или каталога mulled-build
Я пытаюсь создать новый пакет ( verifybamid ) для биоконды. Я запускаю это на минимальной виртуальной машине Linux с настроенными docker, conda, bioconda-utils и т. Д. conda build verifybamid работает. Когда я пытаюсь ./simulate-travis.py...
111 просмотров
schedule 27.08.2022

Имя текущего правила в Snakemake
Я работаю со Snakemake и не могу найти способ получить доступ к названию текущего правила . Например, есть ли способ получить такой доступ: rule job1: input: check_inputs(rules.current.name) output: ... Это может быть очень...
1050 просмотров
schedule 06.08.2022

Как использовать расширение в snakemake, когда некоторые конкретные комбинации подстановочных знаков нежелательны?
Предположим, у меня есть следующие файлы, к которым я хочу автоматически применить некоторую обработку с помощью snakemake: test_input_C_1.txt test_input_B_2.txt test_input_A_2.txt test_input_A_1.txt Следующий файл snakefile использует...
1718 просмотров

Генерация параметризованного количества выходных файлов для правила snakemake
Мой рабочий процесс должен выполняться на двух разных кластерах. Первый кластер планирует задания для узлов в зависимости от доступности ресурсов. Второй кластер резервирует целые узлы для заданного задания и просит пользователей эффективно...
252 просмотров
schedule 26.05.2024

Глобальная загрузка библиотек R в Snakemake
В настоящее время я создаю конвейер NGS с помощью Snakemake, и у меня возникла проблема с загрузкой библиотек R. Некоторые из скриптов, которые вызывают мои правила, требуют загрузки библиотек R. Поскольку я не нашел способа загрузить их глобально,...
216 просмотров
schedule 11.11.2022

Реализация Как использовать расширение в змейке, когда некоторые комбинации подстановочных знаков нежелательны?
Я попытался реализовать Как использовать расширение в змейке, когда некоторые комбинации подстановочных знаков нежелательны? Цель состоит в том, чтобы обрабатывать только пересекающиеся комбинации между SUPERGROUPS : from itertools import...
482 просмотров
schedule 15.08.2022

Snakemake: образцы с подпунктами, как их поймать?
Вот краткий пример файла config.yaml: samples: sample1: stranded: True sample2: stranded: False Как видите, у каждого образца есть подпункт (на самом деле их несколько). Но я не знаю, как их поймать. Мой змеиный файл:...
124 просмотров
schedule 10.07.2023

Запрос памяти по умолчанию с возможностью переопределения в Snakefile?
У меня есть файл Snakefile с несколькими правилами, и лишь некоторым из них требуется более 1 ГБ на ядро ​​для работы в кластере. Директива resources отлично подходит для этого, но я не могу найти способ установить значение по умолчанию. Я бы...
166 просмотров
schedule 04.04.2022

Синтаксис для использования данных конфигурации в правилах
Есть ли какое-нибудь место, которое полностью описывает использование данных конфигурации в правилах создания змейки? В руководстве пользователя есть пример этого в файле yaml: samples: A: data/samples/A.fastq B: data/samples/B.fastq...
1303 просмотров
schedule 02.04.2022

Snakemake: правило генерирует странные результаты
Я создаю это правило: rule picard_addRG2: input: "mapped_reads/merged_samples/{sample}.dedup.bam" output: "mapped_reads/merged_samples/{sample}_rg.dedup.bam" params: sample_idi = config['samples'],...
121 просмотров
schedule 26.03.2022

Правила изготовления змей
Я хочу использовать snakemake для создания конвейера биоинформатики, я искал его, читал документы и другие вещи, но я все еще не знаю, как заставить его работать. Вот некоторые из моих файлов с необработанными данными. Rawdata /...
260 просмотров
schedule 23.02.2022

SLURM / Sbatch создает множество небольших файлов вывода
Я использую конвейер на SLURM-кластере, и по какой-то причине много файлов меньшего размера (размером от 500 до 2000 байт) названы по строкам slurm-XXXXXX.out (где XXXXXX - это число). Я попытался узнать, что это за файлы на сайте SLURM, но не...
2602 просмотров
schedule 02.06.2022

Игнорировать / Не использовать кластер для определенных правил
Если я использую --cluster и --cluster-config, могу ли я назначить определенные правила, которые будут выполняться в основном задании snakemake, а не отправляться в кластер как отдельное задание? У меня есть несколько очень простых правил, которые не...
38 просмотров
schedule 16.02.2023

Как можно заставить Snakemake обновлять файлы иерархически на основе правил, когда новый файл появляется внизу иерархии?
У меня есть файл-змея с десятками правил, и он обрабатывает тысячи файлов. Это биоинформатический конвейер для анализа последовательности ДНК. Сегодня я добавил еще два образца в свой набор образцов, и я ожидал, что смогу запустить snakemake, и он...
495 просмотров
schedule 25.09.2022

Snakemake: вернитесь и очистите файлы temp ()
Я знаю, что варианты по этому поводу уже задавались (например, https://groups.google.com/forum/#!topic/snakemake/4kslVBX2kew ), но я не вижу окончательного решения. Если я запустил долго работающий и сложный конвейер Snakemake с '--notemp'...
421 просмотров
schedule 09.06.2022

SnakeMake различные среды для каждого подрабочего процесса
Я сделал два отдельных конвейера анализа в змейке, каждый из которых имеет собственную среду conda. Теперь я делаю зонтичную змейку с двумя пайплайнами в качестве подпроцессов. Можно ли использовать два других конвейера в собственной среде? Я не...
286 просмотров
schedule 27.11.2022

Snakemake: правило использования множества входов для одного выхода с несколькими подгруппами
У меня есть рабочий конвейер, который я использую для загрузки, выравнивания и выполнения вызова вариантов общедоступных данных секвенирования. Проблема в том, что в настоящее время он может работать только для каждого образца ( т.е. образец в...
1431 просмотров