Вопросы по теме 'snakemake'
Всегда запускать правило в Snakefile (snakemake)
Я пишу файл Snakefile для рабочего процесса создания змейки. В рамках моего рабочего процесса мне нужно проверить, изменился ли набор записей в базе данных и не загружали ли они их повторно.
Я думал написать правило, которое проверяет временную...
1627 просмотров
schedule
20.05.2022
Доступ к файлам журналов, созданным правилами snakemake
есть ли способ программно перечислить файлы журнала, созданные для каждого правила, из Snakefile? Придется ли мне подключаться к DAG, и если да, то как?
Справочная информация: я хотел бы объединить и удалить все созданные файлы журналов (только...
1057 просмотров
schedule
25.07.2023
snakemake: как работать с переменным количеством выходных данных правила
Я хочу запустить bcl2fastq для создания файлов fastq из формата bcl.
В зависимости от настройки последовательности в отношении режима последовательности и количества использованных индексов, он может генерировать либо read1, read2, index1, либо...
1406 просмотров
schedule
09.05.2023
bioconda: нет такого файла или каталога mulled-build
Я пытаюсь создать новый пакет ( verifybamid ) для биоконды. Я запускаю это на минимальной виртуальной машине Linux с настроенными docker, conda, bioconda-utils и т. Д. conda build verifybamid работает. Когда я пытаюсь ./simulate-travis.py...
111 просмотров
schedule
27.08.2022
Имя текущего правила в Snakemake
Я работаю со Snakemake и не могу найти способ получить доступ к названию текущего правила .
Например, есть ли способ получить такой доступ:
rule job1:
input: check_inputs(rules.current.name)
output: ...
Это может быть очень...
1050 просмотров
schedule
06.08.2022
Как использовать расширение в snakemake, когда некоторые конкретные комбинации подстановочных знаков нежелательны?
Предположим, у меня есть следующие файлы, к которым я хочу автоматически применить некоторую обработку с помощью snakemake:
test_input_C_1.txt
test_input_B_2.txt
test_input_A_2.txt
test_input_A_1.txt
Следующий файл snakefile использует...
1718 просмотров
schedule
07.06.2022
Генерация параметризованного количества выходных файлов для правила snakemake
Мой рабочий процесс должен выполняться на двух разных кластерах. Первый кластер планирует задания для узлов в зависимости от доступности ресурсов. Второй кластер резервирует целые узлы для заданного задания и просит пользователей эффективно...
252 просмотров
schedule
26.05.2024
Глобальная загрузка библиотек R в Snakemake
В настоящее время я создаю конвейер NGS с помощью Snakemake, и у меня возникла проблема с загрузкой библиотек R. Некоторые из скриптов, которые вызывают мои правила, требуют загрузки библиотек R. Поскольку я не нашел способа загрузить их глобально,...
216 просмотров
schedule
11.11.2022
Реализация Как использовать расширение в змейке, когда некоторые комбинации подстановочных знаков нежелательны?
Я попытался реализовать Как использовать расширение в змейке, когда некоторые комбинации подстановочных знаков нежелательны?
Цель состоит в том, чтобы обрабатывать только пересекающиеся комбинации между SUPERGROUPS :
from itertools import...
482 просмотров
schedule
15.08.2022
Snakemake: образцы с подпунктами, как их поймать?
Вот краткий пример файла config.yaml:
samples:
sample1:
stranded: True
sample2:
stranded: False
Как видите, у каждого образца есть подпункт (на самом деле их несколько). Но я не знаю, как их поймать. Мой змеиный файл:...
124 просмотров
schedule
10.07.2023
Запрос памяти по умолчанию с возможностью переопределения в Snakefile?
У меня есть файл Snakefile с несколькими правилами, и лишь некоторым из них требуется более 1 ГБ на ядро для работы в кластере. Директива resources отлично подходит для этого, но я не могу найти способ установить значение по умолчанию. Я бы...
166 просмотров
schedule
04.04.2022
Синтаксис для использования данных конфигурации в правилах
Есть ли какое-нибудь место, которое полностью описывает использование данных конфигурации в правилах создания змейки?
В руководстве пользователя есть пример этого в файле yaml:
samples:
A: data/samples/A.fastq
B: data/samples/B.fastq...
1303 просмотров
schedule
02.04.2022
Snakemake: правило генерирует странные результаты
Я создаю это правило:
rule picard_addRG2:
input:
"mapped_reads/merged_samples/{sample}.dedup.bam"
output:
"mapped_reads/merged_samples/{sample}_rg.dedup.bam"
params:
sample_idi = config['samples'],...
121 просмотров
schedule
26.03.2022
Правила изготовления змей
Я хочу использовать snakemake для создания конвейера биоинформатики, я искал его, читал документы и другие вещи, но я все еще не знаю, как заставить его работать.
Вот некоторые из моих файлов с необработанными данными.
Rawdata /...
260 просмотров
schedule
23.02.2022
SLURM / Sbatch создает множество небольших файлов вывода
Я использую конвейер на SLURM-кластере, и по какой-то причине много файлов меньшего размера (размером от 500 до 2000 байт) названы по строкам slurm-XXXXXX.out (где XXXXXX - это число). Я попытался узнать, что это за файлы на сайте SLURM, но не...
2602 просмотров
schedule
02.06.2022
Игнорировать / Не использовать кластер для определенных правил
Если я использую --cluster и --cluster-config, могу ли я назначить определенные правила, которые будут выполняться в основном задании snakemake, а не отправляться в кластер как отдельное задание? У меня есть несколько очень простых правил, которые не...
38 просмотров
schedule
16.02.2023
Как можно заставить Snakemake обновлять файлы иерархически на основе правил, когда новый файл появляется внизу иерархии?
У меня есть файл-змея с десятками правил, и он обрабатывает тысячи файлов. Это биоинформатический конвейер для анализа последовательности ДНК. Сегодня я добавил еще два образца в свой набор образцов, и я ожидал, что смогу запустить snakemake, и он...
495 просмотров
schedule
25.09.2022
Snakemake: вернитесь и очистите файлы temp ()
Я знаю, что варианты по этому поводу уже задавались (например, https://groups.google.com/forum/#!topic/snakemake/4kslVBX2kew ), но я не вижу окончательного решения.
Если я запустил долго работающий и сложный конвейер Snakemake с '--notemp'...
421 просмотров
schedule
09.06.2022
SnakeMake различные среды для каждого подрабочего процесса
Я сделал два отдельных конвейера анализа в змейке, каждый из которых имеет собственную среду conda. Теперь я делаю зонтичную змейку с двумя пайплайнами в качестве подпроцессов. Можно ли использовать два других конвейера в собственной среде? Я не...
286 просмотров
schedule
27.11.2022
Snakemake: правило использования множества входов для одного выхода с несколькими подгруппами
У меня есть рабочий конвейер, который я использую для загрузки, выравнивания и выполнения вызова вариантов общедоступных данных секвенирования. Проблема в том, что в настоящее время он может работать только для каждого образца ( т.е. образец в...
1431 просмотров
schedule
27.08.2022