Вопросы по теме 'dna-sequence'

Получить подстроки ДНК в соответствии с их первоначальным порядком
Я хотел бы получить подстроки длинных последовательностей ДНК Например, учитывая: 1/ATXGAAATTXXGGAAGGGGTGG 2/AATXGAAGGAAGGAAGGGGATATTX 3/AAAAAATTXXGGAAGGGGXTTTA 4/AAAATTXXATAXXGGAAGGGGXTXG 5/ATTATTGTTXAXTATTT вывод должен быть: 1/TXG...
249 просмотров
schedule 05.10.2023

Python подсчитывает нуклеотиды с помощью цикла for
Я пытаюсь взять последовательности ДНК из входного файла и подсчитать количество отдельных A, T, C и G, используя цикл для их подсчета, и если есть буква, отличная от «ATCG», мне нужно напечатать «ошибка». Например, мой ввод файл: Seq1 AAAGCGT...
1044 просмотров
schedule 27.11.2023

как сопоставить образец последовательности ДНК
У меня возникают проблемы с поиском подхода к решению этой проблемы. Последовательности ввода-вывода следующие: **input1 :** aaagctgctagag **output1 :** a3gct2ag2 **input2 :** aaaaaaagctaagctaag **output2 :** a6agcta2ag Входная...
5152 просмотров
schedule 14.12.2022

Как получить минимальное и максимальное количество символов из строки?
Так что у меня проблемы со второй частью этого проекта. У меня есть приведенный ниже код, который подсчитывает каждую запись, но я не знаю, как получить максимумы и минимумы... Заранее спасибо! A1Адепт Эта программа должна обрабатывать входные...
243 просмотров

Регулярное выражение Python: положение перекрывающихся последовательностей
Я использую Python 2.7 и модуль regex. Я использую это выражение, чтобы найти короткую последовательность в более длинной последовательности ДНК: output = regex.findall(r'(?:'+probe+'){s<'+str(int(mismatches)+1)+'}', sequence,...
547 просмотров
schedule 04.07.2023

Повышение эффективности построения матрицы перекрытия строк
У меня есть огромный список (N = ~ 1 миллион) строк длиной 100 символов, между которыми я пытаюсь найти совпадения. Например, одна строка может быть XXXXXXXXXXXXXXXXXXAACTGCXAACTGGAAXA (and so on) Мне нужно построить матрицу N на N, содержащую...
134 просмотров
schedule 11.04.2023

Каков типичный размер файлов последовательностей при проведении попарного выравнивания последовательностей?
Каков типичный размер файлов последовательностей при проведении попарного выравнивания последовательностей? Можем ли мы выровнять весь геном организмов?
44 просмотров

Используйте Python для извлечения длин ветвей из формата Newick
У меня есть список в python, состоящий из одного элемента, который представляет собой дерево, написанное в формате Newick, как показано ниже:...
1819 просмотров
schedule 12.10.2022

окно минимальной длины в строке1, где строка2 является подпоследовательностью
Дана основная последовательность ДНК (строка) (скажем, строка1) и еще одна строка для поиска (скажем, строка2). Вы должны найти окно минимальной длины в строке1, где строка2 является подпоследовательностью. строка1 = "abcdefababaef" строка2 = "abf"...
1089 просмотров

Как исправить эту ошибку отсутствия библиотеки Perl: не удается найти файл auto/threads/error.al в @INC?
Я запускаю программное обеспечение Trinity RNASeq Assembly на сервере Ubuntu, и возникает следующая ошибка при чтении данных на конце пары. can't locate auto/threads/error.al in @INC (@INC contains: Я проверил библиотеку потоков, и она уже...
1123 просмотров
schedule 25.05.2023

Неверный формат вывода при переводе ДНК в белок
Я знаю, что этот вопрос задавался раньше, но я получаю от этого действительно странный результат. В основном я пытаюсь преобразовать последовательность ДНК в формате .fasta (т.е. идентификатор, начинающийся с «>», за которым следует...
222 просмотров
schedule 25.01.2023

Рассчитайте значимость мотивов связывания ДНК, найденных по сравнению с ожидаемыми в MATLAB.
У меня есть набор, скажем, 100 геномных признаков, для которых я создал файл fasta с окном размером 500 п.н. вокруг каждого. Я искал в этих окнах последовательность ДНК и нашел в среднем 1,5 последовательности на отдельное окно размером 500 п.н. в...
67 просмотров
schedule 20.03.2023

Ошибка Plink при преобразовании в двоичный файл: в строке 1 файла .ped меньше токенов, чем ожидалось
Могу ли я получить некоторую помощь здесь? Кто-нибудь сталкивался со следующей ошибкой в ​​​​plink (набор инструментов для анализа ассоциаций всего генома) при преобразовании из формата «ped», «map» в двоичный аналог «bed», «bim», «fam»? Я использую...
5619 просмотров
schedule 17.02.2023

Как выглядят парные концевые показания Illumina HiSeq/MiSeq?
Насколько я понимаю, парные чтения с платформ Illumina HiSeq/MiSeq выглядят примерно так: R1: AAAAAACCCCCC R2: GGGGGGTTTTTT Где чтения, найденные в R2, являются обратным дополнением тех, что найдены в R1. Однако это не относится к...
567 просмотров
schedule 25.05.2022

Код Python для поиска кодирующей ДНК с помощью стартовых и стоп-кодонов
Недавно я пытался написать программу, которая обнаруживает и вырезает кодирующую часть последовательности ДНК на основе стартового и стоп-кодонов. Конечная цель состоит в том, чтобы сравнить 2 последовательности длиной 240 нуклеотидов, однако одна...
4896 просмотров
schedule 19.06.2023

Сложность при чтении серии строк ДНК, разделенных пробелами, в разные места массива
Я пытаюсь прочитать строку, разделенную пробелами, из файла, который выглядит следующим образом: CGGCGGGAGATT CGGGAGATTCAA CGTGCGGCGGGA CGTGGAGGCGTG CGTGGCGTGCGG GCGTGCGGCGGG GCGTGGAGGCGT GCGTGGCGTGCG GGAGAAGCGAGA GGAGATTCAAGC GGCGGGAGATTC...
75 просмотров
schedule 21.09.2022

Heatmap.2: добавьте метки строк/столбцов слева/сверху без жестких кодовых координат
Я пытаюсь воссоздать тепловую карту с помощью Heatmap.2, как это (1) : Я могу добавить метки «A C G T» к меткам нижнего столбца и правой строки. Я пытаюсь добавить имена «групп» к верхней и левой оси («1012T3» и т. д., «G> A» и т. д.). Я...
3687 просмотров
schedule 21.05.2022

подсчитать мотивы в последовательности ДНК
У меня есть эти последовательности: GCAGGCATAGTCGGAACTGCTCTAAGCCTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATGA AGTGGGCTTGTTGGGACTGGTCTTTCTTTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG---ATAA...
249 просмотров
schedule 04.06.2022

Кроссовер правильной краевой рекомбинации для сборки ДНК
Я пытался реализовать генетический алгоритм для сборки фрагментов ДНК в одну последовательность, учитывая только спектр. Мой единственный оператор — Edge Recombination, и я был уверен, что этого достаточно, чтобы получить довольно хороший результат....
441 просмотров
schedule 14.12.2022

Допустимые символы в строке
Мне дается строка, и я должен вернуть False, если есть один или несколько недопустимых символов, иначе True. Нюанс в том, что я умею только встроенные функции и операции str (например: in, +, indexing, len) и рекурсию. То, что у меня есть до сих...
1305 просмотров
schedule 02.04.2023