Вопросы по теме 'dna-sequence'
Получить подстроки ДНК в соответствии с их первоначальным порядком
Я хотел бы получить подстроки длинных последовательностей ДНК
Например, учитывая:
1/ATXGAAATTXXGGAAGGGGTGG
2/AATXGAAGGAAGGAAGGGGATATTX
3/AAAAAATTXXGGAAGGGGXTTTA
4/AAAATTXXATAXXGGAAGGGGXTXG
5/ATTATTGTTXAXTATTT
вывод должен быть:
1/TXG...
249 просмотров
schedule
05.10.2023
Python подсчитывает нуклеотиды с помощью цикла for
Я пытаюсь взять последовательности ДНК из входного файла и подсчитать количество отдельных A, T, C и G, используя цикл для их подсчета, и если есть буква, отличная от «ATCG», мне нужно напечатать «ошибка». Например, мой ввод файл:
Seq1 AAAGCGT...
1044 просмотров
schedule
27.11.2023
как сопоставить образец последовательности ДНК
У меня возникают проблемы с поиском подхода к решению этой проблемы.
Последовательности ввода-вывода следующие:
**input1 :** aaagctgctagag
**output1 :** a3gct2ag2
**input2 :** aaaaaaagctaagctaag
**output2 :** a6agcta2ag
Входная...
5152 просмотров
schedule
14.12.2022
Как получить минимальное и максимальное количество символов из строки?
Так что у меня проблемы со второй частью этого проекта. У меня есть приведенный ниже код, который подсчитывает каждую запись, но я не знаю, как получить максимумы и минимумы... Заранее спасибо!
A1Адепт
Эта программа должна обрабатывать входные...
243 просмотров
schedule
22.03.2023
Регулярное выражение Python: положение перекрывающихся последовательностей
Я использую Python 2.7 и модуль regex. Я использую это выражение, чтобы найти короткую последовательность в более длинной последовательности ДНК:
output = regex.findall(r'(?:'+probe+'){s<'+str(int(mismatches)+1)+'}', sequence,...
547 просмотров
schedule
04.07.2023
Повышение эффективности построения матрицы перекрытия строк
У меня есть огромный список (N = ~ 1 миллион) строк длиной 100 символов, между которыми я пытаюсь найти совпадения. Например, одна строка может быть
XXXXXXXXXXXXXXXXXXAACTGCXAACTGGAAXA (and so on)
Мне нужно построить матрицу N на N, содержащую...
134 просмотров
schedule
11.04.2023
Каков типичный размер файлов последовательностей при проведении попарного выравнивания последовательностей?
Каков типичный размер файлов последовательностей при проведении попарного выравнивания последовательностей? Можем ли мы выровнять весь геном организмов?
44 просмотров
schedule
20.09.2022
Используйте Python для извлечения длин ветвей из формата Newick
У меня есть список в python, состоящий из одного элемента, который представляет собой дерево, написанное в формате Newick, как показано ниже:...
1819 просмотров
schedule
12.10.2022
окно минимальной длины в строке1, где строка2 является подпоследовательностью
Дана основная последовательность ДНК (строка) (скажем, строка1) и еще одна строка для поиска (скажем, строка2). Вы должны найти окно минимальной длины в строке1, где строка2 является подпоследовательностью. строка1 = "abcdefababaef" строка2 = "abf"...
1089 просмотров
schedule
13.12.2022
Как исправить эту ошибку отсутствия библиотеки Perl: не удается найти файл auto/threads/error.al в @INC?
Я запускаю программное обеспечение Trinity RNASeq Assembly на сервере Ubuntu, и возникает следующая ошибка при чтении данных на конце пары.
can't locate auto/threads/error.al in @INC (@INC contains:
Я проверил библиотеку потоков, и она уже...
1123 просмотров
schedule
25.05.2023
Неверный формат вывода при переводе ДНК в белок
Я знаю, что этот вопрос задавался раньше, но я получаю от этого действительно странный результат. В основном я пытаюсь преобразовать последовательность ДНК в формате .fasta (т.е. идентификатор, начинающийся с «>», за которым следует...
222 просмотров
schedule
25.01.2023
Рассчитайте значимость мотивов связывания ДНК, найденных по сравнению с ожидаемыми в MATLAB.
У меня есть набор, скажем, 100 геномных признаков, для которых я создал файл fasta с окном размером 500 п.н. вокруг каждого. Я искал в этих окнах последовательность ДНК и нашел в среднем 1,5 последовательности на отдельное окно размером 500 п.н. в...
67 просмотров
schedule
20.03.2023
Ошибка Plink при преобразовании в двоичный файл: в строке 1 файла .ped меньше токенов, чем ожидалось
Могу ли я получить некоторую помощь здесь? Кто-нибудь сталкивался со следующей ошибкой в plink (набор инструментов для анализа ассоциаций всего генома) при преобразовании из формата «ped», «map» в двоичный аналог «bed», «bim», «fam»? Я использую...
5619 просмотров
schedule
17.02.2023
Как выглядят парные концевые показания Illumina HiSeq/MiSeq?
Насколько я понимаю, парные чтения с платформ Illumina HiSeq/MiSeq выглядят примерно так:
R1:
AAAAAACCCCCC
R2:
GGGGGGTTTTTT
Где чтения, найденные в R2, являются обратным дополнением тех, что найдены в R1. Однако это не относится к...
567 просмотров
schedule
25.05.2022
Код Python для поиска кодирующей ДНК с помощью стартовых и стоп-кодонов
Недавно я пытался написать программу, которая обнаруживает и вырезает кодирующую часть последовательности ДНК на основе стартового и стоп-кодонов.
Конечная цель состоит в том, чтобы сравнить 2 последовательности длиной 240 нуклеотидов, однако одна...
4896 просмотров
schedule
19.06.2023
Сложность при чтении серии строк ДНК, разделенных пробелами, в разные места массива
Я пытаюсь прочитать строку, разделенную пробелами, из файла, который выглядит следующим образом:
CGGCGGGAGATT CGGGAGATTCAA CGTGCGGCGGGA CGTGGAGGCGTG CGTGGCGTGCGG GCGTGCGGCGGG GCGTGGAGGCGT GCGTGGCGTGCG GGAGAAGCGAGA GGAGATTCAAGC GGCGGGAGATTC...
75 просмотров
schedule
21.09.2022
Heatmap.2: добавьте метки строк/столбцов слева/сверху без жестких кодовых координат
Я пытаюсь воссоздать тепловую карту с помощью Heatmap.2, как это (1) :
Я могу добавить метки «A C G T» к меткам нижнего столбца и правой строки. Я пытаюсь добавить имена «групп» к верхней и левой оси («1012T3» и т. д., «G> A» и т. д.).
Я...
3687 просмотров
schedule
21.05.2022
подсчитать мотивы в последовательности ДНК
У меня есть эти последовательности:
GCAGGCATAGTCGGAACTGCTCTAAGCCTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATGA
AGTGGGCTTGTTGGGACTGGTCTTTCTTTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG---ATAA...
249 просмотров
schedule
04.06.2022
Кроссовер правильной краевой рекомбинации для сборки ДНК
Я пытался реализовать генетический алгоритм для сборки фрагментов ДНК в одну последовательность, учитывая только спектр. Мой единственный оператор — Edge Recombination, и я был уверен, что этого достаточно, чтобы получить довольно хороший результат....
441 просмотров
schedule
14.12.2022
Допустимые символы в строке
Мне дается строка, и я должен вернуть False, если есть один или несколько недопустимых символов, иначе True. Нюанс в том, что я умею только встроенные функции и операции str (например: in, +, indexing, len) и рекурсию. То, что у меня есть до сих...
1305 просмотров
schedule
02.04.2023