Я нашел другие сообщения об общем поиске перекрывающихся диапазонов в R iRanges, но не могли бы вы помочь мне с этим дополнительным небольшим поворотом: у меня есть два диапазона, которые связаны (возможная геномная перестройка с начальным диапазоном и конечным диапазоном), и я хотел бы отфильтровать те же самые диапазоны в геноме матери
Я нашел диапазоны для остановки и начала, как показано ниже (номер chr, начало интервала, конец интервала), где 3 столбца слева показывают начало перестановки, а 3 столбца справа показывают конец перестановки (они вывод программы SVDetect, которая использует данные NGS для поиска пар спариваний, которые имеют ненормальное выравнивание с эталонным геномом). У меня есть два генома, материнский клон и дочерний, и я хотел бы найти перестройки, которые уникальны для дочери = я хотел бы отфильтровать строки, в которых оба диапазона перекрываются с ОДНОЙ строкой из двух диапазонов в другом. Диапазоны могут немного отличаться, но если оба диапазона перекрываются, это будет четко указывать на то, что перестройка уже присутствует у матери. iRanges в R позволяет вам легко увидеть, перекрывается ли диапазон с другими диапазонами, но я не смог найти решение, где он мог бы показать мне, С КАКИМ диапазоном он перекрывается, не будучи очень очень медленным циклом for.
Дочь:
1 1384138 1384862 - 1 516731 516918
2 3758860 3759278 - 2 879828 879966 # (filter away this line as overlap with below)
2 3940051 3940470 - 2 3940856 3941250
Мать:
2 3758858 3759282 - 2 879828 879966 # (overlap with this range)
1 1384138 1384862 - 3 116231 516918
2 3940051 3940470 - 3 1540856 3941250