Кластеризация генов на основе функции

Мы хотели бы использовать иерархическую кластеризацию или кластеризацию k-средств для кластеризации генов в нашем наборе данных на основе их функции. Мы получили идентификатор GO для каждого гена, и теперь мы хотели бы сгруппировать их в группы на основе функции, предпочтительно иерархической. Это означает снизу (где каждая функция уникальна) до верхних уровней (где у нас есть более обобщенные / группы функций). Мы программируем на R.

Заранее спасибо за помощь!


person TheBumpper    schedule 10.03.2014    source источник
comment
Добро пожаловать в StackOverflow TheBumpper! Это с R? В таком случае загляните в проект bioconductor.   -  person llrs    schedule 10.03.2014
comment
@Llopis, какой пакет R вы предлагаете?   -  person TheBumpper    schedule 10.03.2014
comment
Я использовал topGO и GSA (это не из проекта биокондуктора), но я не знаю всех пакеты, и зависит от того, что вы ищете, и от эксперимента, который вы провели.   -  person llrs    schedule 10.03.2014
comment
Добро пожаловать в StackOverflow! Этот вопрос слишком широк для этого сайта, обычно мы имеем дело с конкретными проблемами: когда вы пытались написать код решения, а затем застряли.   -  person Scott Ritchie    schedule 11.03.2014
comment
Полезной отправной точкой будет этот список инструментов, поддерживаемый Консорциумом генных онтологий, в частности инструменты под заголовком Статистический анализ.   -  person Scott Ritchie    schedule 11.03.2014


Ответы (2)


Usuall one либо выполняет анализ дифференциальной экспрессии между двумя условиями, либо объединяет гены в кластеры на основе экспрессии в разных условиях или временных точках. После этого можно искать чрезмерное количество терминов GO в дифференциально экспрессируемых наборах генов или в кластерах.

Возможно, вас заинтересует GeneMania (http://www.genemania.org/) - вы можете ввести список генов, которые будут представлены в сети (с множеством вариантов настройки и расширения). Этот инструмент снова предоставит вам термины GO, которые обогащаются в сети. Второй интересный инструмент - это Gorilla (http://cbl-gorilla.cs.technion.ac.il/) - это покажет саму иерархию GO с подсвеченными терминами GO, если они обогащены.

person micans    schedule 10.03.2014

k-средство не подходит для такого рода данных.

Вместо этого обратите внимание на специализированные алгоритмы для этих данных, в частности на алгоритмы бикластеризации.

person Has QUIT--Anony-Mousse    schedule 10.03.2014