Мы хотели бы использовать иерархическую кластеризацию или кластеризацию k-средств для кластеризации генов в нашем наборе данных на основе их функции. Мы получили идентификатор GO для каждого гена, и теперь мы хотели бы сгруппировать их в группы на основе функции, предпочтительно иерархической. Это означает снизу (где каждая функция уникальна) до верхних уровней (где у нас есть более обобщенные / группы функций). Мы программируем на R.
Заранее спасибо за помощь!