У меня есть кадр данных X с двумя столбцами a и b, a имеет символ класса, а b - числовой класс. Я установил гауссово распределение, используя функцию fitdist (пакет fitdistrplus) на b.
data.fit <- fitdist(x$b,"norm", "mle")
Я хочу извлечь элементы в столбце a, которые попадают в 5% правый хвост подобранного гауссовского распределения.
Я не знаю, как действовать дальше, потому что мои знания о подходящем распределении ограничены.
Нужно ли мне сохранять соответствующие элементы в столбце a, для которых b больше, чем значение, полученное для 95%?
Или подгонка подразумевает, что для каждого значения в b были созданы новые значения, и я должен использовать эти значения?
Спасибо