Я встречал много похожих вопросов в Интернете, но не мог найти тот, который решает мою проблему, и я могу понять. Я был бы признателен за некоторые объяснения здесь, чтобы помочь в моем понимании. Заранее спасибо!
So,
[COEFF,SCORE,latent,tsquare] = princomp(X)
Я понимаю, что для coeff
столбцы расположены в порядке уменьшения дисперсии компонентов. Но знаю ли я важность моих переменных (исходный набор данных), а не важность основного компонента (ПК), как то, что может дать ответ coeff
. Есть ли способ оценить важность имеющихся у меня переменных?
Я видел, что многие статистические программы могут это сделать, показывая, какие исходные переменные больше всего влияют на график, а какие можно удалить, чтобы предотвратить проблему переобучения. Есть ли способ сделать это с помощью MatLab?
Моя цель - построить данные в виде двухмерного графика, то есть я буду использовать ПК1 и ПК2, которые содержат наиболее значительную дисперсию компонентов. Итак, опять же, как мне узнать, какие переменные следует сохранить, а какие отбросить?
Кто-нибудь может мне это объяснить? Спасибо!