Анализ PCA и построение графиков с помощью Python

Возможное дублирование:
Анализ PCA с помощью Python

У меня есть данные, размер которых составляет 1940 x 4. Его строки представляют собой показания или образцы, а его столбцы - переменные (температура, влажность, скорость ветра и давление). Я хотел провести анализ PCA и построить его результаты с помощью Python. Ситуация такова, что у меня есть несколько методов и примеров, но я не уверен, как их использовать и что делать, даже если я получу результаты PCA. Итак, здесь я ищу пример кода, с помощью которого я могу реализовать анализ PCA в Python для такого рода наборов данных, а также понять, как интерпретировать результаты PCA и как их построить ... наконец, как интерпретировать графики. Огромное спасибо.


person khan    schedule 02.12.2012    source источник
comment
stackoverflow.com/questions/1730600/   -  person YXD    schedule 02.12.2012
comment
Комментарий г-на Е. должен помочь. Также кажется, что ваш предыдущий вопрос получил довольно надежные ответы (и я не уверен, как это вопрос совсем другой.)   -  person gary    schedule 02.12.2012
comment
Я видел этот пример ... все говорит о том, как вы можете построить свой PCA ... Мне нужно знать, как я должен строить, плюс что отображать в результатах PCA и как их правильно интерпретировать .. :(   -  person khan    schedule 02.12.2012
comment
для чего вам нужен PCA, поскольку ваши данные только четырехмерные, вы все равно хотите уменьшить это измерение?   -  person Min Lin    schedule 02.12.2012
comment
обязательно откройте файл данных в каком-нибудь текстовом редакторе, b / c в excel выглядит страшно.   -  person khan    schedule 02.12.2012
comment
Да, я хочу уменьшить его до двух измерений ... или максимум до трех, чтобы я мог построить и интерпретировать все это.   -  person khan    schedule 02.12.2012


Ответы (1)


Анализ главных компонентов полезен для уменьшения размерности набора данных. Поскольку ваши данные содержат только четыре переменных и (насколько мне известно) они не связаны между собой, я не ожидал, что PCA будет ценным для какого-либо практического анализа.

Если я ошибаюсь и вы искренне ожидаете, что некоторые из переменных связаны, вы можете использовать PCA для определения наиболее важных 4-векторов, которые охватывают большую часть типичной ковариации. Это собственные векторы ковариационной матрицы. Чтобы полностью охватить то же пространство, что и входные переменные, требуется четыре таких вектора.

В системах, где измеряется большое количество переменных и существует большая степень взаимной информации, PCA идентифицирует важные биты независимой информации. Я не думаю, что это относится к вашей системе.

person Carl F.    schedule 02.12.2012