Я выпускаю коды MATLAB, R и Python оператора наименьшего абсолютного сжатия и выбора (LASSO). Они очень просты в использовании. Вы подготавливаете набор данных и просто запускаете код! Затем можно получить LASSO и результаты прогнозирования для новых образцов. Очень просто и легко!

Вы можете купить каждый код по указанным ниже URL-адресам.

МАТЛАБ

https://gum.co/czarD
Пожалуйста, загрузите дополнительный zip-файл (это бесплатно) по указанному ниже URL-адресу, чтобы запустить код LASSO.
http://univprofblog.html.xdomain .jp/code/MATLAB_scripts_functions.zip

R

https://gum.co/IhBEm
Загрузите дополнительный zip-файл (это бесплатно) по указанному ниже URL-адресу, чтобы запустить код LASSO.
http://univprofblog.html.xdomain .jp/code/R_scripts_functions.zip

питон

https://gum.co/hUzpu
Загрузите дополнительный zip-файл (это бесплатно) по указанному ниже URL-адресу, чтобы запустить код LASSO.
http://univprofblog.html.xdomain .jp/code/supportingfunctions.zip

Процедура LASSO в кодах MATLAB, R и Python

Чтобы выполнить соответствующий LASSO, коды MATLAB, R и Python следуют приведенной ниже процедуре после загрузки набора данных.

1. Автомасштабирование целевой переменной (Y) и независимой переменной (X)
Автомасштабирование означает центрирование и масштабирование. Среднее значение каждой переменной становится равным нулю путем вычитания среднего значения каждой переменной из переменной при центрировании. Стандартное отклонение каждой переменной становится единицей путем деления стандартного отклонения каждой переменной от переменной при масштабировании.

2. Определить варианты лямбда
Лямбда — это параметр регуляризации, контролирующий баланс между точностью и разреженностью модели LASSO.
Например, кандидатами лямбда являются 0, 0,001, 0,002, 0,003, …, 0,699, 0,7.

3. Оценить целевую переменную (Y) с перекрестной проверкой (CV) для каждого лямбда-кандидата
CV с исключенным одним значением очень известно, но оно приводит к переобучению при большом количестве обучающих выборок. Итак, 5-кратное или 2-кратное резюме лучше. Сначала обучающие выборки разбиваются на 5 или 2 группы. Во-вторых, одна группа обрабатывается как тестовые образцы, а модель строится с другой группой (группами). Это повторяется 5 или 2 раза, пока каждая группа не будет обработана как тестовые образцы. Тогда можно получить не расчетный Y, а оценочный Y.

4. Рассчитайте среднеквадратичную ошибку (RMSE) между фактическим Y и предполагаемым Y с CV для каждого лямбда-кандидата

5. Определите оптимальную лямбду с минимальным значением RMSE

6. Построить модель LASSO с оптимальной лямбдой

7. Рассчитайте коэффициент детерминанта и среднеквадратичное отклонение между фактическим Y и рассчитанным Y (r2C и RMSEC), а также коэффициент детерминанта и среднеквадратичное отклонение между фактическим Y и расчетным Y (r2CV и среднеквадратичное отклонение), для оптимальной лямбда
r2C означает отношение Y информация, которую может объяснить модель LASSO.
RMSE означает среднее значение ошибок Y в модели LASSO.
r2CV означает возможное отношение информации Y, которую модель LASSO может оценить для новых выборок.
RMSECV означает возможное среднее значение ошибок Y для новых выборок.
Лучшие модели LASSO имеют более высокие значения r2CV и более низкие значения RMSECV.
Большая разница между r2C и r2CV и между RMSEC и RMSECV означает, что модель LASSO переоснащается для обучающие образцы.

*Осторожность! r2CV и RMSECV не могут отражать истинную предсказуемость модели LASSO, поскольку это CV, а не внешняя проверка.

8. Проверьте графики между фактическим Y и расчетным Y, а также между фактическим Y и расчетным Y
Можно проверить выбросы расчетных и расчетных значений.

9. При прогнозировании вычтите среднее значение при автомасштабировании X в 1. из X-переменных, а затем разделите X-переменные на стандартное отклонение при автомасштабировании X в 1. для новых выборок

10. Оцените Y для новых выборок на основе модели LASSO в 6.

11. Умножьте стандартное отклонение при автомасштабировании Y в 1 на расчетное значение Y, а затем добавьте среднее значение при автоматическом масштабировании Y в 1 на расчетное значение Y

Как выполнить ЛАССО?

1. Купить код и разархивировать файл

MATLAB: https://gum.co/czarD

R: https://gum.co/IhBEm

Python: https://gum.co/hUzpu

2. Загрузите и разархивируйте дополнительный zip-файл (это бесплатно)

MATLAB: http://univprofblog.html.xdomain.jp/code/MATLAB_scripts_functions.zip

R: http://univprofblog.html.xdomain.jp/code/R_scripts_functions.zip

Python: http://univprofblog.html.xdomain.jp/code/supportingfunctions.zip

3. Поместите дополнительные файлы в тот же каталог или папку, что и код LASSO.

4. Подготовьте набор данных. Формат данных см. в статье ниже.

https://medium.com/@univprofblog1/data-format-for-matlab-r-and-python-codes-of-data-analysis-and-sample-data-set-9b0f845b565a#.3ibrphs4h

5. Запустите код!

Расчетные значения Y для «data_prediction2.csv» сохраняются в «PredictedY2.csv». Стандартные коэффициенты регрессии сохраняются в файле «RegressionCoefficients.csv». Переменные, имеющие ненулевые стандартные коэффициенты регрессии, означают выбранные переменные.

Требуемые настройки

См. статью ниже.
https://medium.com/@univprofblog1/settings-for-running-my-matlab-r-and-python-codes-136b9e5637a1#.paer8scqy

Примеры результатов выполнения