Когда вы выполняете регрессию, вы подгоняете модель к данным. Другими словами, вы говорите: «Вот уравнение, которое примерно описывает, как ведут себя данные». В случае линейной регрессии модель/уравнение:
y = a * x + b
Где x — это вход, а y — это выход. Выполняя линейную регрессию, вы говорите: «Мои данные следуют прямой линии, вот мои данные, какие параметры a и b лучше всего соответствуют данным?».
Очевидно, что если ваши данные не следуют прямой линии, это будет работать плохо. Например, посмотрите на это изображение, которое я нашел на изображениях Google.
Отчетливо видно, что данные имеют какую-то сложную волнистую форму — они идут вверх и вниз, а затем снова вверх. Линейная модель недостаточно сложна, чтобы выразить эту форму (она может создавать только прямые линии). Так что не подходит.
Поскольку вам нужна более сложная модель, вы должны выбрать одну. Есть десятки стандартных, и вы можете составить свой собственный. Вся модель представляет собой уравнение с некоторыми фиксированными параметрами, которые можно настроить так, чтобы уравнение соответствовало вашим данным.
Я предлагаю вам поиграть с параметрами линии тренда в Excel или Google Sheets, чтобы почувствовать это. См. раздел «Типы тренда» здесь для некоторых общие модели.
Обратите внимание, что ни один из них не будет хорошо работать для получения ежемесячной прибыли, потому что ни один из них не является циклическим. Вероятно, вам нужна модель, представляющая собой комбинацию нескольких повторяющихся множителей для учета изменений от месяца к месяцу, а затем линейный или полиномиальный компонент для учета того факта, что годовая прибыль увеличивается или уменьшается с течением времени.
Однако вам не нужна слишком выразительная модель, в противном случае вы переобучите данные (по сути, она увидит закономерности в шуме).
person
Timmmm
schedule
24.10.2017