Среднее (среднее арифметическое):

Среднее значение является центральным значением конечного набора данных.

Это может быть среднее значение геоматики, среднее гармоническое. Для распределения вероятностей это ожидаемое значение E (x) = ∑ x * P (x), где x - случайная величина, а P (x) - функция массы вероятности.

Медиана. Медиана – это среднее число в отсортированном по возрастанию или по убыванию списке чисел .

  • Если в списке есть нечетные числа, то его средний номер
  • Если в списке есть четные числа, то разделить на два средних числа, чтобы найти медианное значение.

Стандартное отклонение: показывает, сколько данных в среднем разбросано вокруг среднего значения.

Дисперсия: это квадрат значения отклонения стенда.

1-й, 2-й, 3-й и 4-й квартили:

Это делит количество точек данных на четыре части вокруг медианы. Данные должны располагаться от низшего к высшему. Он предоставляет информацию как о центре, так и о распространении данных. Мы можем вычислить среднюю разницу.

Предварительная обработка данных:

Данные поступают из разных источников в реальном мире, они не реальны, они могут иметь зашумленное значение, отсутствующее значение, несогласованные данные, несогласованный формат, делающий дату готовой и полезной, называется предварительной обработкой данных.

•Короче говоря, сделать данные качественными.

  • Мы можем применить очистку данных (пропущенное значение, шум), преобразование данных и сокращение данных.

Временные ряды:

Временной ряд – это последовательность наблюдений, проведенных в последовательные равноотстоящие моменты времени.

Средний фильтр:

• Замена каждой записи средним значением соседних записей

• Предварительная обработка данных

• Метод нелинейной цифровой фильтрации

• Удалите шум с изображения или сигнала

• Обработка изображений (удаление шума и улучшение краев)

Медианный фильтр:

  • Замена каждой записи медианой соседних записей.

Фильтр экспоненциального сглаживания:

  • Используйте для сглаживания временных рядов с экспоненциальной оконной функцией

Обучающий набор и набор для тестирования

Это набор данных, который используется для обучения и изучения скрытых функций/шаблонов в данных.

• Разнообразный набор входов

Тестовый набор:

• Тестовый набор — это отдельный набор данных, используемый для тестирования модели после завершения обучения.