Среднее (среднее арифметическое):
Среднее значение является центральным значением конечного набора данных.
Это может быть среднее значение геоматики, среднее гармоническое. Для распределения вероятностей это ожидаемое значение E (x) = ∑ x * P (x), где x - случайная величина, а P (x) - функция массы вероятности.
Медиана. Медиана – это среднее число в отсортированном по возрастанию или по убыванию списке чисел .
- Если в списке есть нечетные числа, то его средний номер
- Если в списке есть четные числа, то разделить на два средних числа, чтобы найти медианное значение.
Стандартное отклонение: показывает, сколько данных в среднем разбросано вокруг среднего значения.
Дисперсия: это квадрат значения отклонения стенда.
1-й, 2-й, 3-й и 4-й квартили:
Это делит количество точек данных на четыре части вокруг медианы. Данные должны располагаться от низшего к высшему. Он предоставляет информацию как о центре, так и о распространении данных. Мы можем вычислить среднюю разницу.
Предварительная обработка данных:
Данные поступают из разных источников в реальном мире, они не реальны, они могут иметь зашумленное значение, отсутствующее значение, несогласованные данные, несогласованный формат, делающий дату готовой и полезной, называется предварительной обработкой данных.
•Короче говоря, сделать данные качественными.
- Мы можем применить очистку данных (пропущенное значение, шум), преобразование данных и сокращение данных.
Временные ряды:
Временной ряд – это последовательность наблюдений, проведенных в последовательные равноотстоящие моменты времени.
Средний фильтр:
• Замена каждой записи средним значением соседних записей
• Предварительная обработка данных
• Метод нелинейной цифровой фильтрации
• Удалите шум с изображения или сигнала
• Обработка изображений (удаление шума и улучшение краев)
Медианный фильтр:
- Замена каждой записи медианой соседних записей.
Фильтр экспоненциального сглаживания:
- Используйте для сглаживания временных рядов с экспоненциальной оконной функцией
Обучающий набор и набор для тестирования
Это набор данных, который используется для обучения и изучения скрытых функций/шаблонов в данных.
• Разнообразный набор входов
Тестовый набор:
• Тестовый набор — это отдельный набор данных, используемый для тестирования модели после завершения обучения.