Что такое статистика?
Статистика - это математическая наука, относящаяся к сбору, представлению, анализу и интерпретации данных.
Он широко используется для понимания сложных проблем реального мира и упрощения их принятия обоснованных решений.
Для анализа первичных данных, построения статистической модели и прогнозирования результатов можно использовать несколько статистических принципов, функций и алгоритмов.
Важность статистики
· Это упрощает массу данных (Конденсация)
· Помогает получить Конкретную информацию о любой проблеме
· Помогает принимать надежные и объективные решения
· Он представляет факты в точной и определенной форме.
· Это облегчает сравнение (мера центральной тенденции и мера дисперсии)
· Это облегчает прогнозирование (временные ряды и регрессионный анализ являются наиболее часто используемыми методами прогнозирования)
· Это помогает в разработке подходящей политики.
В чем разница между машинным обучением и статистикой?
«Основное различие между машинным обучением и статистикой заключается в их назначении.
Модели машинного обучения предназначены для максимально точного прогнозирования.
Статистические модели предназначены для выводов о взаимосвязях между переменными».
Статистический анализ и нестатистический анализ
Статистический анализ как наука о сборе, изучении и представлении больших объемов данных для выявления закономерностей и тенденций. Статистический анализ также называют количественным анализом.
Нестатистический анализпредоставляет общую информацию и включает звук текста. Неподвижные изображения и движущиеся изображения. Нестатистический анализ также называют качественным анализом.
Хотя обе формы анализа дают результаты, статистический анализ дает более глубокое понимание и более четкую картину, что делает его жизненно важным для бизнеса.
Различные типы переменных
В зависимости от характера переменных их можно разделить на четыре типа.
Номинальные переменные
Номинальные переменные — это те, которые имеют две или более категории, и невозможно упорядочить значения.
Пример: пол и группа крови
Порядковые переменные
Порядковые переменные — это те, которые имеют значения в логическом порядке, однако относительное расстояние между переменными неясно.
Пример: размер кофейной чашки, маленький, средний и большой.
Переменные интервала
Интервальные переменные — это переменные с одинаковым расстоянием между значениями. И эти переменные носят количественный характер
Пример: Шкала градусов Фаренгейта, используемая для измерения температуры.
Переменные отношения
Переменные отношения один раз с равным расстоянием между значениями. И эти переменные количественные (имеет истинную нулевую точку)
Пример: система дюймов, используемая в общей линейке.
Различные статистические термины
Различные статистические термины, о которых следует знать при работе со статистикой. Население, выборочная переменная, количественная переменная, качественная переменная, дискретная переменная, непрерывная переменная.
· Население — это группа, из которой должны собираться данные.
· выборка — это подмножество генеральной совокупности.
· переменная — это характеристика, характерная для любого члена совокупности, отличающаяся качеством или количеством от другого члена,
· Переменная, отличающаяся количеством, называется количественной переменной. Например, вес человека, количество людей в машине
· Отличающаяся по качеству переменная называется качественной переменной или атрибутом, например, цветом степень повреждения автомобиля в ДТП.
· Дискретная переменная — это переменная, для которой нельзя принять значение между двумя заданными значениями. Например, количество детей в семье.
· Непрерывная переменная — это переменная, в которой можно принять любое значение между двумя заданными значениями, например, время, необходимое для бега на 100 метров.