Публикации по теме 'statistical-learning'


100 дней кода машинного обучения
Привет всем, Недавно Сирадж Равал бросил вызов кодированию не менее часа в течение 100 дней через YouTube . Я официально объявляю, что принял его вызов и буду программировать не менее часа в день. Моя цель – Изучите концепции и алгоритмы. Изучите программирование на питоне. Реализовать концепции и алгоритмы. Создайте основу статистики, программирования и немного математики. Определите вариант использования, поработайте с наборами данных и предоставьте решение. Я буду..

Линейный дискриминантный анализ с различными представлениями
В целом существует два подхода к проблеме классификации: Дискриминативный подход : оценить параметры класса решений, т. е. оценить P(Y | X) напрямую. Генеративный подход : смоделируйте распределение входных данных, характерное для класса, т. е. постройте модель P(X | Y) или P(X, Y). Связь между дискриминационным и генеративным подходами: по правилу Байя. Генеративные подходы делают некоторые допущения о структуре вашей модели, но Дискриминационные подходы делают меньше..

Статистика: основа для начинающих специалистов по данным
В своей предыдущей статье я подчеркивал важность глубокого понимания статистики как важного навыка для начинающих специалистов по данным. Хотя список навыков в той статье не был представлен в определенном пошаговом порядке, статистические знания по праву были поставлены на первое место. В ответ на запросы читателей о дополнительных пояснениях эта статья призвана объяснить, почему статистику следует считать отправной точкой для начинающих специалистов по данным. Являясь основой науки..

Методы повторной выборки — Серия ISLR: Глава 5
Процесс обучения модели заключается в разделении данных на два набора: обучающий набор и тестовый набор. Когда мы запускаем нашу модель на поезде и тестовом наборе, мы получаем (барабанная дробь!!!!) ошибку поезда и тестовую ошибку соответственно. наша модель работает. Если мы обучим все данные и протестируем их на одних и тех же данных, то, конечно, модель будет работать хорошо, потому что модель видела данные раньше. Ценность модели определяется тем, насколько она точна на невидимых..

Обучение машинному обучению
Я изучал математику в университете и заинтересовался искусственным интеллектом и машинным обучением. Существует множество инструментов, но не знать, с чего начать, может показаться ошеломляющим. Поэтому я составил план просмотреть эти материалы в том порядке, который, по моему мнению, был бы разумным: Kaggle Машинное обучение учебники . Я планирую пройти Intro to ML и Intermediate ML, так как у меня уже есть некоторый опыт работы с Python и pandas. Далее я попытаюсь решить пару..

Горячие темы исследований в статистической теории обучения
Несомненно, все современные темы в статистике интересны и дают ценный опыт исследователям как в академической сфере, так и в отраслевых сферах. Тем не менее, темы, связанные с биостатистикой, сейсмологией (в физике) и многомерным анализом (в основном в исследованиях в области социальных наук и финансов), становятся слишком важными. Теперь мы говорим об использовании математических методов для изучения сложных биологических сетей, статистических свойствах распространения упругих волн (как..

Вот : матрица путаницы
Больше не «запутанная» матрица Матрица путаницы является одним из основных показателей для оценки надежности модели классификации. Широко используемый в задачах бинарной классификации, он также может быть легко расширен до настройки нескольких классов. Давайте рассмотрим всю важную терминологию и формулы, необходимые для работы с матрицей путаницы. Матрица путаницы Рассмотрим следующий пример: вы используете классификационную модель, чтобы выяснить, являются ли 10 яблок, которые вы..