Публикации по теме 'r-programming'


Введение в R для науки о данных (часть пятая)
Это пятое введение в R. Оно будет охватывать применение, математические функции, Dplyr и его возможности. *Первоначально опубликовано в моем подстеке. Это лишь часть статьи. PS : пожалуйста, прочтите «Введение в R для науки о данных (часть четвертая)», прежде чем читать это. Это продолжение четвертой части. Часть четвертая: Введение в R для науки о данных (Часть четвертая) Применять Использование образца оператора будет случайным образом рандомизировать число. Это даст..

Что такое машина опорных векторов? (SVM). (С кодом R)
Машина опорных векторов - отличный инструмент как для классификации, так и для решения задач регрессии, поскольку он позволяет эффективно работать с выбросами и является отличным инструментом для компромисса между смещением и дисперсией. Он использует функцию ядра с D = размерность для преобразования модели из низко (одномерных) в высокоразмерные (2-3) наблюдения или радиальное ядро ​​(аналогично KNN Принимает ближайшее наблюдение) для более продвинутых моделей. Классификаторы..

Cyclistic Bike Share: мои взгляды на проект Google Capstone
Cyclistic Bike Share — это завершающий проект для завершения курса Google Data Analyst Certificate. Он имитирует задачи младшего аналитика данных, работающего в маркетинговой команде Cyclistic, вымышленной компании по прокату велосипедов в Чикаго. Цели Основная цель этого анализа — продемонстрировать навыки, полученные в ходе курса, и применить их в практической ситуации. Cyclistic хочет понять, как случайные гонщики и ежегодные участники по-разному используют общие велосипеды, и на..

Причинное воздействие и Р: Анализ интервенций временного ряда
Анализ интервенций временных рядов в R Заявление об ограничении ответственности: эта статья написана на условиях «как есть» без каких-либо гарантий. Он был написан с целью предоставить обзор концепций науки о данных и не должен интерпретироваться как совет по инвестициям или какой-либо другой профессиональный совет. Вмешательства (или внешние факторы, не зависящие от временного ряда) часто могут влиять на указанный ряд. Например, маркетинговая кампания может повлиять на..

Как воспроизвести результаты раздела сравнительного сравнения предстоящей статьи…
Прелюдия Эта статья является дополнением к серии из трех статей (части I , II и III ), которые я ранее публиковал здесь, в своем блоге на Medium, и подробно объясняет, как можно воспроизвести раздел сравнительного анализа в предстоящем выпуске. статья о новом алгоритме выбора переменных. Не читайте эту статью, не прочитав ее предварительно, она не будет иметь никакого смысла, более того, не должна без предварительного ознакомления с ней. Я пишу это дополнение, потому что, несмотря..

Логистическая регрессия, объясненная с нуля (визуально, математически и программно)
Практическое ванильное моделирование, часть III Множество результатов появляется при небольшом поиске в Google «Логистическая регрессия». Иногда новичкам в науке о данных очень сложно обойти основную идею логистической регрессии. И почему бы им не запутаться !!? В каждом учебнике, статье или форуме есть свое повествование о логистической регрессии (не считая законных многословных учебников, потому что это убьет всю цель этих «быстрых источников» мастерства). Некоторые источники..

В чем разница между rpart и пакетом Random Forest?
rpart — это пакет в R, который используется для моделирования деревьев классификации и регрессии. С помощью пакета rpart мы рисуем дерево, где дерево разбито на разные ветки с помощью переменных. Теперь, чтобы предсказать результат, вы должны следить за сплитами и предсказывать наиболее частые результаты. Теперь здесь вы можете контролировать количество сплитов с помощью параметра «minbucket» в R. Random Forest — это пакет в R, который также используется для моделирования деревьев..