Публикации по теме 'rstudio'


Вы страдаете от диабета? Классификация пациента как больного диабетом или без использования R и логистической регрессии
База данных диабета индейцев пима Набор данных Диабет индейцев пима состоит из восьми медицинских предикторов (независимых) переменных и одной выходной (зависимой) переменной — переменной Исход (которая является бинарной по своей природе). Восемь независимых переменных включают уровень ИМТ пациента, уровень инсулина, уровень концентрации глюкозы, возраст и многое другое. Цель набора данных из 1700 строк — предсказать, есть ли у пациента диабет или нет, и он является надежным по..

Классификаторы случайного леса в R
используя Random Forest, Parsnip и рецепты Классификация случайного леса — это ансамблевый метод обучения, используемый для задач классификации. Он работает путем построения нескольких деревьев решений на этапе обучения, а затем объединяет их прогнозы для окончательной классификации. При использовании случайных лесов алгоритм имеет тенденцию лучше обобщать несколько деревьев, что снижает тенденцию к переоснащению. Случайный лес использует самозагрузочную выборку , тем самым..

Введение в программирование на R
Для кого-то вроде меня, имеющего лишь некоторый опыт программирования на Python, синтаксис R поначалу кажется отталкивающим. Однако я считаю, что адаптация к уникальной логике нового языка - лишь вопрос времени. И действительно, после некоторой практики грамматика языка R мне кажется более естественной, и я начал понимать ее удивительную красоту, которая на протяжении многих лет пленила сердца бесчисленных статистиков. Если вы не знаете, что такое R, это, по сути, язык программирования,..

Полезные фрагменты кода для R, которые должен знать каждый специалист по данным
Полный набор инструментов для тех небольших задач, которые мы постоянно забываем, как программировать. Я работаю Data Scientist и постоянно нахожусь в контакте — работая или учась — с новейшими технологиями в этой области. Однако позвольте мне сказать вам кое-что: мне все еще нравится старая добрая ручка и бумага, чтобы делать заметки и учиться.

Классификаторы нейронных сетей в R
по сравнению с деревьями решений и классификаторами ближайших соседей Классификаторы нейронных сетей — это тип алгоритма машинного обучения, который использует искусственные нейронные сети для классификации входных данных по различным категориям. Эти классификаторы обычно состоят из нескольких слоев взаимосвязанных нейронов, которые обрабатывают входные данные и производят выходную классификацию. Нейронные сети для классификации работают так же, как нейронные сети для..

Использование Kraken API с R
Большая часть документации, которую я нашел, написана на Python, поэтому я решил, что пришло время сделать небольшую запись в блоге, чтобы вы начали подключать R к Kraken. Вот ссылка на документацию Kraken для ознакомления: https://docs.kraken.com Общедоступные конечные точки Здесь вы можете найти, какие запросы Kraken предлагает публично: https://docs.kraken.com/rest/#tag/Market-Data Доступ к общедоступным конечным точкам очень прост. В ответ вы получите список с объектом..

Перекрестная проверка в R
Учитывая все наблюдения в наборе данных, возникает важный вопрос, какие наблюдения будут использоваться для обучения модели машинного обучения. Одним из вариантов было бы случайное разделение набора данных с определенной пропорцией. Однако случайное разделение набора данных не всегда может дать хорошие результаты. Например, случайное разделение может не полностью отражать характеристики и распределение набора данных. В частности, если набор данных содержит несбалансированные или редкие..