Публикации по теме 'r-programming'
Создавайте поддельные, но значимые данные с помощью {fakir}
Одна из проблем, с которой сталкиваются новички в области науки о данных или машинного обучения, - это поиск правильного набора данных для правильного набора задач, которые вы хотите преподавать / изучать / экспериментировать. Допустим, вы хотите преподавать временные ряды, и это тот случай, когда ваш набор данных классификации спама / хамов бесполезен. И вам нужно обратиться к сообществам, которые предлагают наборы данных, такие как хорошо известное репозиторий UCI ML или наборы данных..
R против Python - что лучше?
R против Python - что лучше?
Если вы читаете эту статью, я полагаю, что вы, как и многие другие специалисты по данным, задаетесь вопросом, какой язык программирования начать изучать.
Независимо от того, есть ли у вас опыт работы с другими инструментами кодирования или нет, отдельные функции этих двух конкретных программ, включая обширные массивы библиотек и пакетов, могут поначалу показаться устрашающими, но не волнуйтесь, эта статья поможет вам решить, какая из них правильные..
Использование машин повышения градиента для классификации в R
Методы классификации в машинном обучении
Задний план
Цель анализа:
Понимать факторы, определяющие успехи студентов, чтобы Открытый университет мог выделять ресурсы для повышения успеваемости студентов.
Описание набора данных:
Набор данных Open University Learning Analytics — это общедоступный набор данных, содержащий данные о курсах, студентах и их взаимодействии с VLE для семи выбранных курсов (модулей).
Поскольку уникальными идентификаторами во всех таблицах данных были..
Введение в R (часть 2)
Основные типы данных в R
R работает с многочисленными типами данных. Некоторые из самых основных типов для начала:
Десятичные значения, такие как 4,5, называются числовыми . Натуральные числа, такие как 4, называются целыми . Целые числа также являются числовыми. Логические значения (ИСТИНА или ЛОЖЬ) называются логическими . Текстовые (или строковые) значения называются символами .
Константы в R
Константы, как следует из названия, представляют собой объекты, значение..
Простая линейная регрессия с R
Самый простой и простой способ прогнозирования количественных значений, объясненный и реализованный в R
Регрессия - это метод определения статистической взаимосвязи между двумя или более переменными, когда увеличение одной переменной вызывает увеличение другой переменной или наоборот. А линейная регрессия помогает определить линейную зависимость, которая представляет собой прямую или почти прямую линию между двумя переменными. Сегодня мы говорим о простой линейной регрессии. Это..
Обучение с учителем - линейная регрессия (с использованием R)
Постановка проблемы: - Создайте правильный набор двумерных данных из N точек. Разделите набор данных на набор данных для обучения и набор данных для тестирования. i) Выполните линейный регрессионный анализ методом наименьших квадратов. ii) Постройте графики для обучения MSE и тестирования MSE и прокомментируйте ошибку аппроксимации кривой и обобщения. iii) Проверить влияние размера набора данных и компромисса смещения-дисперсии. iv) Примените перекрестную проверку и постройте графики..
Реализация двоичной логистической регрессии в R
Логистическая регрессия пытается решить класс проблем, которые кажутся более простыми, чем линейная регрессия. В последнем случае мы хотим найти линию (или плоскость, или гиперплоскость), которая наилучшим образом предсказывает среднее числовое значение для некоторых данных на основе наших наблюдений. В логистической регрессии мы просто пытаемся предсказать, в какую категорию попадает наблюдение, на основе зависимых переменных. Мужчина или женщина? Больной или нет?
В этом сообщении..