Публикации по теме 'r-programming'


Краткое руководство по работе со строками и регулярными выражениями в R
Приручите свои струны без усилий Найти данные в наше время несложно. Найти качественные данные сложнее, чем когда-либо. Одной из хронических черт некачественных данных является то, что они беспорядочны и хранятся неточно. Независимо от того, как сильно мы, специалисты по данным, любим говорить об алгоритмах и проверке моделей, большую часть нашего времени занимает очистка и приведение в порядок данных. В этом смысле работа со строками требует несколько иного набора навыков, чем,..

The Iron Yard, Хьюстон, неделя пятая
Какая действительно замечательная неделя! Это была наша первая неделя Back-End-разработки, и, как и наша первая неделя Front-End-разработки, она началась с замешательства, но закончилась неделей с гораздо лучшим пониманием всего этого, лол. Мы работаем с Node.js и Express, чтобы использовать Javascript в качестве серверного языка. Он очень простой, но имеет возможность загружать в него пакеты, добавляя функциональность по мере необходимости. Чрезвычайно гибкий! Я закончил работу над..

Получение и очистка данных (JHU Coursera, курс 3)
Третий курс по специализации Data Science Получение и очистка данных является важным курсом. Как всегда, код тестов и заданий находится на моем гитхабе . Обзор недели 1. Чтение файлов Excel, XML и JSON имеет важное значение. Я доволен лекцией о пакете data.table , так как использую его для всех своих викторин и заданий по этой специализации. Хотелось бы, чтобы они прочитали об этом больше одной лекции, потому что это не так просто выучить. Обзор недели 2 . То же самое...

Введение:
Введение: Это был самый первый проект Kaggle, который я сделал без учебника после того, как начал свой путь в области науки о данных. Соревнование на мировом уровне само по себе является большим опытом. Я участвовал в этом конкурсе в команде из 4 человек, работающих в разных областях. Это соревнование в спортивной сфере. В этом блоге я объясню наш подход к этой конкретной проблеме Ссылка: www.kaggle.com/c/kobe-bryant-shot-selection Постановка проблемы: Коби Брайант —..

Как интерпретировать Concordance в логистической регрессии?
Эта статья изначально была опубликована на Quora в 2015 году. Чтобы понять соответствие, мы должны сначала понять концепцию порогового значения. ОТКЛЮЧАЯ ЗНАЧЕНИЕ: например, учащиеся классифицируются как сдавшие (1) или не сдавшие экзамен (0) в зависимости от отсечения проходных баллов на экзамене. Отрезки варьируются в зависимости от требований различных экзаменов. Будем считать, что проходные баллы отсечки равны 60 из 100; следовательно, все учащиеся, получившие оценки выше..

Проведение нескольких экспериментов по машинному обучению в prython 1.70
Занимаясь наукой о данных, мы обычно хотим тестировать несколько вещей одновременно: разные модели на одном и том же наборе данных, или разные модели, использующие разные функции, или различный субанализ, фокусирующийся на конкретных вещах. Независимо от того, используем ли мы Python или R, большинство IDE на самом деле не предназначены для этого, поскольку они предназначены для запуска линейного сценария от начала до конца. В некоторой степени блокноты Jupyter могут смягчить эту..

Моделирование двоичной логистической регрессии с использованием R (моделирование и интерпретация, ориентированные на исследования)
Эта статья даст вам практический обзор настройки модели бинарной логистической регрессии с использованием языка программирования R. Вступление В мире машинного обучения с учителем часто выполняются алгоритмические задачи двух типов. Один называется регрессией (прогнозирование непрерывных значений), а другой - классификацией (прогнозирование дискретных значений). В этом блоге я представил пример алгоритма двоичной классификации под названием Двоичная логистическая регрессия ,..