Публикации по теме 'rstats'


Вклады в проекты с открытым исходным кодом в 2022 г.
краткое размышление о вкладе в открытый исходный код В этом году я прочитал книгу Дона Джонса Создай свою техническую карьеру , и одно из его предложений о том, чтобы стать частью технологического сообщества, запало мне в душу. Это было что-то вроде: Не будь паразитом. Найдите способ внести свой вклад . Изначально у меня было мнение, что я недостаточно знаю или недостаточно квалифицирован, чтобы внести свой вклад. Чтение этой главы помогло мне осознать, что мне нужно расширить..

R для анализа хоккея - Часть 4: Stringr и RegEx
Это четвертая часть серии, в которой я покажу вам несколько способов использования R для анализа хоккейных данных. Если вы не видели первое руководство (установка R / RStudio и основы R), второе руководство (основы функций, конвейер ( %>% ) и структура ggplot2) или третье руководство ( некоторые важные функции dplyr), я думаю, было бы неплохо их проверить. Вы можете щелкнуть здесь для Части 1, здесь для Части 2 и здесь для Части 3. Перво-наперво, давайте установим и /..

Tidyverse против Base-R: как выбрать лучший фреймворк для вас
Плюсы и минусы самых популярных подходов к программированию на R Программисты — увлеченные люди. Они будут участвовать в оживленных дебатах (читай, в жарких спорах) о своих любимых языках и фреймворках, защищая предпочтительные подходы от критиков. Среди R-программистов одним из самых больших источников споров является выбор между двумя фреймворками; Base-R и tidyverse. Base-R относится ко всем функциям, встроенным в язык программирования R. Tidyverse — это набор пакетов,..

Отражения от семинара по обработке данных West Big Data Innovation Hub Data Carpentry Workshop
Научиться быть лучшим учителем, чтобы поддержать нашу миссию по внедрению данных в работу. Одной из наших ключевых целей в команде по работе с данными мэрии является повышение грамотности данных и потенциала аналитики среди сотрудников города и за его пределами. Таким образом, на прошлой неделе я присоединился к разнообразной группе представителей научных кругов, некоммерческих организаций, правительства и промышленности, чтобы научиться быть эффективным инструктором по работе с данными..

Как делать сложные вещи (требовательные к вычислительным ресурсам) в #Rstats
Подсказка: использование параллелизации (и, возможно, на нескольких компьютерах) Что мы делаем, когда R начинает долго «делать дело»? Во-первых, это может быть ошибка техники. Например, group_by() остается на месте, когда она не требуется (или что-то подобное, когда R выполняет избыточную, ненужную и трудоемкую обработку без нашего ведома). Однако, если ваш код полностью оптимизирован. Проблема может быть связана с тем, что R (по умолчанию) использует только одно ядро ​​ЦП вашего..

Полезные фрагменты кода для R, которые должен знать каждый специалист по данным
Полный набор инструментов для тех небольших задач, которые мы постоянно забываем, как программировать. Я работаю Data Scientist и постоянно нахожусь в контакте — работая или учась — с новейшими технологиями в этой области. Однако позвольте мне сказать вам кое-что: мне все еще нравится старая добрая ручка и бумага, чтобы делать заметки и учиться.

Образование как движущая сила человеческого развития в Бразилии
Анализ данных переписи населения Бразилии Последняя перепись 2010 года обновила данные, измеряющие индекс человеческого развития муниципалитетов (MHDI) в Бразилии. Последующую перепись страна должна была провести в 2020 году, но в основном из-за пандемии сбор данных задержался на два года. Последствия пандемии и экономического кризиса вызывают обеспокоенность по поводу улучшения, отмеченного в переписях 2000 и 2010 годов. Пока невозможно проводить сравнения с нынешним состоянием..