Вчера я посетил спектакль в своем университете под названием Адаптивная радиация. Основная предпосылка заключалась в том, что у каждого есть вещь — состояние бытия, когда они испытывают экстаз, делая что-то. Высокий уровень энергии, высокий уровень жизни. В таком состоянии время становится нечетким.

Я думаю, это то, что случилось со мной вчера. Я забыл запланировать это письмо. Я думал, что он включен, но, видимо, нет. Время подвело меня. Так или иначе, вот сегодняшнее письмо с искренними извинениями за задержку.

Пять историй

1. Радость функционального программирования (для науки о данных)learning.acm.org

Хэдли Уикхэм, ACM

Хэдли Уикхем — известное лицо в мире R. В этом часовом выступлении он познакомит с основами функционального программирования в R с использованием пакета purrr. Он начинает с обсуждения всех известных циклов, а затем показывает, как и почему функциональное программирование предлагает элегантные альтернативы.

Вы можете просмотреть слайды здесь, хотя я бы порекомендовал вам посмотреть доклад, чтобы понять, как purrr может помочь вашим потребностям в науке о данных.

2. Визуализация для развития темы

huyen-nguyen.github.io
WordStream Maker

Все мы в какой-то момент использовали генераторы облаков слов, чтобы показать «важные» слова. Этот инструмент позволяет создать временную версию облака слов под названием Word Stream. Это действительно просто: загрузите файл документа как минимум с двумя столбцами: время и текст, он генерирует красивый поток — просто так. Существуют такие варианты, как маркировка частями речи для цветов и распознавание названных объектов для людей, мест или организаций.

3. Иллюстрации науки о данныхallisonhorst.com

Эллисон Хорст

Вероятно, самая симпатичная вещь в Интернете сейчас, Эллисон Хорст создает различные иллюстрации по концепциям, связанным с наукой о данных. Это мультфильмы, которые представляют сложные темы с использованием знакомых скетчей. Некоторые из моих любимых:

Проверь!

4. Когда американцы уходят на работу?flowingdata.com
FlowingData

Во сколько люди уезжают на работу в Соединенных Штатах? Как это зависит от штата? Натан Яу изучил данные о поездках на работу из опроса американского сообщества, чтобы сделать эту интерактивную карту.

Как и следовало ожидать, многие пассажиры уезжают из дома между 7:00 и 8:00. Тем не менее, ставки концентрируются вокруг этого часа в некоторых округах гораздо больше, чем в других. Это особенно актуально для округов на Среднем Западе. Около половины пассажиров во многих округах Среднего Запада уезжают в этот час.

Люди в густонаселенных округах, таких как южная Калифорния, уезжают еще раньше: в 6 утра. За исключением округа Аляски, который уезжает на работу (на рыбалку?) после 14:00, все остальные уезжают довольно рано.

5. Изображения, иконки и ggplots в таблицахalberts-newsletter.beehiiv.com

Альберт Рапп

Ранее я писал о посте Альберта о создании сексуальных таблиц в R. Этот пост дополняет эти знания, демонстрируя, как добавлять изображения, значки и даже графики в таблицы.

  • Вы можете получить иконки из пакета fontawesome
  • Добавьте их в свои таблицы с помощью gt_img_rows()от gtExtras
  • gt_img_circle() будет "округлять" изображения
  • gt::ggplot_image() позволяет добавлять ggplots в виде изображений

Четыре пакета

Легко вставляйте значки в документы R Markdown и приложения Shiny с помощью пакета fontawesome. Прочтите виньетку, чтобы узнать больше.

Используете несколько фреймов данных в R и путаетесь, как они все связаны друг с другом? dm здесь, чтобы помочь. Смотрите виньетку, чтобы узнать больше.

Существует как минимум десять пакетов для создания таблиц с помощью R. Некоторые из крутых — это gt и gtExtras, kable и kableExtras, DT (мой любимый), huxtable, flextable. », и многое другое. Нажмите на имена для их виньетки.

Три жаргона

Git — это система контроля версий, которая позволяет отслеживать изменения в любом наборе файлов. Они полезны для координации между программистами, работающими над одной кодовой базой. "Узнать больше".

Контрольная диаграмма используется для изучения изменений процесса во времени. Он имеет центральную линию для среднего значения, верхнюю линию для верхнего контрольного предела и нижнюю линию для нижнего контрольного предела. Эти линии определяются из исторических данных. "Узнать больше".

Некоторые вероятности малы, но значительны, например смерть в автокатастрофе. Для таких редких случаев мы используем специальную метрику. Микроморт (MM) – это вероятность смерти один на миллион. "Узнать больше".

Два твита

Один мем

Это обертка!

Надеюсь, вам понравилось сегодняшнее письмо. Если вам нравится информационный бюллетень и вы хотели бы его поддержать, вы можете купить мне кофе здесь. Увидимся на следующей неделе!

Жесткий