Вчера я посетил спектакль в своем университете под названием Адаптивная радиация. Основная предпосылка заключалась в том, что у каждого есть вещь — состояние бытия, когда они испытывают экстаз, делая что-то. Высокий уровень энергии, высокий уровень жизни. В таком состоянии время становится нечетким.
Я думаю, это то, что случилось со мной вчера. Я забыл запланировать это письмо. Я думал, что он включен, но, видимо, нет. Время подвело меня. Так или иначе, вот сегодняшнее письмо с искренними извинениями за задержку.
Пять историй
1. Радость функционального программирования (для науки о данных) — learning.acm.org
Хэдли Уикхэм, ACM
Хэдли Уикхем — известное лицо в мире R. В этом часовом выступлении он познакомит с основами функционального программирования в R с использованием пакета purrr
. Он начинает с обсуждения всех известных циклов, а затем показывает, как и почему функциональное программирование предлагает элегантные альтернативы.
Вы можете просмотреть слайды здесь, хотя я бы порекомендовал вам посмотреть доклад, чтобы понять, как purrr
может помочь вашим потребностям в науке о данных.
2. Визуализация для развития темы
huyen-nguyen.github.io
WordStream Maker
Все мы в какой-то момент использовали генераторы облаков слов, чтобы показать «важные» слова. Этот инструмент позволяет создать временную версию облака слов под названием Word Stream. Это действительно просто: загрузите файл документа как минимум с двумя столбцами: время и текст, он генерирует красивый поток — просто так. Существуют такие варианты, как маркировка частями речи для цветов и распознавание названных объектов для людей, мест или организаций.
3. Иллюстрации науки о данных — allisonhorst.com
Эллисон Хорст
Вероятно, самая симпатичная вещь в Интернете сейчас, Эллисон Хорст создает различные иллюстрации по концепциям, связанным с наукой о данных. Это мультфильмы, которые представляют сложные темы с использованием знакомых скетчей. Некоторые из моих любимых:
4. Когда американцы уходят на работу? — flowingdata.com
FlowingData
Во сколько люди уезжают на работу в Соединенных Штатах? Как это зависит от штата? Натан Яу изучил данные о поездках на работу из опроса американского сообщества, чтобы сделать эту интерактивную карту.
Как и следовало ожидать, многие пассажиры уезжают из дома между 7:00 и 8:00. Тем не менее, ставки концентрируются вокруг этого часа в некоторых округах гораздо больше, чем в других. Это особенно актуально для округов на Среднем Западе. Около половины пассажиров во многих округах Среднего Запада уезжают в этот час.
Люди в густонаселенных округах, таких как южная Калифорния, уезжают еще раньше: в 6 утра. За исключением округа Аляски, который уезжает на работу (на рыбалку?) после 14:00, все остальные уезжают довольно рано.
5. Изображения, иконки и ggplots в таблицах — alberts-newsletter.beehiiv.com
Альберт Рапп
Ранее я писал о посте Альберта о создании сексуальных таблиц в R. Этот пост дополняет эти знания, демонстрируя, как добавлять изображения, значки и даже графики в таблицы.
- Вы можете получить иконки из пакета
fontawesome
- Добавьте их в свои таблицы с помощью
gt_img_rows()
отgtExtras
gt_img_circle()
будет "округлять" изображенияgt::ggplot_image()
позволяет добавлять ggplots в виде изображений
Четыре пакета
Легко вставляйте значки в документы R Markdown и приложения Shiny с помощью пакета fontawesome
. Прочтите виньетку, чтобы узнать больше.
Используете несколько фреймов данных в R и путаетесь, как они все связаны друг с другом? dm
здесь, чтобы помочь. Смотрите виньетку, чтобы узнать больше.
Существует как минимум десять пакетов для создания таблиц с помощью R. Некоторые из крутых — это gt и gtExtras, kable и kableExtras, DT (мой любимый), huxtable, flextable. », и многое другое. Нажмите на имена для их виньетки.
Три жаргона
Git — это система контроля версий, которая позволяет отслеживать изменения в любом наборе файлов. Они полезны для координации между программистами, работающими над одной кодовой базой. "Узнать больше".
Контрольная диаграмма используется для изучения изменений процесса во времени. Он имеет центральную линию для среднего значения, верхнюю линию для верхнего контрольного предела и нижнюю линию для нижнего контрольного предела. Эти линии определяются из исторических данных. "Узнать больше".
Некоторые вероятности малы, но значительны, например смерть в автокатастрофе. Для таких редких случаев мы используем специальную метрику. Микроморт (MM) – это вероятность смерти один на миллион. "Узнать больше".
Два твита
Один мем
Это обертка!
Надеюсь, вам понравилось сегодняшнее письмо. Если вам нравится информационный бюллетень и вы хотели бы его поддержать, вы можете купить мне кофе здесь. Увидимся на следующей неделе!
Жесткий