Это пятое введение в R. Оно будет охватывать применение, математические функции, Dplyr и его возможности.

*Первоначально опубликовано в моем подстеке. Это лишь часть статьи.

PS: пожалуйста, прочтите «Введение в R для науки о данных (часть четвертая)», прежде чем читать это. Это продолжение четвертой части.

Часть четвертая: Введение в R для науки о данных (Часть четвертая)

Применять

Использование образца оператора будет случайным образом рандомизировать число. Это даст нам другой номер каждый раз, когда вы хотите запустить код.

lapply() принимает входную функцию и вектор (может быть списком) и применяет эту функцию к каждому элементу вектора. Короче говоря, это говорит о том, что нужно перейти к каждому числу и добавить к нему случайное число. Он будет хранить его в виде списка.

Но иногда нам не нужен список, поэтому мы можем использовать sapply(). Это даст нам вектор из пяти (поскольку у нас есть пять чисел) со случайными числами.

Математические функции

Основные математические функции в R:

  • абс()
  • сумма()
  • иметь в виду()
  • круглый()

abs() даст вам абсолютное значение.

sum() вернет сумму всех значений.

mean() даст вам среднее значение.

round() будет округлять десятичное число. В данном случае я хочу, чтобы оно округлялось до второй цифры, поэтому я ставлю запятую два после запятой. Вы можете настроить его и указать любое число, до которого хотите округлить.

Вот справочная карта, которую нужно иметь при программировании на R: https://cran.r-project.org/doc/contrib/Short-refcard.pdf

Обычные выражения

Мы собираемся сосредоточиться на:

  • grepl()
  • grep()

grepl() примет искомый термин. В этом случае я хочу искать «там». Второе, что возьмет grepl(), — это фактическая вещь, которую вы хотите найти, а именно текст в моем случае. Это возвращает TRUE, потому что «там» находится внутри текста. Если я вставлю что-то еще, чего нет в тексте, он вернет FALSE.

grep() вернет местоположение индекса. В этом случае я хочу знать, где находится «b», поэтому я использую grep(), и результаты показывают, что он находится во второй строке. Если было несколько «b», он покажет несколько мест, как я сделал это с «c».

Манипуляция данными

Полный текст статьи читайте здесь: https://ivanh.substack.com/p/introduction-to-r-for-machine-learning-bee