Публикации по теме 'data-manipulation'
Манипуляция данными с использованием DPLYR: Часть 1
В этом блоге вы узнаете, как легко выполнять манипуляции с данными с помощью программного обеспечения R . В основном мы будем использовать популярный пакет dplyr R, который содержит важные функции R, которые упрощают работу с вашими данными. Пакет dplyr (написанный Хэдли Викхэмом) предоставляет нам несколько функций, которые облегчают манипулирование фреймами данных в R. Некоторые из наиболее полезных включают:
Функция выбора: облегчает выбор записей (строк)
2. Функция фильтра:..
Памятка NumPy: функции для численного анализа
Эффективная обработка данных с помощью Numpy: 50 обязательных функций для науки о данных и машинного обучения Python
Введение
Сделайте что-нибудь экстраординарное для себя сегодня и изучите манипулирование данными в Python с помощью NumPy!
Без сомнения, NumPy — это фундаментальная библиотека для науки о данных и машинного обучения в Python, предлагающая мощную работу с массивами и математические операции.
Если вы только начинаете работать с NumPy или уже являетесь опытным..
5 самых важных навыков Python, которыми должен овладеть специалист по данным
Python — один из самых важных инструментов для специалистов по данным, поскольку он предоставляет широкий спектр библиотек и фреймворков, которые можно использовать для анализа данных, обработки, моделирования и многого другого. Поэтому очень важно освоить различные инструменты и фреймворки Python. Однако их огромное количество, что может сбить с толку, если вы только начинаете свою карьеру.
В этой статье я расскажу о 5 лучших навыках Python, которыми должен овладеть каждый специалист по..
Манипуляции с данными в JavaScript
JavaScript — это мощный язык программирования, который широко используется как для интерфейсной, так и для внутренней разработки. Одной из ключевых особенностей JavaScript является его способность манипулировать данными различными способами. В этом сообщении блога мы рассмотрим некоторые из наиболее распространенных методов манипулирования данными в JavaScript с примерами, которые помогут проиллюстрировать, как работает каждый метод.
1. Манипуляции с массивами
Массивы JavaScript —..
Прототипы массивов против двойных наборов данных
В течение последних пяти недель я изо всех сил пытался найти лучшие способы обработки данных с помощью прототипов массивов. Каков наилучший метод прототипа? Почему он лучший? Когда я должен использовать его? Это был циклический мыслительный процесс, и как только я думаю, что он у меня есть, он ускользает от меня. Затем мне бросили двойные и тройные наборы данных, чтобы попытаться манипулировать ими. Зная, что это немного меньше, чем то, что я увижу в реальном мире, я хотел приложить все..
Вопросы по теме 'data-manipulation'
Реструктуризация данных в R
Я только начинаю выходить за рамки основ R и дошел до того момента, когда мне нужна помощь. Я хочу реструктурировать некоторые данные. Вот как может выглядеть образец фрейма данных:
ID Sex Res Contact
1 M MA ABR
1 M MA CON
1 M MA...
2669 просмотров
schedule
12.04.2023
R: создать фрейм данных из скользящего окна
Допустим, у меня есть фрейм данных со следующей структурой:
DF <- data.frame(x = 0:4, y = 5:9)
> DF
x y
1 0 5
2 1 6
3 2 7
4 3 8
5 4 9
как наиболее эффективно превратить DF во фрейм данных со следующей структурой:
w x y
1 0 5
1 1...
1749 просмотров
schedule
02.07.2023
Удаление строк в наборе данных происходит неправильно
У меня есть следующий набор данных:
text <- c(1:13)
numbers <- c(1,1,1,1,1,1,1,1,1,1,1,1,1)
test <- data.frame(
text =text,
is.numeric.feature = numbers)
text is.numeric.feature
1 1 1
2 2...
782 просмотров
schedule
13.07.2023
Разбить квадратную матрицу на пары
У меня есть большая квадратная матрица 12128 x 12128 . Пример
A B C D E
A 0.5 0.4 0.1 0.02 0.4
B 0.1 0.3 0.07 0.03 0.9
C 0.8 0.04 0.5 0.4 0.4
D 3.4 5.6 9.5 2 2.1
E 0.6 9.1 0.3 0.5 1.2...
1049 просмотров
schedule
30.03.2023
изменять форму, агрегировать/объединять строки
Я агрегирую набор данных в формате страна-год с
melted <- melt(data, id = c("ccode.a","year"))
data.fix <- function(x) c(max = max(x), sum = sum(x), min = min(x),
newcol = paste(x, sep = ","))
casted <-...
2376 просмотров
schedule
01.03.2023
Автоматически создавать столбцы в листе Excel
Задача недели по манипулированию данными:
У меня есть лист Excel, выглядящий так:
ProductGroup ProductName
------------ -----------
Mountain Bikes MTB Thunder
Mountain Bikes MTB Lightning
Road Bikes Road Killer
Road Bikes Road...
278 просмотров
schedule
20.09.2023
Подмножество набора данных в SAS путем ссылки на внешний текстовый файл
Я работаю с набором данных FDA, который содержит данные о реакциях на фармацевтические препараты. Я пытаюсь разделить данные по названиям наркотиков. У меня есть внешний текстовый файл с названиями интересующих меня препаратов. Я хочу создать...
171 просмотров
schedule
13.04.2023
perl, удаление элементов из массива в цикле for
всегда ли следующий код будет работать в Perl?
for loop iterating over @array {
# do something
if ($condition) {
remove current element from @array
}
}
Поскольку я знаю, что в Java это приводит к некоторым исключениям, приведенный...
5848 просмотров
schedule
13.12.2023
Транспонировать данные по группам в R
У меня есть данные в следующей структуре:
x <- read.table(header=T, text="
X Y D S
a e 1 10
a e 2 20
a f 1 50
b c 1 40
b c 2 30
b c 3 60
b d 1 10
b d 2 20")
И я хочу получить следующий результат:
X Y 1 2 3
a e 10 20
a f 50
b...
15062 просмотров
schedule
10.04.2023
Замените элементы вектора, которые меньше, чем предыдущие (с NA)
У меня есть вектор вроде
a <- c(4,2,7,6,8,9,3,1,12,13)
Я хотел бы заменить все элементы, которые меньше предыдущих, на NA, результат для моего примера должен быть:
[1] 4 NA 7 NA 8 9 NA NA 12 13
Я думал об использовании...
134 просмотров
schedule
06.03.2023
SAS: переупорядочивание МНОЖЕСТВА переменных
У меня есть набор данных с более чем 250 переменными. Я создал несколько новых переменных, которые необходимо разместить в определенных местах (например, как 37-ю переменную, 113-ю переменную и т. д.), однако они добавляются в самый конец списка....
1008 просмотров
schedule
28.06.2023
Подмножество матрицы по row.names
У меня есть матрица со следующими именами строк:
"X1" "X5" "X33" "X37" "X52" "X566"
Теперь я хочу выбрать только те строки, которые соответствуют записям списка, скажем:
include_list <- c("X1", "X5", "X33")
Я думаю, я бы...
46880 просмотров
schedule
23.06.2022
Компонент Ab initio для остановки графика при обнаружении повторяющихся строк/записей.
Привет, у меня есть график Ab initio, который после некоторых манипуляций с данными загружает их в таблицу. Я ищу какой-то компонент проверки, чтобы завершить процесс (перед загрузкой данных в таблицу), если он нашел повторяющиеся строки....
3559 просмотров
schedule
25.01.2023
Как сдвинуть каждую строку матрицы в R
У меня есть матрица такого вида:
a b c
d e 0
f 0 0
и я хочу преобразовать его во что-то вроде этого:
a b c
0 d e
0 0 f
Схема переключения такая:
shift by 0 for row 1
shift by 1 for row 2
shift by 2 for row 3
...
shift by n-1 for...
1256 просмотров
schedule
26.06.2022
выберите несколько строк с уникальными парами и экспортируйте случайный выбор для всех возможных пар
Я работаю с очень большим набором данных и столкнулся с уникальной проблемой, с которой раньше не сталкивался. Это данные радара в сочетании с точками GPS. посредством радиолокационной обработки я выполнил интерполяцию между точками данных, чтобы...
358 просмотров
schedule
23.12.2022
Разделить полное имя в формате: {фамилия, первая середина} полные случаи
Мой клиент отправил мне данные имени в виде строки имени, которая включает фамилию, имя и отчество в одной записи. Мне нужно, чтобы они были разделены на LastName, FirstName и MiddleName. Я нашел несколько сценариев в Интернете, но они не подходят...
13301 просмотров
schedule
07.06.2023
Как использовать применить семью к
Это может быть вопрос о применении / вопрос об управлении данными / их комбинация. Я относительно новичок в R и активно приспосабливаюсь к тому, как управлять данными в R и Stata (в качестве примера). Я много читал, но не нашел хорошего примера...
101 просмотров
schedule
29.03.2023
Вычисление разницы между двумя значениями в одном столбце по идентификатору на основе значения другого столбца в R
У меня есть набор данных, который выглядит так:
threadid unixtime sent ID
123 1000 0 1
123 1050 1 1
123 1070 0 1
123 2000 1 1
123...
243 просмотров
schedule
21.05.2023
Замена шаблонов в строке
У меня есть несколько строк в этом формате. Разделитель — тире ( - ), а каждая «вещь» между ними — маркер.
string <-...
80 просмотров
schedule
13.07.2023
Как грамотно преобразовать таблицу, подобную ковариации, в пары «один к одному» в stata?
Я столкнулся с практической проблемой управления данными с помощью Stata. Что я планирую сделать, так это создать переменную сферических расстояний между 30 столицами провинций (таким образом, есть примерно 870 одинаковых значений) Китая. Были...
69 просмотров
schedule
26.03.2023