Публикации по теме 'data-manipulation'


Манипуляция данными с использованием DPLYR: Часть 1
В этом блоге вы узнаете, как легко выполнять манипуляции с данными с помощью программного обеспечения R . В основном мы будем использовать популярный пакет dplyr R, который содержит важные функции R, которые упрощают работу с вашими данными. Пакет dplyr (написанный Хэдли Викхэмом) предоставляет нам несколько функций, которые облегчают манипулирование фреймами данных в R. Некоторые из наиболее полезных включают: Функция выбора: облегчает выбор записей (строк) 2. Функция фильтра:..

Памятка NumPy: функции для численного анализа
Эффективная обработка данных с помощью Numpy: 50 обязательных функций для науки о данных и машинного обучения Python Введение Сделайте что-нибудь экстраординарное для себя сегодня и изучите манипулирование данными в Python с помощью NumPy! Без сомнения, NumPy — это фундаментальная библиотека для науки о данных и машинного обучения в Python, предлагающая мощную работу с массивами и математические операции. Если вы только начинаете работать с NumPy или уже являетесь опытным..

5 самых важных навыков Python, которыми должен овладеть специалист по данным
Python — один из самых важных инструментов для специалистов по данным, поскольку он предоставляет широкий спектр библиотек и фреймворков, которые можно использовать для анализа данных, обработки, моделирования и многого другого. Поэтому очень важно освоить различные инструменты и фреймворки Python. Однако их огромное количество, что может сбить с толку, если вы только начинаете свою карьеру. В этой статье я расскажу о 5 лучших навыках Python, которыми должен овладеть каждый специалист по..

Манипуляции с данными в JavaScript
JavaScript — это мощный язык программирования, который широко используется как для интерфейсной, так и для внутренней разработки. Одной из ключевых особенностей JavaScript является его способность манипулировать данными различными способами. В этом сообщении блога мы рассмотрим некоторые из наиболее распространенных методов манипулирования данными в JavaScript с примерами, которые помогут проиллюстрировать, как работает каждый метод. 1. Манипуляции с массивами Массивы JavaScript —..

Прототипы массивов против двойных наборов данных
В течение последних пяти недель я изо всех сил пытался найти лучшие способы обработки данных с помощью прототипов массивов. Каков наилучший метод прототипа? Почему он лучший? Когда я должен использовать его? Это был циклический мыслительный процесс, и как только я думаю, что он у меня есть, он ускользает от меня. Затем мне бросили двойные и тройные наборы данных, чтобы попытаться манипулировать ими. Зная, что это немного меньше, чем то, что я увижу в реальном мире, я хотел приложить все..

Вопросы по теме 'data-manipulation'

Реструктуризация данных в R
Я только начинаю выходить за рамки основ R и дошел до того момента, когда мне нужна помощь. Я хочу реструктурировать некоторые данные. Вот как может выглядеть образец фрейма данных: ID Sex Res Contact 1 M MA ABR 1 M MA CON 1 M MA...
2669 просмотров
schedule 12.04.2023

R: создать фрейм данных из скользящего окна
Допустим, у меня есть фрейм данных со следующей структурой: DF <- data.frame(x = 0:4, y = 5:9) > DF x y 1 0 5 2 1 6 3 2 7 4 3 8 5 4 9 как наиболее эффективно превратить DF во фрейм данных со следующей структурой: w x y 1 0 5 1 1...
1749 просмотров

Удаление строк в наборе данных происходит неправильно
У меня есть следующий набор данных: text <- c(1:13) numbers <- c(1,1,1,1,1,1,1,1,1,1,1,1,1) test <- data.frame( text =text, is.numeric.feature = numbers) text is.numeric.feature 1 1 1 2 2...
782 просмотров
schedule 13.07.2023

Разбить квадратную матрицу на пары
У меня есть большая квадратная матрица 12128 x 12128 . Пример A B C D E A 0.5 0.4 0.1 0.02 0.4 B 0.1 0.3 0.07 0.03 0.9 C 0.8 0.04 0.5 0.4 0.4 D 3.4 5.6 9.5 2 2.1 E 0.6 9.1 0.3 0.5 1.2...
1049 просмотров
schedule 30.03.2023

изменять форму, агрегировать/объединять строки
Я агрегирую набор данных в формате страна-год с melted <- melt(data, id = c("ccode.a","year")) data.fix <- function(x) c(max = max(x), sum = sum(x), min = min(x), newcol = paste(x, sep = ",")) casted <-...
2376 просмотров
schedule 01.03.2023

Автоматически создавать столбцы в листе Excel
Задача недели по манипулированию данными: У меня есть лист Excel, выглядящий так: ProductGroup ProductName ------------ ----------- Mountain Bikes MTB Thunder Mountain Bikes MTB Lightning Road Bikes Road Killer Road Bikes Road...
278 просмотров
schedule 20.09.2023

Подмножество набора данных в SAS путем ссылки на внешний текстовый файл
Я работаю с набором данных FDA, который содержит данные о реакциях на фармацевтические препараты. Я пытаюсь разделить данные по названиям наркотиков. У меня есть внешний текстовый файл с названиями интересующих меня препаратов. Я хочу создать...
171 просмотров
schedule 13.04.2023

perl, удаление элементов из массива в цикле for
всегда ли следующий код будет работать в Perl? for loop iterating over @array { # do something if ($condition) { remove current element from @array } } Поскольку я знаю, что в Java это приводит к некоторым исключениям, приведенный...
5848 просмотров
schedule 13.12.2023

Транспонировать данные по группам в R
У меня есть данные в следующей структуре: x <- read.table(header=T, text=" X Y D S a e 1 10 a e 2 20 a f 1 50 b c 1 40 b c 2 30 b c 3 60 b d 1 10 b d 2 20") И я хочу получить следующий результат: X Y 1 2 3 a e 10 20 a f 50 b...
15062 просмотров
schedule 10.04.2023

Замените элементы вектора, которые меньше, чем предыдущие (с NA)
У меня есть вектор вроде a <- c(4,2,7,6,8,9,3,1,12,13) Я хотел бы заменить все элементы, которые меньше предыдущих, на NA, результат для моего примера должен быть: [1] 4 NA 7 NA 8 9 NA NA 12 13 Я думал об использовании...
134 просмотров
schedule 06.03.2023

SAS: переупорядочивание МНОЖЕСТВА переменных
У меня есть набор данных с более чем 250 переменными. Я создал несколько новых переменных, которые необходимо разместить в определенных местах (например, как 37-ю переменную, 113-ю переменную и т. д.), однако они добавляются в самый конец списка....
1008 просмотров
schedule 28.06.2023

Подмножество матрицы по row.names
У меня есть матрица со следующими именами строк: "X1" "X5" "X33" "X37" "X52" "X566" Теперь я хочу выбрать только те строки, которые соответствуют записям списка, скажем: include_list <- c("X1", "X5", "X33") Я думаю, я бы...
46880 просмотров
schedule 23.06.2022

Компонент Ab initio для остановки графика при обнаружении повторяющихся строк/записей.
Привет, у меня есть график Ab initio, который после некоторых манипуляций с данными загружает их в таблицу. Я ищу какой-то компонент проверки, чтобы завершить процесс (перед загрузкой данных в таблицу), если он нашел повторяющиеся строки....
3559 просмотров
schedule 25.01.2023

Как сдвинуть каждую строку матрицы в R
У меня есть матрица такого вида: a b c d e 0 f 0 0 и я хочу преобразовать его во что-то вроде этого: a b c 0 d e 0 0 f Схема переключения такая: shift by 0 for row 1 shift by 1 for row 2 shift by 2 for row 3 ... shift by n-1 for...
1256 просмотров
schedule 26.06.2022

выберите несколько строк с уникальными парами и экспортируйте случайный выбор для всех возможных пар
Я работаю с очень большим набором данных и столкнулся с уникальной проблемой, с которой раньше не сталкивался. Это данные радара в сочетании с точками GPS. посредством радиолокационной обработки я выполнил интерполяцию между точками данных, чтобы...
358 просмотров

Разделить полное имя в формате: {фамилия, первая середина} полные случаи
Мой клиент отправил мне данные имени в виде строки имени, которая включает фамилию, имя и отчество в одной записи. Мне нужно, чтобы они были разделены на LastName, FirstName и MiddleName. Я нашел несколько сценариев в Интернете, но они не подходят...
13301 просмотров

Как использовать применить семью к
Это может быть вопрос о применении / вопрос об управлении данными / их комбинация. Я относительно новичок в R и активно приспосабливаюсь к тому, как управлять данными в R и Stata (в качестве примера). Я много читал, но не нашел хорошего примера...
101 просмотров
schedule 29.03.2023

Вычисление разницы между двумя значениями в одном столбце по идентификатору на основе значения другого столбца в R
У меня есть набор данных, который выглядит так: threadid unixtime sent ID 123 1000 0 1 123 1050 1 1 123 1070 0 1 123 2000 1 1 123...
243 просмотров
schedule 21.05.2023

Замена шаблонов в строке
У меня есть несколько строк в этом формате. Разделитель — тире ( - ), а каждая «вещь» между ними — маркер. string <-...
80 просмотров
schedule 13.07.2023

Как грамотно преобразовать таблицу, подобную ковариации, в пары «один к одному» в stata?
Я столкнулся с практической проблемой управления данными с помощью Stata. Что я планирую сделать, так это создать переменную сферических расстояний между 30 столицами провинций (таким образом, есть примерно 870 одинаковых значений) Китая. Были...
69 просмотров
schedule 26.03.2023