Сравните две переменные (числовые или оба множителя) в таблицах expss

Я копаю все глубже и глубже в пакете expss и сталкиваюсь с одним из примеров, упомянутых здесь -> https://gdemin.github.io/expss/#example_of_data_processing_with_multiple-response_variables (в частности, последняя таблица раздела.

Рассмотрим следующие фреймы данных:

vecA <- factor(c(rep(1,10),rep(2,10),rep(3,10),rep(4,10),rep(5,10)),levels=c(1,2,3,4,5))
vecB <- factor(c(rep(1,20),rep(2,20),rep(NA,10)),levels=c(1,2,3,4,5))
df_fact <- data.frame(vecA, vecB)

vecA_num <- as.numeric(c(rep(1,10),rep(2,10),rep(3,10),rep(4,10),rep(5,10)))
vecB_num <- as.numeric(c(rep(1,20),rep(2,20),rep(NA,10)))
df_num <- data.frame(vecA, vecB)

Строго копируя предложенный код (URL-адрес выше), вот как выглядит моя таблица:

df_fact %>%
  tab_cols(total(label = "#Total| |")) %>% 
  tab_cells(list(vecA)) %>%
  tab_stat_cpct(label="vecA", total_row_position="above", total_statistic="u_cases") %>%
  tab_cells(list(vecB)) %>% 
  tab_stat_cpct(label="vecB", total_row_position="above", total_statistic="u_cases") %>%
  tab_pivot(stat_position = "inside_columns") %>%  
  recode(as.criterion(is.numeric) & is.na ~ 0, TRUE ~ copy)

Немного другая процедура с числовым примером:

df_num %>%
  tab_cols(total(label = "#Total| |")) %>% 
  tab_cells(vecA_num, vecB_num) %>%
  tab_stat_valid_n(label = "Valid N") %>%
  tab_stat_mean(label="Mean") %>%
  tab_pivot(stat_position = "inside_columns") %>%  
  recode(as.criterion(is.numeric) & is.na ~ 0, TRUE ~ copy) %>%
  tab_transpose()

Проблемы начинаются здесь, поскольку эти сложные конструкции ... сложны!

1) Я хотел бы включить семейство функций tab_last_sig *, но не могу понять, как это сделать (и, возможно, промежуточные итоги / сети, когда переменные являются факторами)

2) Включение нескольких статистических данных (случаи, проценты, средние значения ...) в целом является проблемой.

3) Наконец, мне непонятно, где я должен писать имена статистики / имена переменных.

Подробной документации на эти конструкции я не нашел, поэтому это сообщение в бутылке :)


person Maxence Dum.    schedule 04.04.2020    source источник


Ответы (1)


  1. К сожалению, тестирование значимости пока поддерживается только для независимых выборок. В ваших примерах вы хотите сравнить статистику по зависимым образцам. Вы можете выполнить расчет значимости для независимых пропорций, но результаты будут неточными.
  2. Включить множественную статистику несложно - нужно просто последовательно писать tab_stat_. Но сложная компоновка стола действительно проблема :(
  3. Имена переменных для статистики всегда должны быть записаны в tab_cells. После этого вы можете писать статистические функции с tab_stat_mean, tab_stat_cpct и т. Д. Вы можете найти документацию, напечатав ?tab_pivot в консоли R. Это стандартный способ получить руководство по функциям R.
person Gregory Demin    schedule 05.04.2020
comment
Спасибо за ответ, по крайней мере, я знаю, что иду не в том направлении по первому пункту. Я попробую кое-что позже и обновлю свое первое сообщение, если найду что-нибудь подходящее. - person Maxence Dum.; 06.04.2020