Итак, я начал выполнять некоторую статистику по фрейму данных, который я прочитал, используя функцию read_xls из пакета readxl (версия: 1.1.0), когда я понял, что R не читает столбец так, как я хотел. Столбец имеет много пробелов в электронной таблице Excel, что, как я считаю, после некоторых исследований является проблемой. После большого количества пустых строк столбец действительно имеет числовые значения, которые мне нужны для выполнения анализа в R. Однако, когда Я прочитал это с помощью функции read_xls
, она дает ему логический класс и все NA ... После просмотра этого веб-сайта readxl мне кажется очевидным, что эта проблема связана с пробелами в столбце. Я все еще не понимаю, как решить эту проблему, поскольку только один из столбцов имеет пробелы в начале набора данных. Буду признателен за любую помощь или руководство! Спасибо! Столбец, который вызывает у меня проблемы, - Rep_Val_Quantity_Avg.
вывод данных:
dput(head(df_trib,10))
structure(list(NJPDES = c("NJ0020206", "NJ0020532", "NJ0021326",
"NJ0022021", "NJ0022985", "NJ0023361", "NJ0023736", "NJ0024015",
"NJ0024031", "NJ0024040"), Facility_Name = c("ALLENTOWN BORO WWTP",
"HARRISON TWP MULLICA HILL WWTP", "MEDFORD LAKES BOROUGH STP",
"SWEDESBORO WTP", "WRIGHTSTOWN BOROUGH STP", "WILLINGBORO WATER POLLUTION CONTROL PLANT",
"PINELANDS WASTEWATER CO", "MOUNT HOLLY WPCF", "ELMWOOD WTP",
"WOODSTREAM STP"), `Monitored Location Designator` = c("001A",
"001A", "001A", "001A", "001A", "001A", "001A", "001A", "001A",
"001A"), Date = structure(c(1372550400, 1372550400, 1372550400,
1372550400, 1372550400, 1372550400, 1372550400, 1372550400, 1372550400,
1372550400), class = c("POSIXct", "POSIXt"), tzone = "UTC"),
Parameter_Number_DMR = c("00300", "00300", "00300", "00300",
"00300", "00300", "00300", "00300", "00300", "00300"), Parameter = c("Oxygen, Dissolved (DO)",
"Oxygen, Dissolved (DO)", "Oxygen, Dissolved (DO)", "Oxygen, Dissolved (DO)",
"Oxygen, Dissolved (DO)", "Oxygen, Dissolved (DO)", "Oxygen, Dissolved (DO)",
"Oxygen, Dissolved (DO)", "Oxygen, Dissolved (DO)", "Oxygen, Dissolved (DO)"
), Sample_Point_Desc = c("Effluent Gross Value", "Effluent Gross Value",
"Effluent Gross Value", "Effluent Gross Value", "Effluent Gross Value",
"Effluent Gross Value", "Effluent Gross Value", "Effluent Gross Value",
"Effluent Gross Value", "Effluent Gross Value"), Rep_Val_Quantity_Avg = c(NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA), X__1 = c(NA, NA, NA,
NA, NA, NA, NA, NA, NA, NA), `Reported Value Quantity Maximum` = c(NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA), `Quantity Units Description` = c(NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA), Rep_Val_Con_Min = c("7.2",
NA, "7.65", "6.79", NA, NA, "6", NA, "6.6", NA), Val_Con_AVG = c("7.3",
"8.8", NA, "7.58", "7.5", "7.100", "5", "7.8", "6.6", "7.4"
), Rep_Val_Con_Max = c(NA_character_, NA_character_, NA_character_,
NA_character_, NA_character_, NA_character_, NA_character_,
NA_character_, NA_character_, NA_character_), valunit = c("MILLIGRAMS PER LITER",
"MILLIGRAMS PER LITER", "MILLIGRAMS PER LITER", "MILLIGRAMS PER LITER",
"MILLIGRAMS PER LITER", "MILLIGRAMS PER LITER", "MILLIGRAMS PER LITER",
"MILLIGRAMS PER LITER", "MILLIGRAMS PER LITER", "MILLIGRAMS PER LITER"
)), .Names = c("NJPDES", "Facility_Name", "Monitored Location Designator",
"Date", "Parameter_Number_DMR", "Parameter", "Sample_Point_Desc",
"Rep_Val_Quantity_Avg", "X__1", "Reported Value Quantity Maximum",
"Quantity Units Description", "Rep_Val_Con_Min", "Val_Con_AVG",
"Rep_Val_Con_Max", "valunit"), row.names = c(NA, -10L), class = c("tbl_df",
"tbl", "data.frame"))
Используемый код:
df_trib<-read_xls("4_Del_Tribs_ DMR data all pull for certain params.xls",
sheet = "NJEMS DATA", col_names = TRUE,
col_types = c("text","text","text","date","text","text","text",
"numeric","numeric","text","numeric",
"numeric","numeric","text","text"))
col_types =
в read_xls и указывать тип переменной для каждого столбца? - person Dave2e   schedule 31.07.2018guess_max =
. Без лучшего описания файла Excel и кода, который вы использовали, трудно воспроизвести проблему, с которой вы столкнулись, и оказать какую-либо значимую помощь. - person Dave2e   schedule 01.08.2018