Я читал пакет Caret и увидел этот код;
createDataPartition(y, times = 1, p = 0.5, list = TRUE, groups = min(5,
length(y)))
Меня интересует выражение «times». Итак, если я использую этот код,
inTrain2 <- createDataPartition(y = MyData$Class ,times=3, p = .70,list = FALSE)
training2 <- MyData[ inTrain2,] # ≈ %67 (train)
testing2<- MydData[-inTrain2[2],] # ≈ %33 (test)
Будет ли это причиной проблемы переобучения? Или это используется для какого-то метода повторной выборки (беспристрастного)?
Спасибо заранее.
Редактировать:
Я хотел бы отметить, что если я использую этот код;
inTrain2 <- createDataPartition(y = MyData$Class ,times=1, p = .70,list = FALSE)
training2<- MyData[ inTrain2,] #142 samples # ≈ %67 (train)
testing2<- MydData[-inTrain2,] #69 samples # ≈ %33 (test)
У меня будет 211 образцов и И ≈ %52 Точность, С другой стороны, если я использую этот код;
inTrain2 <- createDataPartition(y = MyData$Class ,times=3,p =.70,list = FALSE)
training2<- MyData[ inTrain2,] # ≈ %67 (train) # 426 samples
testing2<- MydData[-inTrain2[2],] # ≈ %33 (test) # 210 samples
У меня будет 536 выборок и точность ≈ 98%.
Спасибо.