Итак, у меня есть фрейм данных из 5 столбцов с 9031 наблюдением. Каждая запись столбца представляет собой процентильный ранг всех значений в столбце.
Моя цель — найти наивысший порог процентиля, который нужно применить ко всем пяти столбцам, чтобы получить n записей.
Итак, например, скажем, моя цель - сократить количество записей в моем фрейме данных до 1000 записей, каков самый высокий порог, который мне нужно применить ко всем 5 столбцам, чтобы получить 1000 записей?
Variance_Five_Metrics$Zips medium medium.1 medium.2 medium.3 medium.4
1 00501 0.8395527 0.8671243 0.9894807 0.6567379 0.45875318
2 00544 0.8075518 0.8687853 0.9883734 0.6345920 0.45100210
3 01432 0.6124460 0.2460414 0.9701030 0.9103089 0.17107740
4 01434 0.7869560 0.3000775 0.9268077 0.8760935 0.11859152
5 01450 0.6642675 0.2451556 0.9919167 0.9585871 0.09600266
Итак, скажем выше, если первые пять записей (из 9031 записей) моего фрейма данных. Если я хочу сократить свой df ровно до 1000 записей, какую точку отсечки мне нужно применить ко всем 5 столбцам, чтобы получить ровно 1000 записей, где все 5 столбцов имеют значения ниже этой точки отсечки?
Я, вероятно, не очень хорошо объяснил это, но я был бы признателен за любое руководство
Спасибо