Каков наилучший формат для сохранения простых кадров данных на диск в R для хранения при ограничении семантических потерь?
Я спрашиваю, потому что я архивирую набор данных. В идеальном мире мой формат данных имел бы следующие характеристики:
- Стабильность - формат хранения будет совместим с будущей версией R
- Семантическая совместимость — формат хранения будет понимать семантику примитивных типов данных R. Например, он сможет разумно хранить упорядоченные факторы с метками.
- Открытый стандарт — в идеале формат должен быть открытым стандартом, чтобы другие статистические пакеты (сейчас или в будущем) могли его понять.
Моей первой мыслью было использовать CSV, который очень стабилен, но ему не хватает семантического богатства. С другой стороны, встроенный в R формат RData полностью отражает семантику R, но, вероятно, изменится между выпусками (поправьте меня, если я ошибаюсь).
Есть ли другой формат, который находит баланс между этими тремя императивами?
?save
упоминают об этомAny recent version of R can read compressed save file
, поэтому я сомневаюсь, что формат .Rdata может меняться между выпусками. - person agstudy   schedule 09.03.2013yaml
. Он может обрабатывать основные типы данныхR
(например, именованные списки, векторы,...) и удобочитаем (на мой взгляд, лучше, чем XML). - person QkuCeHBH   schedule 09.03.2013