У меня есть файл размером 20 ГБ, который выглядит следующим образом:
Read name, Start position, Direction, Sequence
Обратите внимание, что прочитанные имена не обязательно должны быть уникальными.
Например. фрагмент моего файла будет выглядеть так
Read1, 40009348, +, AGTTTTCGTA
Read2, 40009349, -, AGCCCTTCGG
Read1, 50994530, -, AGTTTTCGTA
Я хочу иметь возможность хранить эти строки таким образом, чтобы я мог
- сохранить файл отсортированным на основе второго значения
- перебрать отсортированный файл
Кажется, что базы данных могут быть использованы для этого.
Документация подразумевает, что dbm нельзя использовать для сортировки файла и повторения Это.
Поэтому мне интересно, сможет ли SQLite3 выполнять 1) и 2) . Я знаю, что смогу отсортировать свой файл с помощью SQL-запроса и перебрать набор результатов с помощью sqlite3. Однако смогу ли я сделать это без нехватки памяти на компьютере с 4 ГБ ОЗУ?
ORDERBY
# - person Jakob Bowyer   schedule 08.11.2012Start position
. - person   schedule 08.11.2012