Я читал о Redshift Spectrum и кое-что не понимаю.
- Я понимаю, что Redshift Spectrum будет считывать данные из файлов, хранящихся в S3, но какой именно файл мне нужно сохранить в S3? Это какой-то SQL-запрос? можно в любом формате выложить? Допустим, у меня есть сайт электронной торговли. Могу ли я создать один файл для каждого заказа? или один файл, в котором есть все заказы и который продолжает добавляться к нему?
- Стоит ли мне ожидать плоского формата? Или я могу делать больше вещей типа NoSQL с данными в этих файлах?
- Каждый раз, когда я запрашиваю, он все еще получает данные из файлов? То есть, скажем, я запускаю запрос 1 ... обновляю существующие файлы ... и снова запускаю запрос. Получу ли я другие результаты? Или данные уже каким-то образом втянуты в спектр?