Первый:
- Обязательно отключите функции, которые вы не будете использовать (
NOOFFSETS
, NOHL
, NOFREQS
, STOPWORDS 0
).
- Используйте
SORTABLE
для NUMERIC
score
.
Вот схема, которую я использовал для тестирования:
FT.CREATE product_tags NOOFFSETS NOHL NOFREQS STOPWORDS 0
SCHEMA product_name TEXT tags TAG score NUMERIC SORTABLE
Вы хотите думать о FT.AGGREGATE
как о конвейере.
Первым шагом будет сортировка продуктов по @score, чтобы позже, в конце конвейера, когда мы REDUCE TOLIST 1 @product_name
, список вышел отсортированным:
SORTBY 2 @score DESC
Я думаю, что вы уже делаете LOAD
/APPLY
для работы с тегами, поскольку поля TAG
в противном случае были бы сгруппированы по полному списку строковых тегов, разделенных запятыми, для каждого продукта. См. раздел Разрешить GROUPBY для проблем с полями тегов. Итак, наш следующий шаг в разработке:
LOAD 1 @tags
APPLY split(@tags) as TAG
Затем мы группируем по @TAG и применяем два сокращения. Наш список продуктов будет отсортирован.
GROUPBY 1 @TAG
REDUCE SUM 1 @score AS total_score
REDUCE TOLIST 1 @product_name AS products
Наконец, мы сортируем по @total_score
:
SORTBY 2 @total_score DESC
Вот окончательный вид команды:
FT.AGGREGATE product_tags *
SORTBY 2 @score DESC
LOAD 1 @tags
APPLY split(@tags) as TAG
GROUPBY 1 @TAG
REDUCE SUM 1 @score AS total_score
REDUCE TOLIST 1 @product_name AS products
SORTBY 2 @total_score DESC
Вот полный список команд для иллюстрации результата. Я использовал productXX
с оценкой XX
, чтобы легко визуально проверить сортировку продуктов.
> FT.CREATE product_tags NOOFFSETS NOHL NOFREQS STOPWORDS 0 SCHEMA product_name TEXT tags TAG score NUMERIC SORTABLE
OK
> FT.ADD product_tags pt:product10 1 FIELDS product_name product10 tags tag2,tag3,tag4 score 10
OK
> FT.ADD product_tags pt:product1 1 FIELDS product_name product1 tags tag1,tag2,tag3 score 1
OK
> FT.ADD product_tags pt:product100 1 FIELDS product_name product100 tags tag2,tag3 score 100
OK
> FT.ADD product_tags pt:product5 1 FIELDS product_name product5 tags tag1,tag4 score 5
OK
> FT.SEARCH product_tags *
1) (integer) 4
2) "pt:product5"
3) 1) "product_name"
2) "product5"
3) "tags"
4) "tag1,tag4"
5) "score"
6) "5"
4) "pt:product100"
5) 1) "product_name"
2) "product100"
3) "tags"
4) "tag2,tag3"
5) "score"
6) "100"
6) "pt:product1"
7) 1) "product_name"
2) "product1"
3) "tags"
4) "tag1,tag2,tag3"
5) "score"
6) "1"
8) "pt:product10"
9) 1) "product_name"
2) "product10"
3) "tags"
4) "tag2,tag3,tag4"
5) "score"
6) "10"
> FT.AGGREGATE product_tags * SORTBY 2 @score DESC LOAD 1 @tags APPLY split(@tags) as TAG GROUPBY 1 @TAG REDUCE SUM 1 @score AS total_score REDUCE TOLIST 1 @product_name AS products SORTBY 2 @total_score DESC
1) (integer) 4
2) 1) "TAG"
2) "tag2"
3) "total_score"
4) "111"
5) "products"
6) 1) "product100"
2) "product10"
3) "product1"
3) 1) "TAG"
2) "tag3"
3) "total_score"
4) "111"
5) "products"
6) 1) "product100"
2) "product10"
3) "product1"
4) 1) "TAG"
2) "tag4"
3) "total_score"
4) "15"
5) "products"
6) 1) "product10"
2) "product5"
5) 1) "TAG"
2) "tag1"
3) "total_score"
4) "6"
5) "products"
6) 1) "product5"
2) "product1"
Вы получаете полный список отсортированных продуктов, а не только топ-5. С точки зрения сложности это не имеет значения, мы заплатили цену. Это влияет на буферизацию, полезную нагрузку сети и ваш клиент.
Вы можете ограничиться топ-5 с помощью Lua-скрипта:
eval "local arr = redis.call('FT.AGGREGATE', KEYS[1], '*', 'SORTBY', '2', '@score', 'DESC', 'LOAD', '1', '@tags', 'APPLY', 'split(@tags)', 'as', 'TAG', 'GROUPBY', '1', '@TAG', 'REDUCE', 'SUM', '1', '@score', 'AS', 'total_score', 'REDUCE', 'TOLIST', '1', '@product_name', 'AS', 'products', 'SORTBY', '2', '@total_score', 'DESC') \n for i=2,(arr[1]+1) do \n arr[i][6] = {unpack(arr[i][6], 1, ARGV[1])} \n end \n return arr" 1 product_tags 5
Вот дружественный вид сценария Lua выше:
local arr = redis.call('FT.AGGREGATE', KEYS[1], ..., 'DESC')
for i=2,(arr[1]+1) do
arr[i][6] = {unpack(arr[i][6], 1, ARGV[1])}
end
return arr
Мы передаем один ключ (индекс) и один аргумент (лимит для топовых товаров, в вашем случае 5): 1 product_tags 3
.
При этом мы ограничили влияние только буферизацией, сохранив полезную нагрузку сети и нагрузку на ваш клиент.
person
LeoMurillo
schedule
31.12.2019