YQL возвращает повторяющиеся результаты для title и dc:title

Я использую YQL для анализа нескольких RSS-каналов. Мне удалось заставить YQL вернуть XML для заголовка, ссылки, даты, но он также извлекает dc: title, что приводит к дублированию результатов. Я пытался использовать dc:title, но получаю синтаксическую ошибку. Вот заявление YQL.

    select title,link,description,date from rss where url in (
    'http://somerssfeed.com',
    'http://somerssfeed.com'
) | sort(field="date", descending="true")

Каким будет правильный синтаксис для использования dc: title? Кроме того, возможно ли, чтобы YQL переименовал dc: title в выводе xml только в заголовок?


person TDave00    schedule 02.03.2011    source источник


Ответы (1)


Как вы видели, YQL игнорирует пространства имен, когда вы указываете проекцию (поля для забрать). Итак, правильный синтаксис — это то, что у вас уже есть; вы не можете различать поля title и dc:title нужным вам образом.

Однако вы можете манипулировать данными любым способом (включая удаление, переименование, изменение порядка полей/результатов) в индивидуальном таблица данных.

Если это кажется слишком тяжелой работой, вы можете добавить unique() отфильтруйте в конец существующего запроса, чтобы вернуть только один результат для каждого уникального title/dc:title, чтобы объединить полученные дубликаты, например … | unique(field="title").

person salathe    schedule 06.03.2011
comment
Спасибо. Надеялся, что есть более простое решение. Я уже внедрил уникальный фильтр, как упоминалось, и он отлично работает. - person TDave00; 07.03.2011