Как я могу просто проанализировать CSS-файл (!) в моем приложении Qt?

У меня есть документ в формате *.css (каскадные таблицы стилей), но у него есть свои ключевые слова. На самом деле это персонализированный css (я называю его *.pss), со своими тегами и свойствами. вот у меня отрывок:

/* CSS like style sheet file *.pss */

@include "otherStyleSheet.pss";

/* comment */
[propertyID="1230000"] { 
  fillColor : #f3f1ed;
  minSize : 5;
  lineWidth : 3;
}

/* sphere */
[propertyID="124???|123000"] { 
  lineType : dotted;
}

/* square */
[propertyID="125???"] {
  lineType : thinline;    
}

/* ring */
[propertyID="133???"] {
  lineType : thickline; 
  [hasInnerRing=true] {
    innerLineType : thinline;
  }  
}

Хотелось бы очень легко разобрать, есть ли уже что-то готовое к использованию от Qt? Что было бы самым простым способом?

Поскольку *.css имеет свои собственные ключевые слова, меня НЕ интересуют парсеры CSS.

Мое дальнейшее намерение после синтаксического анализа этого *.pss состоит в том, чтобы сохранить его свойства в Model структура .


person Ralf Wickum    schedule 23.07.2015    source источник
comment
Я ничего не знаю о наличии. Будет ли это невероятный CSS или CSS, над которым у вас есть контроль?   -  person Frank Osterfeld    schedule 23.07.2015
comment
@FrankOsterfeld Извините, я не знаю разницы между дикой природой и контролем? Я отредактировал свой вопрос .. Thnx   -  person Ralf Wickum    schedule 23.07.2015
comment
Фрэнк имеет в виду следующее: является ли CSS частью вашего приложения, так что вы можете редактировать его и управлять им, или он поступает из потенциально вредоносных источников в Интернете? Помните, что если в вашем синтаксическом анализаторе CSS есть ошибки, вредоносные CSS могут использовать их и захватить ваше приложение. В несовременном коде C++ (или C) такие ошибки являются скорее нормой, чем исключением. Собственный синтаксический анализатор Qt не предназначен для защиты от вредоносного CSS — он никогда не был предназначен для приема случайных данных из Интернета. Я уверен, что в нем много дыр в безопасности.   -  person Kuba hasn't forgotten Monica    schedule 29.07.2015
comment
PSS (это не CSS, это просто CSS) предоставляется на кафедре моего университета. И он описывает атрибуты стиля объектов свойств.   -  person Ralf Wickum    schedule 18.08.2015
comment
Я ожидаю простой пример или описание того, как анализировать такой структурированный файл. Нет простых примеров. Либо вы пишете свой собственный синтаксический анализатор, и для этого вам нужно прочитать и понять сухой стандарт Sahara CSS, либо вы повторно используете парсер Qt. В любом случае существенно. Конечно, могут быть и другие парсеры CSS, которые легко или даже легче модифицировать, чем Qt.   -  person Kuba hasn't forgotten Monica    schedule 20.08.2015
comment
@Kuba Ober Парсер Qt: я знаю только doc.qt.io/qt-5/qdomdocument .html, который предназначен для документов в формате XML. Где я могу найти этот парсер Qt?   -  person Ralf Wickum    schedule 20.08.2015
comment
Хм, мой ответ имеет ссылку. Это это частная реализация, как я уже сказал, но эй, вот почему вы используете Qt: вы можете переназначать его код по своему усмотрению. Все исходники есть, только для вас :) Тот факт, что они частные, не означает, что вы не должны их использовать — вы можете их использовать, вам просто нужно знать, что вы делаете.   -  person Kuba hasn't forgotten Monica    schedule 20.08.2015
comment
Существует ли какое-либо формальное определение синтаксиса PSS? И знают ли люди, которые пишут эти файлы, что они не CSS, и что при их написании они должны искать документ, описывающий PSS, а не случайные онлайн-руководства по CSS? По сути, сказать, что это похоже на CSS, но не CSS, действительно недостаточно, чтобы делать что-либо с этими файлами. Вы и создатели/сопровождающие этих файлов, должно быть, говорите об одном и том же, по крайней мере, с одной или двумя рукописными страницами с описанием синтаксиса BNF.   -  person Kuba hasn't forgotten Monica    schedule 27.08.2015


Ответы (3)


Я знаю две возможности:

  1. boost::spirit и здесь вы можете найти хорошее введение к фреймворку парсера boost::spirit
  2. Я бы рекомендовал написать собственный парсер рекурсивного спуска

В связи с тем, что ваш персонализированный *.pss не такой сложный, как CSS (простой брекетинг и т. д.), я бы рекомендовал 2.

person Murat    schedule 27.08.2015
comment
Примеры простого парсера рекурсивного спуска, которые я нашел, выглядят довольно многообещающе. boost::spirit, кажется, разработан на этом. Спасибо. - person Ralf Wickum; 27.08.2015

В Qt нет ничего публичного. Вы, конечно, можете использовать собственный парсер CSS Qt — вы можете скопировать его и изменить в соответствии с вашими потребностями.

См. qtbase/src/gui/text/qcssparser_p.h в qtbase/src/gui/text.

Хорошая новость заключается в том, что для примера, который вы показали выше, изменения будут очень незначительными. Парсер Qt CSS уже поддерживает @import, поэтому у нас есть только дополнительный фрагмент синтаксиса, который у вас есть, — это синтаксис вложенного селектора. Без этого синтаксиса вы можете использовать QCss::Parser как есть. Синтаксический анализатор был написан в гибкой манере, где вам не нужно беспокоиться о формальных ключевых словах CSS: он по-прежнему позволит вам получить доступ ко всем объявлениям, независимо от того, имеют ли они смысл с формальной точки зрения CSS или нет.

Итерация дерева синтаксического анализа настолько проста, насколько это возможно:

int main() {
   QCss::Parser parser(pss);
   QCss::StyleSheet styleSheet;
   if (!parser.parse(&styleSheet))
      return 1;
   for (auto rule : styleSheet.styleRules) {
      qDebug() << "** Rule **";
      for (auto sel : rule.selectors) {
        for (auto bSel : sel.basicSelectors)
           qDebug() << bSel;
      }
      for (auto decl : rule.declarations)
         qDebug() << decl;
   }
}

Вывод - это то, что мы ожидаем:

** Rule **
BasicSelector "propertyID"="1230000"
Declaration "fillColor" = '#f3f1ed' % QColor(ARGB 1, 0.952941, 0.945098, 0.929412)
Declaration "minSize" = '5' % 5
Declaration "lineWidth" = '3'
** Rule **
BasicSelector "propertyID"="124???|123000"
Declaration "lineType" = 'dotted'
** Rule **
BasicSelector "propertyID"="125???"
Declaration "lineType" = 'thinline'
** Rule **
BasicSelector "propertyID"="133???"
Declaration "lineType" = 'thickline'

Мы должны сами реализовать операторы потока отладки для QCss классов:

QDebug operator<<(QDebug dbg, const QCss::AttributeSelector & sel) {
   QDebugStateSaver saver(dbg);
   dbg.noquote().nospace() << "\"" << sel.name << "\"";
   switch (sel.valueMatchCriterium) {
   case QCss::AttributeSelector::MatchEqual:
      dbg << "="; break;
   case QCss::AttributeSelector::MatchContains:
      dbg << "~="; break;
   case QCss::AttributeSelector::MatchBeginsWith:
      dbg << "^="; break;
   case QCss::AttributeSelector::NoMatch:
      break;
   }
   if (sel.valueMatchCriterium != QCss::AttributeSelector::NoMatch && !sel.value.isEmpty())
      dbg << "\"" << sel.value << "\"";
   return dbg;
}

QDebug operator<<(QDebug dbg, const QCss::BasicSelector & sel) {
   QDebugStateSaver saver(dbg);
   dbg.noquote().nospace() << "BasicSelector";
   if (!sel.elementName.isEmpty())
      dbg << " #" << sel.elementName;
   for (auto & id : sel.ids)
      dbg << " id:" << id;
   for (auto & aSel : sel.attributeSelectors)
      dbg << " " << aSel;
   return dbg;
}

При обходе объявления QCss::parser уже интерпретирует для нас некоторые стандартные значения, например. цвета, целые числа и т. д.

QDebug operator<<(QDebug dbg, const QCss::Declaration & decl) {
   QDebugStateSaver saver(dbg);
   dbg.noquote().nospace() << "Declaration";
   dbg << " \"" << decl.d->property << "\" = ";
   bool first = true;
   for (auto value : decl.d->values) {
      if (!first) dbg << ", ";
      dbg << "\'" << value.toString() << "\'";
      first = false;
   }
   if (decl.d->property == "fillColor")
      dbg << " % " << decl.colorValue();
   else if (decl.d->property == "minSize") {
      int i;
      if (decl.intValue(&i)) dbg << " % " << i;
   }
   return dbg;
}

Наконец, шаблон и таблица стилей для анализа:

// https://github.com/KubaO/stackoverflown/tree/master/questions/css-like-parser-31583622
#include <QtGui>
#include <private/qcssparser_p.h>

const char pss[] =
  "/* @include \"otherStyleSheet.pss\"; */ \
  [propertyID=\"1230000\"] {  \
    fillColor : #f3f1ed; \
    minSize : 5; \
    lineWidth : 3; \
  } \
   \
  /* sphere */ \
  [propertyID=\"124???|123000\"] {  \
    lineType : dotted; \
  } \
   \
  /* square */ \
  [propertyID=\"125???\"] { \
    lineType : thinline; \
  } \
   \
  /* ring */ \
  [propertyID=\"133???\"] { \
    lineType : thickline;  \
    /*[hasInnerRing=true] { \
      innerLineType : thinline; \
    }*/   \
  }";

Поддержка вложенных селекторов/правил может быть реализована путем изменения исходного кода синтаксического анализатора. Изменение, необходимое для того, чтобы сделать Parser::parseRuleset рекурсивным, очень незначительное. Я оставлю это как упражнение для читателя :)

В общем, я думаю, что повторное использование существующего парсера намного проще, чем развертывание собственного, тем более что ваши пользователи неизбежно захотят, чтобы вы поддерживали все больше и больше спецификаций CSS.

person Kuba hasn't forgotten Monica    schedule 23.07.2015
comment
github.com/qtproject/qtbase/blob/dev/ src/gui/text/ содержит более 2800 строк кода. - person Ralf Wickum; 27.08.2015
comment
@RalfWickum И что в этом плохого? Я имею в виду - это полный лексер/парсер CSS с конкретным синтаксическим деревом. Вы не должны изменять все 2800 строк, вносить необходимые изменения и использовать их целиком. Реализуя его самостоятельно, вы получите примерно такое же количество кода, который не был так тщательно протестирован. Преимущество, которое вы получаете от Qt, заключается в том, что вся его кодовая база принадлежит вам и вы можете использовать ее по своему усмотрению. То, что их много, это хорошо, а не плохо :) - person Kuba hasn't forgotten Monica; 27.08.2015
comment
Я просмотрел все необходимые файлы, такие как: github. com/qtproject/qtbase/blob/dev/src/gui/text/ , github.com/qtproject/qtbase/blob/dev/src/gui/text/ и github.com/qtproject/qtbase/blob/dev/src/gui/text/. Мне гораздо удобнее написать в общей сложности 4000 строк кода вместо того, чтобы импортировать его, не понимая, что там происходит. Я не говорю, что парсер плохой. Это было слишком сложно для меня. - person Ralf Wickum; 27.08.2015
comment
@RalfWickum Понятно. Удостоверьтесь, что вы используете хорошие тестовые примеры, и хорошо проведите фаззинг, если вы планируете использовать входные данные из Интернета. - person Kuba hasn't forgotten Monica; 27.08.2015

Ну, я предполагаю, что вы не хотите заниматься написанием анализатора объектов, вы просто заново изобретаете JSON, или YAML, или что-то подобное. Таким образом, лучше всего сделать так, чтобы ваше форматирование соответствовало известной конфигурации или языку обозначения объектов, а затем проанализировать его с помощью какой-либо библиотеки для используемого вами языка. С очень незначительной модификацией формат, который вы описали выше, может стать HOCON, который является очень хорошим надмножеством JSON и имеет синтаксис, намного более близкий к тому, что вы используете:

https://github.com/typesafehub/config/blob/master/HOCON.md

Затем вы можете проанализировать его с помощью библиотеки анализа HOCON, и вуаля, у вас будут объекты в памяти, которые вы можете моделировать или хранить любым удобным для вас способом. Я считаю, что Qt основан на C++? Существует библиотека hocon для C, я не знаю о C++, и я предполагаю, что вам нужно будет написать подключаемый модуль Qt, чтобы обернуть синтаксический анализ HOCON с какого-либо другого языка.

Другой вариант — использовать парсер объектов CSS->, подобный этому: https://github.com/reworkcss/css

Который вам может понадобиться разветвить и изменить в соответствии с вашими потребностями. В любом случае, я предполагаю, что для интеграции в приложение Qt вам понадобится подключаемый модуль, который обрабатывает некоторый вызов процесса командной строки или другого модуля кода.

person stolli    schedule 20.08.2015
comment
Я бы сделал этот формат файла по-другому. Но так как этот формат мы получили от другого ведомства, я не собираюсь (и не могу) его менять. - person Ralf Wickum; 27.08.2015