Создание простого AST в ANTLR

Я немного играю с ANTLR и хочу создать такую ​​​​функцию:

MOVE x y z pitch roll

Это производит следующий AST:

 MOVE
   |---x
   |---y
   |---z
   |---pitch
   |---roll

До сих пор я безуспешно пытался, и я продолжаю получать параметры AST как братьев и сестер, а не детей.

Код пока:

C#:

class Program
{
    const string CRLF = "\r\n";

    static void Main(string[] args)
    {
        string filename = "Script.txt";

        var reader = new StreamReader(filename);
        var input = new ANTLRReaderStream(reader);
        var lexer = new ScorBotScriptLexer(input);
        var tokens = new CommonTokenStream(lexer);
        var parser = new ScorBotScriptParser(tokens);

        var result = parser.program();
        var tree = result.Tree as CommonTree;
        Print(tree, "");

        Console.Read();
    }

    static void Print(CommonTree tree, string indent)
    {
        Console.WriteLine(indent + tree.ToString());

        if (tree.Children != null)
        {
            indent += "\t";

            foreach (var child in tree.Children)
            {
                var childTree = child as CommonTree;

                if (childTree.Text != CRLF)
                {
                    Print(childTree, indent);
                }
            }    
        }            
    }

АНТЛР:

grammar ScorBotScript;

options
{
    language     = 'CSharp2';
    output       = AST;
    ASTLabelType = CommonTree;
    backtrack    = true;
    memoize      = true;
}

@parser::namespace { RSD.Scripting }
@lexer::namespace { RSD.Scripting }

program
    : (robotInstruction CRLF)*
    ;

robotInstruction
    : moveCoordinatesInstruction
    ;

/**
 * MOVE X Y Z PITCH ROLL
 */
moveCoordinatesInstruction
    : 'MOVE' x=INT y=INT z=INT pitch=INT roll=INT
    ;

INT : '-'? ( '0'..'9' )*
    ;

COMMENT
    :   '//' ~( CR | LF )* CR? LF { $channel = HIDDEN; }
    ;

WS
    :   ( ' ' | TAB | CR | LF ) { $channel = HIDDEN; }
    ;

ID  :   ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*
    ;

STRING
    :  '"' ( ESC_SEQ | ~('\\'|'"') )* '"'
    ;

fragment
ESC_SEQ
    :   '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\')
    ;

fragment TAB 
    : '\t' 
    ;

fragment CR 
    : '\r' 
    ;

fragment LF 
    : '\n' 
    ;

CRLF
    : (CR ? LF) => CR ? LF
    | CR
    ;

parse
    : ID
    | INT
    | COMMENT
    | STRING
    | WS
    ;

person Claus Jørgensen    schedule 10.11.2010    source источник


Ответы (1)


Я сам новичок в ANTLR, меня это тоже смутило.

Я думаю, что если вы хотите создать дерево из своей грамматики со структурой, вы дополняете свою грамматику подсказками, используя символы ^ и !. Эта страница с примерами показывает, как это сделать.

Со связанной страницы:

По умолчанию ANTLR создает деревья как «списки братьев и сестер».

Грамматика должна быть аннотирована командами дерева, чтобы создать синтаксический анализатор, который создает деревья правильной формы (то есть операторы в корне, операнды которых являются дочерними). Несколько более сложный синтаксический анализатор выражений можно увидеть здесь и скачать в виде tar здесь. Обратите внимание, что грамматические терминалы, которые должны находиться в корне поддерева, помечаются знаком ^.

person brabster    schedule 10.11.2010
comment
Блин, столько раз просматривал эту страницу. Это точно сделало то, что я хотел сделать. Большое спасибо! - person Claus Jørgensen; 10.11.2010