我是靠谱客的博主 忧心吐司,这篇文章主要介绍YACC 实例分析,现在分享给大家,希望可以做个参考。

本文例子来自于 <<lex & yacc >> 第二版

 

LEX 负责词法分析,每次解析出一个 token。 

一、 token 的类型和值

token 具有类型,在计算器例子中,包括如下类型:

1)、 NUMBER     一串数字

2)、 NAME         一个名称

3)、 '+', '-', '*', '/' 等符号

同时 token 具有值,不同类型的 token, 值的含义不一样,例如, 

'1000':   类型是 NUMBER,值是1000

'abc':     类型是 NAME, 值是 'abc' 

 

LEX 解析出一个 token 后,将此 token 的值,保存在 yylval 变量中, 并将类型返回给 YACC。

为了能保存不同类型的值, yylval  被定义成 union

 

复制代码
1
2
3
4
5
%union { double dval; struct symtab *symp; }

 

其中, dval 保存 NUMBER 类型的值,symp 保存 NAME 类型的值。

为了保存 NAME 类型的值,定义了一个结构 

 

 

复制代码
1
2
3
4
5
6
struct symtab { char *name; double (*funcptr)(); double value; }

 

其中 name 记录了“符号”的名称,而 value 则用于保存计算结果,后文再介绍。

 

NAME 类型的 token,又被称为 “符号”, 跟我们写程序的时候定义的变量作用相同。

 

因此,当 LEX 

遇到数字串的时候,就把数字串的值保存到 yylval 的 dval 中,并返回 NUMBER 类型

遇到字符串的时候,根据字符串名称生成 symtab 结构,保存其名称,并将结构的地址保存到 yylval 的 symp 中,并返回 NAME 类型

遇到 '+', '-' 等符号的时候,则返回该符号的 ascii 码值。

 

 

二、 YACC 中的计算

在“产生式” 或者“规则”部分,通过 $1, $2, $3 的方式,可获取对应 token 的值,对这些变量的访问,实际就是对 yylval 的访问。此时,YACC 已经知道相应 token 的类型了,因此

对 NUMBER 类型,token 的值就是 yylval.dval

对 NAME 类型, token 的值就是  yylval.symp

例如:

 

复制代码
1
statement:  NAME '=' expression { $1->value = $3;  printf("(%s) = (%g)n", $1->name, $1->value); }
复制代码
1
expression: 
复制代码
1
2
3
4
5
6
7
8
9
| NUMBER { $$ = $1; } | NAME { $$ = $1->value; }

 

对于 NUMBER, $1 对应的就是数值

对于 NAME, $1->name 就是符号名称

 

非终结符号的类型和值

 

复制代码
1
2
%type <dval> expression

 

 

 

三、 附录: 源码

symbol.h

 

复制代码
1
2
3
4
5
6
7
8
9
#define NSYMS 1024 /* maximum number of symbols */ struct symtab { char *name; double (*funcptr)(); double value; } symtab[NSYMS]; struct symtab *symlook(char* s);

 

 

symbol.c

 

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
#include "symbol.h" #include <string.h> #include <unistd.h> #include <stdio.h> #include <stdlib.h> struct symtab *symlook(char* s) { char *p; struct symtab *sp; for(sp = symtab; sp < &symtab[NSYMS]; sp++) { /* is it already here? */ if(sp->name && !strcmp(sp->name, s)) { printf("found symbol: (%s)n", sp->name); return sp; } /* is it free */ if(!sp->name) { sp->name = strdup(s); printf("add symbol: (%s)n", s); return sp; } /* otherwise continue to next */ } yyerror("Too many symbols"); exit(1); /* cannot continue */ } /* symlook */

 

calc.l

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
%{ #include "y.tab.h" #include "symbol.h" #include <math.h> %} %% ([0-9]+|([0-9]*.[0-9]+)([eE][-+]?[0-9]+)?) { yylval.dval = atof(yytext); return NUMBER; } [ t] ; /* ignore white space */ [A-Za-z][A-Za-z0-9]* { /* return symbol pointer */ struct symtab *sp = symlook(yytext); yylval.symp = sp; return NAME; } "$" { return 0; } n | . return yytext[0]; %%

 

 

 

calc.y

 

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
%{ #include <string.h> #include <math.h> #include "symbol.h" %} %union { double dval; struct symtab *symp; } %token <symp> NAME %token <dval> NUMBER %left '-' '+' %left '*' '/' %nonassoc UMINUS %type <dval> expression %% statement_list: statement 'n' | statement_list statement 'n' ; statement: NAME '=' expression { $1->value = $3; printf("(%s) = (%g)n", $1->name, $1->value); } | expression { printf("= %gn", $1); } ; expression: expression '+' expression { $$ = $1 + $3; } | expression '-' expression { $$ = $1 - $3; } | expression '*' expression { $$ = $1 * $3; } | expression '/' expression { if($3 == 0.0) yyerror("divide by zero"); else $$ = $1 / $3; } | '-' expression %prec UMINUS { $$ = -$2; } | '(' expression ')' { $$ = $2; } | NUMBER { $$ = $1; } | NAME { $$ = $1->value; } | NAME '(' expression ')' { if($1->funcptr) $$ = ($1->funcptr)($3); else { printf("%s not a functionn", $1->name); $$ = 0.0; } } ; %%

 

转载于:https://www.cnblogs.com/rstevens/archive/2010/09/13/1824661.html

最后

以上就是忧心吐司最近收集整理的关于YACC 实例分析的全部内容,更多相关YACC内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(72)

评论列表共有 0 条评论

立即
投稿
返回
顶部