PL/0语言编译程序分析

PL/0语言是Pascal语言的一个子集,我们这里分析的PL/0的编译程序包括了对PL/0语言源程序进行分析处理、编译生成类PCODE代码,并在虚拟机上解释运行生成的类PCODE代码的功能。

PL/0语言编译程序采用以语法分析为核心、一遍扫描的编译方法。词法分析和代码生成作为独立的子程序供语法分析程序调用。语法分析的同时,提供了出错报告和出错恢复的功能。在源程序没有错误编译通过的情况下,调用类PCODE解释程序解释执行生成的类PCODE代码。

词法分析子程序分析:

词法分析子程序名为getsym,功能是从源程序中读出一个单词符号(token),把它的信息放入全局变量sym、id和num中,语法分析器需要单词时,直接从这三个变量中获得。(注意!语法分析器每次用完这三个变量的值就立即调用getsym子程序获取新的单词供下一次使用。而不是在需要新单词时才调用getsym过程。)getsym过程通过反复调用getch子过程从源程序过获取字符,并把它们拼成单词。getch过程中使用了行缓冲区技术以提高程序运行效率。

词法分析器的分析过程:调用getsym时,它通过getch过程从源程序中获得一个字符。如果这个字符是字母,则继续获取字符或数字,最终可以拼成一个单词,查保留字表,如果查到为保留字,则把sym变量赋成相应的保留字类型值;如果没有查到,则这个单词应是一个用户自定义的标识符(可能是变量名、常量名或是过程的名字),把sym置为ident,把这个单词存入id变量。查保留字表时使用了二分法查找以提高效率。如果getch获得的字符是数字,则继续用getch获取数字,并把它们拼成一个整数,然后把sym置为number,并把拼成的数值放入num变量。如果识别出其它合法的符号(比如:赋值号、大于号、小于等于号等),则把sym则成相应的类型。如果遇到不合法的字符,把sym置成nul。

语法分析子程序分析:

语法分析子程序采用了自顶向下的递归子程序法,语法分析同时也根据程序的语意生成相应的代码,并提供了出错处理的机制。语法分析主要由分程序分析过程(block)、常量定义分析过程(constdeclaration)、变量定义分析过程(vardeclaration)、语句分析过程(statement)、表达式处理过程(expression)、项处理过程(term)、因子处理过程(factor)和条件处理过程(condition)构成。这些过程在结构上构成一个嵌套的层次结构。除此之外,还有出错报告过程(error)、代码生成过程(gen)、测试单词合法性及出错恢复过程(test)、登录名字表过程(enter)、查询名字表函数(position)以及列出类PCODE代码过程(listcode)作过语法分析的辅助过程。

由PL/0的语法图可知:一个完整的PL/0程序是由分程序和句号构成的。因此,本编译程序在运行的时候,通过主程序中调用分程序处理过程block来分析分程序部分(分程序分析过程中还可能会递归调用block过程),然后,判断最后读入的符号是否为句号。如果是句号且分程序分析中未出错,则是一个合法的PL/0程序,可以运行生成的代码,否则就说明源PL/0程序是不合法的,输出出错提示即可。

下面按各语法单元分析PL/0编译程序的运行机制。

分程序处理过程:

语法分析开始后,首先调用分程序处理过程(block)处理分程序。过程入口参数置为:0层、符号表位置0、出错恢复单词集合为句号、声明符或语句开始符。进入block过程后,首先把局部数据段分配指针设为3,准备分配3个单元供运行期存放静态链SL、动态链DL和返回地址RA。然后用tx0记录下当前符号表位置并产生一条jmp指令,准备跳转到主程序的开始位置,由于当前还没有知到主程序究竟在何处开始,所以jmp的目标暂时填为0,稍后再改。同时在符号表的当前位置记录下这个jmp指令在代码段中的位置。在判断了嵌套层数没有超过规定的层数后,开始分析源程序。首先判断是否遇到了常量声明,如果遇到则开始常量定义,把常量存入符号表。接下去用同样的方法分析变量声明,变量定义过程中会用dx变量记录下局部数据段分配的空间个数。然后如果遇到procedure保留字则进行过程声明和定义,声明的方法是把过程的名字和所在的层次记入符号表,过程定义的方法就是通过递归调用block过程,因为每个过程都是一个分程序。由于这是分程序中的分程序,因此调用block时需把当前的层次号lev加一传递给block过程。分程序声明部分完成后,即将进入语句的处理,这时的代码分配指针cx的值正好指向语句的开始位置,这个位置正是前面的jmp指令需要跳转到的位置。于是通过前面记录下来的地址值,把这个jmp指令的跳转位置改成当前cx的位置。并在符号表中记录下当前的代码段分配地址和局部数据段要分配的大小(dx的值)。生成一条int指令,分配dx个空间,作为这个分程序段的第一条指令。下面就调用语句处理过程statement分析语句。分析完成后,生成操作数为0的opr指令,用于从分程序返回(对于0层的主程序来说,就是程序运行完成,退出)。

常量定义过程:

通过循环,反复获得标识符和对应的值,存入符号表。符号表中记录下标识符的名字和它对应的值。

变量定义过程:

与常量定义类似,通过循环,反复获得标识符,存入符号表。符号表中记录下标识符的名字、它所在的层及它在所在层中的偏移地址。

语句处理过程:

语句处理过程是一个嵌套子程序,通过调用表达式处理、项处理、因子处理等过程及递归调用自己来实现对语句的分析。语句处理过程可以识别的语句包括赋值语句、read语句、write语句、call语句、if语句、while语句。当遇到begin/end语句时,就递归调用自己来分析。分析的同时生成相应的类PCODE指令。

赋值语句的处理:

首先获取赋值号左边的标识符,从符号表中找到它的信息,并确认这个标识符确为变量名。然后通过调用表达式处理过程算得赋值号右部的表达式的值并生成相应的指令保证这个值放在运行期的数据栈顶。最后通过前面查到的左部变量的位置信息,生成相应的sto指令,把栈顶值存入指定的变量的空间,实现了赋值操作。

read语句的处理:

确定read语句语法合理的前提下(否则报错),生成相应的指令:第一条是16号操作的opr指令,实现从标准输入设备上读一个整数值,放在数据栈顶。第二条是sto指令,把栈顶的值存入read语句括号中的变量所在的单元。

write语句的处理:

与read语句相似。在语法正确的前提下,生成指令:通过循环调用表达式处理过程分析write语句括号中的每一个表达式,生成相应指令保证把表达式的值算出并放到数据栈顶并生成14号操作的opr指令,输出表达式的值。最后生成15号操作的opr指令输出一个换行。

call语句的处理:

从符号表中找到call语句右部的标识符,获得其所在层次和偏移地址。然后生成相应的cal指令。至于调用子过程所需的保护现场等工作是由类PCODE解释程序在解释执行cal指令时自动完成的。

if语句的处理:

按if语句的语法,首先调用逻辑表达式处理过程处理if语句的条件,把相应的真假值放到数据栈顶。接下去记录下代码段分配位置(即下面生成的jpc指令的位置),然后生成条件转移jpc指令(遇0或遇假转移),转移地址未知暂时填0。然后调用语句处理过程处理then语句后面的语句或语句块。then后的语句处理完后,当前代码段分配指针的位置就应该是上面的jpc指令的转移位置。通过前面记录下的jpc指令的位置,把它的跳转位置改成当前的代码段指针位置。

begin/end语句的处理:

通过循环遍历begin/end语句块中的每一个语句,通过递归调用语句分析过程分析并生成相应代码。

while语句的处理:

首先用cx1变量记下当前代码段分配位置,作为循环的开始位置。然后处理while语句中的条件表达式生成相应代码把结果放在数据栈顶,再用cx2变量记下当前位置,生成条件转移指令,转移位置未知,填0。通过递归调用语句分析过程分析do语句后的语句或语句块并生成相应代码。最后生成一条无条件跳转指令jmp,跳转到cx1所指位置,并把cx2所指的条件跳转指令的跳转位置改成当前代码段分配位置。

表达式、项、因子处理:

根据PL/0语法可知,表达式应该是由正负号或无符号开头、由若干个项以加减号连接而成。而项是由若干个因子以乘除号连接而成,因子则可能是一个标识符或一个数字,或是一个以括号括起来的子表达式。根据这样的结构,构造出相应的过程,递归调用就完成了表达式的处理。把项和因子独立开处理解决了加减号与乘除号的优先级问题。在这几个过程的反复调用中,始终传递fsys变量的值,保证可以在出错的情况下跳过出错的符号,使分析过程得以进行下去。

逻辑表达式的处理:

首先判断是否为一元逻辑表达式:判奇偶。如果是,则通过调用表达式处理过程分析计算表达式的值,然后生成判奇指令。如果不是,则肯定是二元逻辑运算符,通过调用表达式处理过程依次分析运算符左右两部分的值,放在栈顶的两个空间中,然后依不同的逻辑运算符,生成相应的逻辑判断指令,放入代码段。

判断单词合法性与出错恢复过程分析:

本过程有三个参数,s1、s2为两个符号集合,n为出错代码。本过程的功能是:测试当前符号(即sym变量中的值)是否在s1集合中,如果不在,就通过调用出错报告过程输出出错代码n,并放弃当前符号,通过词法分析过程获取一下单词,直到这个单词出现在s1或s2集合中为止。

这个过程在实际使用中很灵活,主要有两个用法:

在进入某个语法单位时,调用本过程,检查当前符号是否属于该语法单位的开始符号集合。若不属于,则滤去开始符号和后继符号集合外的所有符号。

在语法单位分析结束时,调用本过程,检查当前符号是否属于调用该语法单位时应有的后继符号集合。若不属于,则滤去后继符号和开始符号集合外的所有符号。

通过这样的机制,可以在源程序出现错误时,及时跳过出错的部分,保证语法分析可以继续下去。

语法分析过程中调用的其它子过程相对比较简单,请参考源程序的注释。

类PCODE代码解释执行过程分析

这个过程模拟了一台可以运行类PCODE指令的栈式计算机。它拥有一个栈式数据段用于存放运行期数据、拥有一个代码段用于存放类PCODE程序代码。同时还拥用数据段分配指针、指令指针、指令寄存器、局部段基址指针等寄存器。

解释执行类PCODE代码时,数据段存储分配方式如下:

对于源程序的每一个过程(包括主程序),在被调用时,首先在数据段中开辟三个空间,存放静态链SL、动态链DL和返回地址RA。静态链记录了定义该过程的直接外过程(或主程序)运行时最新数据段的基地址。动态链记录调用该过程前正在运行的过程的数据段基址。返回地址记录了调用该过程时程序运行的断点位置。对于主程序来说,SL、DL和RA的值均置为0。静态链的功能是在一个子过程要引用它的直接或间接父过程(这里的父过程是按定义过程时的嵌套情况来定的,而不是按执行时的调用顺序定的)的变量时,可以通过静态链,跳过个数为层差的数据段,找到包含要引用的变量所在的数据段基址,然后通过偏移地址访问它。

在过程返回时,解释程序通过返回地址恢复指令指针的值到调用前的地址,通过当前段基址恢复数据段分配指针,通过动态链恢复局部段基址指针。实现子过程的返回。对于主程序来说,解释程序会遇到返回地址为0的情况,这时就认为程序运行结束。

解释程序过程中的base函数的功能,就是用于沿着静态链,向前查找相差指定层数的局部数据段基址。这在使用sto、lod等访问局部变量的指令中会经常用到。

类PCODE代码解释执行的部分通过循环和简单的case判断不同的指令,做出相应的动作。当遇到主程序中的返回指令时,指令指针会指到0位置,把这样一个条件作为终至循环的条件,保证程序运行可以正常的结束。

以下源程序是以清华大学出版社《编译原理》中的源代码为基础作了少量改动而成。

程序在Turbo Pascal 7.0上编译运行通过。

************************************************************************************
program pl0(fa,fa1,fa2); (* PL/0编译程序与代码生成解释运行程序 *)
(* PL/0 compiler with code generation *)
label 99; (* 声明出错跳转标记 *)
(* 在Turbo Pascal 7.0中已不允许跨过程的GOTO转移,因此后面的GOTO语句均被我去除了,因此这里的label也没有意义了 *)
const (* 常量定义 *)
  norw = 13;     (* of reserved words *) (* 保留字的个数 *)
  txmax = 100;   (* length of identifier table *) (* 标识符表的长度(容量) *)
  nmax = 14;     (* max number of digits in numbers *) (* 数字允许的最长位数 *)
  al = 10;       (* length of identifiers *) (* 标识符最长长度 *)
  amax = 2047;   (* maximum address *) (* 寻址空间 *)
  levmax = 3;    (* max depth of block nesting *) (* 最大允许的块嵌套层数 *)
  cxmax = 200;   (* size of code array *) (* 类PCODE目标代码数组长度(可容纳代码行数) *)
type (* 类型定义 *)
  symbol = (nul, ident, number, plus, minus, times, slash, oddsym,
            eql, neq, lss, leq, gtr, geq, lparen, rparen, comma,
            semicolon, period, becomes, beginsym, endsym, ifsym,
            thensym, whilesym, writesym, readsym, dosym, callsym,
            constsym, varsym, procsym); (* symobl类型标识了不同类型的词汇 *)
  alfa = packed array[1..al] of char; (* alfa类型用于标识符 *)
  object1 = (constant, variable, procedur); (* object1为三种标识符的类型 *)
  (* 原程序在此使用object作为类型名称,在支持面向对象的Turbo Pascal 7.0中编译不能通过 *)
  (* wirth used the word "procedure" there, whick won't work! *)
  (* 上面一行是课本上的程序清单中的注释,说本程序的原作者Wirth在这里用了procedure这个词作为标识符类型,是不可以的。
     事实上Wirth原本在这里用的词是prozedure,是可以的。 *)
  symset = set of symbol; (* symset是symbol类型的一个集合类型,可用于存放一组symbol *)
  fct = (lit, opr, lod, sto, cal, int, jmp, jpc); (* fct类型分别标识类PCODE的各条指令 *)
  instruction = packed record
    f: fct;       (* function code *)
    l: 0..levmax; (* level *)
    a: 0..amax;   (* displacement addr *)
  end; (* 类PCODE指令类型,包含三个字段:指令f、层差l和另一个操作数a *)
  (* 
     lit 0, a  load constant a
     opr 0, a  execute opr a
     lod l, a  load variable l, a
     sto l, a  store variable l, a
     cal l, a  call procedure a at level l
     int 0, a  increment t-register by a
     jmp 0, a  jump to a
     jpc 0, a  jump conditional to a 
  *)
var (* 全局变量定义 *)
  fa: text; (* 文本文件fa用于列出源程序 *)
  fa1, fa2: text; (* 文本文件fa1用于列出类PCODE代码、fa2用于记录解释执行类PCODE代码的过程 *)
  listswitch: boolean; (* true set list object code *) (* 如果本变量置true,程序编译后将为列出类PCODE代码,
                                                          否则不列出类PCODE代码 *)
  ch: char; (* last char read *) (* 主要用于词法分析器,存放最近一次从文件中读出的字符 *)
  sym: symbol; (* last symbol read *) (* 词法分析器输出结果之用,存放最近一次识别出来的token的类型 *)
  id: alfa;  (* last identifier read *) (* 词法分析器输出结果之用,存放最近一次识别出来的标识符的名字 *)
  num: integer; (* last number read *) (* 词法分析器输出结果之用,存放最近一次识别出来的数字的值 *)
  cc: integer;  (* character count *) (* 行缓冲区指针 *) 
  ll: integer;  (* line length *) (* 行缓冲区长度 *)
  kk: integer;  (* 引入此变量是出于程序性能考虑,见getsym过程注释 *)
  cx: integer;  (* code allocation index *) (* 代码分配指针,代码生成模块总在cx所指位置生成新的代码 *)
  line: array[1..81] of char; (* 行缓冲区,用于从文件读出一行,供词法分析获取单词时之用 *)
  a: alfa; (* 词法分析器中用于临时存放正在分析的词 *)
  code: array[0..cxmax] of instruction; (* 生成的类PCODE代码表,存放编译得到的类PCODE代码 *)
  word: array[1..norw] of alfa; (* 保留字表 *)
  wsym: array[1..norw] of symbol; (* 保留字表中每一个保留字对应的symbol类型 *)
  ssym: array[' '..'^'] of symbol; (* 一些符号对应的symbol类型表 *)
    (* wirth uses "array[char]" here *)
  mnemonic: array[fct] of packed array[1..5] of char;(* 类PCODE指令助记符表 *)
  declbegsys, statbegsys, facbegsys: symset; (* 声明开始、表达式开始和项开始符号集合 *)
  table: array[0..txmax] of record (* 符号表 *)
    name: alfa; (* 符号的名字 *)
    case kind: object1 of (* 符号的类型 *)
      constant: (* 如果是常量名 *)
        (val: integer); (* val中放常量的值 *)
      variable, procedur:  (* 如果是变量名或过程名 *)
        (level, adr, size: integer) (* 存放层差、偏移地址和大小 *)
        (* "size" lacking in orginal. I think it belons here *)
  end;
  fin, fout: text; (* fin文本文件用于指向输入的源程序文件,fout程序中没有用到 *)
  fname: string; (* 存放PL/0源程序文件的文件名 *)
  (* 我修改的代码:原程序在此处使用alfa类型,无法在Turbo Pascal 7.0中通过,readln函数的参数不能为alfa型 *)
  err: integer; (* 出错总次数 *)
(* 出错处理过程error *)
(* 参数:n:出错代码 *)
procedure error(n: integer);
begin
  writeln('****', ' ': cc-1, '!', n:2); (* 在屏幕cc-1位置显示!与出错代码提示,由于cc
                                           是行缓冲区指针,所以!所指位置即为出错位置 *)
  writeln(fa1, '****', ' ': cc-1, '!', n:2); (* 在文件cc-1位置输出!与出错代码提示 *)
  err := err + 1 (* 出错总次数加一 *)
end (* error *);
(* 词法分析过程getsym *)
procedure getsym;
var 
  i, j, k: integer;
  (* 读取原程序中下一个字符过程getch *)
  procedure getch;
  begin
    if cc = ll then (* 如果行缓冲区指针指向行缓冲区最后一个字符就从文件读一行到行缓冲区 *)
    begin
      if eof(fin) then (* 如果到达文件末尾 *)
      begin
        write('Program incomplete'); (* 出错,退出程序 *)
        close(fa);
        close(fa1);
        close(fin);
        halt(0);        
        {goto 99}
        (* 我修改的代码,由于Turbo Pascal 7.0中不允许跨过程的goto,就只能用上面的方法退出程序了。 *)
      end;
      ll := 0; (* 行缓冲区长度置0 *)
      cc := 0; (* 行缓冲区指针置行首 *)
      write(cx: 4, ' '); (* 输出cx值,宽度为4 *)
      write(fa1, cx: 4, ' '); (* 输出cx值,宽度为4到文件 *)
      while not eoln(fin) do (* 当未到行末时 *)
      begin
        ll := ll + 1; (* 行缓冲区长度加一 *)
        read(fin, ch); (* 从文件读入一个字符到 ch *)
        write(ch); (* 在屏幕输出ch *)
        write(fa1, ch); (* 把ch输出到文件 *)
        line[ll] := ch; (* 把读到的字符存入行缓冲区相应的位置 *)
      end;
      (* 可见,PL/0源程序要求每行的长度都小于81个字符 *)
      writeln; 
      ll := ll + 1; (* 行缓冲区长度加一,用于容纳即将读入的回车符CR *)
      read(fin, line[ll]);(* 把#13(CR)读入行缓冲区尾部 *)
      read(fin, ch); (* 我添加的代码。由于PC上文本文件换行是以#13#10(CR+LF)表示的,
                        所以要把多余的LF从文件读出,这里放在ch变量中是由于ch变量的
                        值在下面即将被改变,把这个多余值放在ch中没有问题 *)
      writeln(fa1); 
    end;
    cc := cc + 1; (* 行缓冲区指针加一,指向即将读到的字符 *)
    ch := line[cc] (* 读出字符,放入全局变量ch *)
  end (* getch *); 
begin (* getsym *)
  while (ch = ' ') or (ch = #13) do (* 我修改的代码:这句原来是用于读一个有效的字符
                                       (跳过读出的字符中多余的空格),但实际上还要跳
                                       过多余的回车 *)
    getch; 
  if ch in ['a'..'z'] then (* 如果读出的字符是一个字母,说明是保留字或标识符 *)
  begin
    k := 0; (* 标识符缓冲区指针置0 *)
    repeat (* 这个循环用于依次读出源文件中的字符构成标识符 *)
      if k < al then (* 如果标识符长度没有超过最大标识符长度(如果超过,就取前面一部分,把多余的抛弃) *)
      begin
        k := k + 1; 
        a[k] := ch;
      end;
      getch (* 读下一个字符 *)
    until not (ch in ['a'..'z','0'..'9']); (* 直到读出的不是字母或数字,由此可知PL/0的标识符构成规则是:
                                              以字母开头,后面跟若干个字母或数字 *)
    if k >= kk then (* 如果当前获得的标识符长度大于等于kk *)
      kk := k (* 令kk为当前标识符长度 *)
    else
      repeat (* 这个循环用于把标识符缓冲后部没有填入相应字母或空格的空间用空格补足 *)
        a[kk] := ' ';
        kk := kk - 1
      until kk = k;
    (* 在第一次运行这个过程时,kk的值为al,即最大标识符长度,如果读到的标识符长度小于kk,
       就把a数组的后部没有字母的空间用空格补足。
       这时,kk的值就成为a数组前部非空格字符的个数。以后再运行getsym时,如果读到的标识符长度大于等于kk,
       就把kk的值变成当前标识符的长度。
       这时就不必在后面填空格了,因为它的后面肯定全是空格。反之如果最近读到的标识符长度小于kk,那就需要从kk位置向前,
       把超过当前标识长度的空间填满空格。
       以上的这样一个逻辑,完全是出于程序性能的上考虑。其实完全可以简单的把a数组中a[k]元素以后的空间不管三七二十一全填空格。 
    *)
    (* 下面开始二分法查找看读出的标识符是不是保留字之一 *)
    id := a; (* 最后读出标识符等于a *)
    i := 1; (* i指向第一个保留字 *)
    j := norw; (* j指向最后一个保留字 *)
    repeat
      k := (i + j) div 2; (* k指向中间一个保留字 *)
      if id <= word[k] then (* 如果当前的标识符小于k所指的保留字 *)
        j := k - 1; (* 移动j指针 *)
      if id >= word[k] then (* 如果当前的标识符大于k所指的保留字 *)
        i := k + 1 (* 移动i指针 *)
    until i > j; (* 循环直到找完保留字表 *)
    if i - 1 > j then (* 如果i - 1 > j表明在保留字表中找到相应的项,id中存的是保留字 *)
      sym := wsym[k] (* 找到保留字,把sym置为相应的保留字值 *)
    else
      sym := ident (* 未找到保留字,把sym置为ident类型,表示是标识符 *)
  end(* 至此读出字符为字母即对保留字或标识符的处理结束 *)
  else (* 如果读出字符不是字母 *)
    if ch in ['0'..'9'] then (* 如果读出字符是数字 *)
    begin (* number *) (* 开始对数字进行处理 *)
      k := 0; (* 数字位数 *)
      num := 0; (* 数字置为0 *)
      sym := number; (* 置sym为number,表示这一次读到的是数字 *)
      repeat (* 这个循环依次从源文件中读出字符,组成数字 *)
        num := 10 * num + (ord(ch) - ord('0')); (* num * 10加上最近读出的字符ASCII减'0'的ASCII得到相应的数值 *)
        k := k + 1; (* 数字位数加一 *)
        getch
      until not (ch in ['0'..'9']); (* 直到读出的字符不是数字为止 *)
      if k > nmax then (* 如果组成的数字位数大于最大允许的数字位数 *)
        error(30) (* 发出30号错 *)
    end(* 至此对数字的识别处理结束 *)
    else
      if ch = ':' then (* 如果读出的不字母也不是数字而是冒号 *)
      begin
        getch; (* 再读一个字符 *)
        if ch = '=' then (* 如果读到的是等号,正好可以与冒号构成赋值号 *)
        begin
          sym := becomes; (* sym的类型设为赋值号becomes *)
          getch (* 再读出下一个字 *)
        end
        else
          sym := nul; (* 如果不是读到等号,那单独的一个冒号就什么也不是 *)
      end(* 以上完成对赋值号的处理 *)
    else (* 如果读到不是字母也不是数字也不是冒号 *)
      if ch = '<' then (* 如果读到小于号 *)
      begin
        getch; (* 再读一个字符 *)
        if ch = '=' then (* 如果读到等号 *)
        begin
          sym := leq; (* 购成一个小于等于号 *)
          getch (* 读一个字符 *)
        end
        else (* 如果小于号后不是跟的等号 *)
          sym := lss (* 那就是一个单独的小于号 *)
      end
      else (* 如果读到不是字母也不是数字也不是冒号也不是小于号 *)
        if ch = '>' then (* 如果读到大于号,处理过程类似于处理小于号 *)
        begin
          getch; (* 再读一个字符 *)
          if ch = '=' then (* 如果读到等号 *)
          begin
            sym := geq; (* 购成一个大于等于号 *)
            getch (* 读一个字符 *)
          end
          else (* 如果大于号后不是跟的等号 *)
            sym := gtr (* 那就是一个单独的大于号 *)
        end
        else(* 如果读到不是字母也不是数字也不是冒号也不是小于号也不是大于号 *)
        begin (* 那就说明它不是标识符/保留字,也不是复杂的双字节操作符,应该是一个普通的符号 *)
          sym := ssym[ch]; (* 直接成符号表中查到它的类型,赋给sym *)
          getch (* 读下一个字符 *)
        end 
  (* 整个if语句判断结束 *)
end (* getsym *);
(* 词法分析过程getsym总结:从源文件中读出若干有效字符,组成一个token串,识别它的类型
   为保留字/标识符/数字或是其它符号。如果是保留字,把sym置成相应的保留字类型,如果是
   标识符,把sym置成ident表示是标识符,于此同时,id变量中存放的即为保留字字符串或标识
   符名字。如果是数字,把sym置为number,同时num变量中存放该数字的值。如果是其它的操作符,
   则直接把sym置成相应类型。经过本过程后ch变量中存放的是下一个即将被识别的字符 *)
(* 目标代码生成过程gen *)
(* 参数:x:要生成的一行代码的助记符 *)
(*       y, z:代码的两个操作数 *)
(* 本过程用于把生成的目标代码写入目标代码数组,供后面的解释器解释执行 *)
procedure gen(x: fct; y, z: integer);
begin
  if cx > cxmax then (* 如果cx>cxmax表示当前生成的代码行号大于允许的最大代码行数 *)
  begin
    write('program too long'); (* 输出"程序太长",退出 *)
    close(fa);
    close(fa1);
    close(fin);
    halt(0)       
    {goto 99}
    (* 我修改的代码,由于Turbo Pascal 7.0中不允许跨过程的goto,就只能用上面的方法退出程序了。 *)
  end;
  with code[cx] do (* 把代码写入目标代码数组的当前cx所指位置 *)
  begin
    f := x;
    l := y;
    a := z;
  end;
  cx := cx + 1 (* 移动cx指针指向下一个空位 *)
end (* gen *);
(* 测试当前单词是否合法过程test *)
(* 参数:s1:当语法分析进入或退出某一语法单元时当前单词符合应属于的集合 *)
(*       s2:在某一出错状态下,可恢复语法分析正常工作的补充单词集合 *)
(*       n:出错信息编号,当当前符号不属于合法的s1集合时发出的出错信息 *)
procedure test(s1, s2: symset; n: integer);
begin
  if not (sym in s1) then (* 如果当前符号不在s1中 *)
  begin
    error(n); (* 发出n号错误 *)
    s1 := s1 + s2; (* 把s2集合补充进s1集合 *)
    while not (sym in s1) do (* 通过循环找到下一个合法的符号,以恢复语法分析工作 *)
      getsym
  end
end (* test *);
(* 语法分析过程block *)
(* 参数:lev:这一次语法分析所在的层次 *)
(*       tx:符号表指针 *)
(*       fsys:用于出错恢复的单词集合 *)
procedure block(lev, tx: integer; fsys: symset);
var 
  dx: integer; (* data allocation index *) (* 数据段内存分配指针,指向下一个被分配空间在数据段中的偏移位置 *)
  tx0: integer;  (* initial table index *) (* 记录本层开始时符号表位置 *)
  cx0: integer;  (* initial code index *) (* 记录本层开始时代码段分配位置 *)
  (* 登陆符号表过程enter *)
  (* 参数:k:欲登陆到符号表的符号类型 *)
  procedure enter(k: object1);
  begin (* enter object into table *)
    tx := tx + 1; (* 符号表指针指向一个新的空位 *)
    with table[tx] do (* 开始登录 *)
    begin
      name := id; (* name是符号的名字,对于标识符,这里就是标识符的名字 *)
      kind := k; (* 符号类型,可能是常量、变量或过程名 *)
      case k of (* 根据不同的类型进行不同的操作 *)
        constant: (* 如果是常量名 *)
        begin
          if num > amax then (* 在常量的数值大于允许的最大值的情况下 *)
          begin
            error(31); (* 抛出31号错误 *)
            num := 0; (* 实际登陆的数字以0代替 *)
          end;
          val := num (* 如是合法的数值,就登陆到符号表 *)
        end;
        variable: (* 如果是变量名 *)
        begin
          level := lev; (* 记下它所属的层次号 *)
          adr := dx; (* 记下它在当前层中的偏移量 *)
          dx := dx+1; (* 偏移量自增一,为下一次做好准备 *)
        end;
        procedur: (* 如果要登陆的是过程名 *)
          level := lev (* 记录下这个过程所在层次 *)
      end
    end
  end (* enter *);
  (* 登录符号过程没有考虑到重复的定义的问题。如果出现重复定义,则以最后一次的定义为准。 *)
  
  (* 在符号表中查找指定符号所在位置的函数position *)
  (* 参数:id:要找的符号 *)
  (* 返回值:要找的符号在符号表中的位置,如果找不到就返回0 *)
  function position (id: alfa): integer;
  var 
    i: integer;
  begin (* find identifier in table *)
    table[0].name := id; (* 先把id放入符号表0号位置 *)
    i := tx; (* 从符号表中当前位置也即最后一个符号开始找 *)
    while table[i].name <> id do (* 如果当前的符号与要找的不一致 *)
      i := i - 1; (* 找前面一个 *)
    position := i (* 返回找到的位置号,如果没找到则一定正好为0 *)
  end(* position *);
  (* 常量声明处理过程constdeclaration *)
  procedure constdeclaration;
  begin
    if sym = ident then (* 常量声明过程开始遇到的第一个符号必然应为标识符 *)
    begin
      getsym; (* 获取下一个token *)
      if sym in [eql, becomes] then (* 如果是等号或赋值号 *)
      begin
        if sym = becomes then (* 如果是赋值号(常量生明中应该是等号) *)
          error(1); (* 抛出1号错误 *)
        (* 这里其实自动进行了错误纠正使编译继续进行,把赋值号当作等号处理 *)
        getsym; (* 获取下一个token,等号或赋值号后应接上数字 *)
        if sym = number then (* 如果的确是数字 *) 
        begin
          enter(constant); (* 把这个常量登陆到符号表 *)
          getsym (* 获取下一个token,为后面作准备 *)
        end
        else
          error(2) (* 如果等号后接的不是数字,抛出2号错误 *)
      end
      else
        error(3) (* 如果常量标识符后接的不是等号或赋值号,抛出3号错误 *)
    end
    else
      error(4) (* 如果常量声明过程遇到的第一个符号不为标识符,抛出4号错误 *)
  end(* constdeclaration *);
  (* 变量声明过程vardeclaration *)  
  procedure vardeclaration;
  begin
    if sym = ident then (* 变量声明过程开始遇到的第一个符号必然应为标识符 *)
    begin
      enter(variable); (* 将标识符登陆到符号表中 *)
      getsym (* 获取下一个token,为后面作准备 *)
    end
    else
      error(4) (* 如果变量声明过程遇到的第一个符号不是标识符,抛出4号错误 *)
  end(* vardeclaration *);
  (* 列出当前一层类PCODE目标代码过程listcode *) 
  procedure listcode;
  var 
    i: integer;
  begin (* list code generated for this block *)
    if listswitch then (* 如果用户选择是要列出代码的情况下才列出代码 *)
    begin
      for i := cx0 to cx - 1 do (* 从当前层代码开始位置到当前代码位置-1处,即为本分程序块 *)
        with code[i] do
        begin
          writeln(i: 4, mnemonic[f]: 5, l: 3, a: 5); (* 显示出第i行代码的助记符和L与A操作数 *)
          (* 我修改的代码:原程序此处在输出i时,没有指定占4个字符宽度,不美观也与下面一句不配套。 *)
          writeln(fa, i: 4, mnemonic[f]: 5, l: 3, a: 5) (* 同时把屏显打印到文件 *)
        end;
    end
  end(* listcode *);
  (* 语句处理过程statement *)
  (* 参数说明:fsys: 如果出错可用来恢复语法分析的符号集合 *)
  procedure statement(fsys: symset);
  var 
    i, cx1, cx2: integer;
    (* 表达式处理过程expression *)
    (* 参数说明:fsys: 如果出错可用来恢复语法分析的符号集合 *)
    procedure expression(fsys: symset);
    var 
      addop: symbol;
      (* 项处理过程term *)
      (* 参数说明:fsys: 如果出错可用来恢复语法分析的符号集合 *)
      procedure term(fsys: symset);
      var 
        mulop: symbol;
        (* 因子处理过程factor *)
        (* 参数说明:fsys: 如果出错可用来恢复语法分析的符号集合 *)
        procedure factor(fsys: symset);
        var 
          i: integer;
        begin
          test(facbegsys, fsys, 24); (* 开始因子处理前,先检查当前token是否在facbegsys集合中。 *)
                                     (* 如果不是合法的token,抛24号错误,并通过fsys集恢复使语法处理可以继续进行 *)         
          while sym in facbegsys do (* 循环处理因子 *)
          begin
            if sym = ident then (* 如果遇到的是标识符 *)
            begin
              i := position(id); (* 查符号表,找到当前标识符在符号表中的位置 *)
              if i = 0 then (* 如果查符号表返回为0,表示没有找到标识符 *)
                error(11) (* 抛出11号错误 *)
              else
                with table[i] do (* 如果在符号表中找到了当前标识符的位置,开始生成相应代码 *)
                  case kind of
                    constant: gen(lit, 0, val); (* 如果这个标识符对应的是常量,值为val,生成lit指令,把val放到栈顶 *)
                    variable: gen(lod, lev - level, adr); (* 如果标识符是变量名,生成lod指令, *)
                                                          (* 把位于距离当前层level的层的偏移地址为adr的变量放到栈顶 *)
                    procedur: error(21) (* 如果在因子处理中遇到的标识符是过程名,出错了,抛21号错 *)
                  end;
              getsym (* 获取下一token,继续循环处理 *)
            end
            else
              if sym = number then (* 如果因子处理时遇到数字 *)
              begin
                if num > amax then (* 如果数字的大小超过允许最大值amax *)
                begin
                  error(31); (* 抛出31号错 *)
                  num := 0 (* 把数字按0值处理 *)
                end;
                gen(lit, 0, num); (* 生成lit指令,把这个数值字面常量放到栈顶 *)
                getsym (* 获取下一token *)
              end
              else
                if sym = lparen then (* 如果遇到的是左括号 *)
                begin
                  getsym; (* 获取一个token *)
                  expression( [rparen] + fsys ); (* 递归调用expression子程序分析一个子表达式 *)
                  if sym = rparen then (* 子表达式分析完后,应遇到右括号 *)
                    getsym (* 如果的确遇到右括号,读取下一个token *)
                  else
                    error(22) (* 否则抛出22号错误 *)
                end;
            test(fsys, facbegsys, 23) (* 一个因子处理完毕,遇到的token应在fsys集合中 *)
                                      (* 如果不是,抛23号错,并找到下一个因子的开始,使语法分析可以继续运行下去 *)
          end
        end(* factor *);
      begin (* term *)
        factor([times, slash] + fsys); (* 每一个项都应该由因子开始,因此调用factor子程序分析因子 *)
        while sym in [times, slash] do (* 一个因子后应当遇到乘号或除号 *)
        begin
          mulop := sym; (* 保存当前运算符 *)
          getsym; (* 获取下一个token *)
          factor(fsys + [times, slash]); (* 运算符后应是一个因子,故调factor子程序分析因子 *)
          if mulop = times then (* 如果刚才遇到乘号 *)
            gen(opr, 0, 4) (* 生成乘法指令 *)
          else
            gen(opr, 0, 5) (* 不是乘号一定是除号,生成除法指令 *)
        end
      end (* term *);
    begin (* expression *)
      if sym in [plus, minus] then (* 一个表达式可能会由加号或减号开始,表示正负号 *)
      begin
        addop := sym; (* 把当前的正号或负号保存起来,以便下面生成相应代码 *)
        getsym; (* 获取一个token *)
        term(fsys + [plus, minus]); (* 正负号后面应该是一个项,调term子程序分析 *)
        if addop = minus then (* 如果保存下来的符号是负号 *)
          gen(opr, 0, 1) (* 生成一条1号操作指令:取反运算 *)
        (* 如果不是负号就是正号,不需生成相应的指令 *)
      end
      else (* 如果不是由正负号开头,就应是一个项开头 *)
        term(fsys + [plus, minus]); (* 调用term子程序分析项 *) 
      while sym in [plus, minus] do (* 项后应是加运算或减运算 *)
      begin
        addop := sym; (* 把运算符保存下来 *)
        getsym; (* 获取下一个token,加减运算符后应跟的是一个项 *)
        term(fsys + [plus, minus]); (* 调term子程序分析项 *)
        if addop = plus then (* 如果项与项之间的运算符是加号 *)
          gen(opr, 0, 2) (* 生成2号操作指令:加法 *)
        else (* 否则是减法 *)
          gen(opr, 0, 3) (* 生成3号操作指令:减法 *)
      end
    end (* expression *);
    (* 条件处理过程condition *)
    (* 参数说明:fsys: 如果出错可用来恢复语法分析的符号集合 *)
    procedure condition(fsys: symset);
    var 
      relop: symbol; (* 用于临时记录token(这里一定是一个二元逻辑运算符)的内容 *)
    begin
      if sym = oddsym then (* 如果是odd运算符(一元) *)
      begin
        getsym; (* 获取下一个token *)
        expression(fsys); (* 对odd的表达式进行处理计算 *)
        gen(opr, 0, 6); (* 生成6号操作指令:奇偶判断运算 *)
      end
      else (* 如果不是odd运算符(那就一定是二元逻辑运算符) *)
      begin
        expression([eql, neq, lss, leq, gtr, geq] + fsys); (* 对表达式左部进行处理计算 *)
        if not (sym in [eql, neq, lss, leq, gtr, geq]) then (* 如果token不是逻辑运算符中的一个 *)
          error(20) (* 抛出20号错误 *)
        else
        begin
          relop := sym; (* 记录下当前的逻辑运算符 *)
          getsym; (* 获取下一个token *)
          expression(fsys); (* 对表达式右部进行处理计算 *)
          case relop of (* 如果刚才的运算符是下面的一种 *)
            eql: gen(opr, 0, 8); (* 等号:产生8号判等指令 *)
            neq: gen(opr, 0, 9); (* 不等号:产生9号判不等指令 *)
            lss: gen(opr, 0, 10); (* 小于号:产生10号判小指令 *)
            geq: gen(opr, 0, 11); (* 大于等号号:产生11号判不小于指令 *)
            gtr: gen(opr, 0, 12); (* 大于号:产生12号判大于指令 *)
            leq: gen(opr, 0, 13); (* 小于等于号:产生13号判不大于指令 *)
          end
        end
      end
    end (* condition *);
  begin (* statement *)
    if sym = ident then (* 所谓"语句"可能是赋值语句,以标识符开头 *)
    begin
      i := position(id); (* 在符号表中查到该标识符所在位置 *)
      if i = 0 then (* 如果没找到 *)
        error(11) (* 抛出11号错误 *)
      else
        if table[i].kind <> variable then (* 如果在符号表中找到该标识符,但该标识符不是变量名 *) 
        begin
          error(12); (* 抛出12号错误 *)
          i := 0 (* i置0作为错误标志 *)
        end;
      getsym; (* 获得下一个token,正常应为赋值号 *)
      if sym = becomes then (* 如果的确为赋值号 *)
        getsym (* 获取下一个token,正常应为一个表达式 *)
      else
        error(13); (* 如果赋值语句的左部标识符号后所接不是赋值号,抛出13号错误 *)
      expression(fsys); (* 处理表达式 *)
      if i <> 0 then (* 如果不曾出错,i将不为0,i所指为当前语名左部标识符在符号表中的位置 *)
        with table[i] do
          gen(sto, lev - level, adr) (* 产生一行把表达式值写往指定内存的sto目标代码 *)
    end
    else
      if sym = readsym then (* 如果不是赋值语句,而是遇到了read语句 *)
      begin
        getsym; (* 获得下一token,正常情况下应为左括号 *)
        if sym <> lparen then (* 如果read语句后跟的不是左括号 *)
          error(34) (* 抛出34号错误 *)
        else
          repeat (* 循环得到read语句括号中的参数表,依次产生相应的“从键盘读入”目标代码 *)
            getsym; (* 获得一个token,正常应是一个变量名 *)
            if sym = ident then (* 如果确为一个标识符 *) 
            (* 这里略有问题,还应判断一下这个标识符是不是变量名,如果是常量名或过程名应出错 *)
              i := position(id) (* 查符号表,找到它所在位置给i,找不到时i会为0 *)
            else
              i := 0; (* 不是标识符则有问题,i置0作为出错标志 *)
            if i = 0 then (* 如果有错误 *)
              error(35) (* 抛出35号错误 *)
            else (* 否则生成相应的目标代码 *)
              with table[i] do
              begin
                gen(opr, 0, 16); (* 生成16号操作指令:从键盘读入数字 *)
                gen(sto, lev - level, adr) (* 生成sto指令,把读入的值存入指定变量所在的空间 *)
              end;
            getsym (* 获取下一个token,如果是逗号,则read语还没完,否则应当是右括号 *)
          until sym <> comma; (* 不断生成代码直到read语句的参数表中的变量遍历完为止,这里遇到不是逗号,应为右括号 *)
        if sym <> rparen then (* 如果不是我们预想中的右括号 *)
        begin
          error(33); (* 抛出33号错误 *)
          while not (sym in fsys) do (* 依靠fsys集,找到下一个合法的token,恢复语法分析 *)
            getsym
        end
        else
          getsym (* 如果read语句正常结束,得到下一个token,一般为分号或end *)
      end
      else
        if sym = writesym then (* 如果遇到了write语句 *)
        begin
          getsym; (* 获取下一token,应为左括号 *)
          if sym = lparen then (* 如确为左括号 *)
          begin
            repeat (* 依次获取括号中的每一个值,进行输出 *)
              getsym; (* 获得一个token,这里应是一个标识符 *)
              expression([rparen, comma] + fsys); (* 调用expression过程分析表达式,用于出错恢复的集合中加上右括号和逗号 *)
              gen(opr, 0, 14) (* 生成14号指令:向屏幕输出 *)
            until sym <> comma; (* 循环直到遇到的不再是逗号,这时应是右括号 *)
            if sym <> rparen then (* 如果不是右括号 *)
              error(33) (* 抛出33号错误 *)
            else
              getsym (* 正常情况下要获取下一个token,为后面准备好 *)
          end;
          gen(opr, 0, 15) (* 生成一个15号操作的目标代码,功能是输出一个换行 *)
          (* 由此可知PL/0中的write语句与Pascal中的writeln语句类似,是带有输出换行的 *)
        end
        else
          if sym = callsym then (* 如果是call语句 *)
          begin
            getsym; (* 获取token,应是过程名型标识符 *)
            if sym <> ident then (* 如果call后跟的不是标识符 *)
              error(14) (* 抛出14号错误 *)
            else
            begin
              i := position(id); (* 从符号表中找出相应的标识符 *)
              if i = 0 then (* 如果没找到 *)
                error(11) (* 抛出11号错误 *)
              else
                with table[i] do (* 如果找到标识符位于符号表第i位置 *)
                  if kind = procedur then (* 如果这个标识符为一个过程名 *)
                    gen(cal,lev-level,adr) (* 生成cal目标代码,呼叫这个过程 *)
                  else
                    error(15); (* 如果call后跟的不是过程名,抛出15号错误 *)
              getsym (* 获取下一token,为后面作准备 *)
            end
          end
        else
          if sym = ifsym then (* 如果是if语句 *)
          begin
            getsym; (* 获取一token应是一个逻辑表达式 *)
            condition([thensym, dosym] + fsys); (* 对逻辑表达式进行分析计算,出错恢复集中加入then和do语句 *)
            if sym = thensym then (* 表达式后应遇到then语句 *)
              getsym (* 获取then后的token,应是一语句 *)
            else
              error(16); (* 如果if后没有then,抛出16号错误 *)
            cx1 := cx; (* 记下当前代码分配指针位置 *)
            gen(jpc, 0, 0); (* 生成条件跳转指令,跳转位置暂时填0,分析完语句后再填写 *)
            statement(fsys); (* 分析then后的语句 *)
            code[cx1].a:=cx (* 上一行指令(cx1所指的)的跳转位置应为当前cx所指位置 *)
          end
          else
            if sym = beginsym then (* 如果遇到begin *)
            begin
              getsym; (* 获取下一个token *)
              statement([semicolon, endsym] + fsys);(* 对begin与end之间的语句进行分析处理 *)
              while sym in [semicolon] + statbegsys do (* 如果分析完一句后遇到分号或语句开始符循环分析下一句语句 *)
              begin
                if sym = semicolon then (* 如果语句是分号(可能是空语句) *)
                  getsym (* 获取下一token继续分析 *)
                else
                  error(10); (* 如果语句与语句间没有分号,出10号错 *)
                statement([semicolon, endsym] + fsys) (* 分析一个语句 *)
              end;
              if sym = endsym then (* 如果语句全分析完了,应该遇到end *)
                getsym (* 的确是end,读下一token *)
              else
                error(17) (* 如果不是end,抛出17号错 *)
            end
            else
              if sym = whilesym then (* 如果遇到while语句 *)
              begin
                cx1 := cx; (* 记下当前代码分配位置,这是while循环的开始位置 *)
                getsym; (* 获取下一token,应为一逻辑表达式 *)
                condition([dosym] + fsys); (* 对这个逻辑表达式进行分析计算 *)
                cx2 := cx; (* 记下当前代码分配位置,这是while的do中的语句的开始位置 *)
                gen(jpc, 0, 0); (* 生成条件跳转指令,跳转位置暂时填0 *)
                if sym = dosym then (* 逻辑表达式后应为do语句 *)
                  getsym (* 获取下一token *)
                else
                  error(18); (* if后缺少then,抛出18号错误 *)
                statement(fsys); (* 分析do后的语句块 *)
                gen(jmp, 0, cx1); (* 循环跳转到cx1位置,即再次进行逻辑判断 *)
                code[cx2].a := cx (* 把刚才填0的跳转位置改成当前位置,完成while语句的处理 *)
              end;
    test(fsys, [], 19) (* 至此一个语句处理完成,一定会遇到fsys集中的符号,如果没有遇到,就抛19号错 *)
  end(* statement *);
begin (* block *)
  dx := 3; (* 地址指示器给出每层局部量当前已分配到的相对位置。
              置初始值为3的原因是:每一层最开始的位置有三个空间用于存放静态链SL、动态链DL和返回地址RA *)
  tx0 := tx; (* 初始符号表指针指向当前层的符号在符号表中的开始位置 *)
  table[tx].adr := cx; (* 符号表当前位置记下当前层代码的开始位置 *)
  gen(jmp, 0, 0); (* 产生一行跳转指令,跳转位置暂时未知填0 *)
  if lev > levmax then (* 如果当前过程嵌套层数大于最大允许的套层数 *)
    error(32); (* 发出32号错误 *)
  repeat (* 开始循环处理源程序中所有的声明部分 *)
    if sym = constsym then (* 如果当前token是const保留字,开始进行常量声明 *)
    begin
      getsym; (* 获取下一个token,正常应为用作常量名的标识符 *)
      repeat (* 反复进行常量声明 *)
        constdeclaration; (* 声明以当前token为标识符的常量 *)
        while sym = comma do (* 如果遇到了逗号则反复声明下一个常量 *)
        begin
          getsym; (* 获取下一个token,这里正好应该是标识符 *)
          constdeclaration (* 声明以当前token为标识符的常量 *)
        end;
        if sym = semicolon then (* 如果常量声明结束,应遇到分号 *)
          getsym (* 获取下一个token,为下一轮循环做好准备 *)
        else
          error(5) (* 如果常量声明语句结束后没有遇到分号则发出5号错误 *)
      until sym <> ident (* 如果遇到非标识符,则常量声明结束 *)
    end;
    (* 此处的常量声明的语法与课本上的EBNF范式有不同之处:
       它可以接受像下面的声明方法,而根据课本上的EBNF范式不可得出下面的语法:
       const a = 3, b = 3; c = 6; d = 7, e = 8; 
       即它可以接受分号或逗号隔开的常量声明,而根据EBNF范式只可接受用逗号隔开的声明 *)
    if sym = varsym then (* 如果当前token是var保留字,开始进行变量声明,与常量声明类似 *)
    begin
      getsym; (* 获取下一个token,此处正常应为用作变量名的一个标识符 *)
      repeat (* 反复进行变量声明 *)
        vardeclaration; (* 以当前token为标识符声明一个变量 *)
        while sym = comma do (* 如果遇到了逗号则反复声明下一个变量 *)
        begin
          getsym; (* 获取下一个token,这里正好应该是标识符 *)
          vardeclaration; (* 声明以当前token为标识符的变量 *)
        end;
        if sym = semicolon then (* 如果变量声明结束,应遇到分号 *)
          getsym (* 获取下一个token,为下一轮循环做好准备 *)
        else
          error(5) (* 如果变量声明语句结束后没有遇到分号则发出5号错误 *)
      until sym <> ident; (* 如果遇到非标识符,则变量声明结束 *)
      (* 这里也存在与上面的常量声明一样的毛病:与PL/0的语法规范有冲突。 *)
    end;
    while sym = procsym do (* 循环声明各子过程 *)
    begin
      getsym; (* 获取下一个token,此处正常应为作为过程名的标识符 *)
      if sym = ident then (* 如果token确为标识符 *)
      begin
        enter(procedur); (* 把这个过程登录到名字表中 *)
        getsym (* 获取下一个token,正常情况应为分号 *)
      end
      else
        error(4); (* 否则抛出4号错误 *)
      if sym = semicolon then (* 如果当前token为分号 *)
        getsym (* 获取下一个token,准备进行语法分析的递归调用 *)
      else
        error(5); (* 否则抛出5号错误 *)
      block(lev + 1, tx, [semicolon] + fsys); (* 递归调用语法分析过程,当前层次加一,同时传递表头索引、合法单词符 *)
      if sym = semicolon then (* 递归返回后当前token应为递归调用时的最后一个end后的分号 *)
      begin
        getsym; (* 获取下一个token *)
        test(statbegsys + [ident, procsym], fsys, 6); (* 检查当前token是否合法,不合法则用fsys恢复语法分析同时抛6号错 *)
      end
      else
        error(5) (* 如果过程声明后的符号不是分号,抛出5号错误 *)
    end;
    test(statbegsys + [ident], declbegsys, 7) (* 检查当前状态是否合法,不合法则用声明开始符号作出错恢复、抛7号错 *)
  until not (sym in declbegsys); (* 直到声明性的源程序分析完毕,继续向下执行,分析主程序 *)
  code[table[tx0].adr].a := cx; (* 把前面生成的跳转语句的跳转位置改成当前位置 *)
  with table[tx0] do (* 在符号表中记录 *)
  begin
    adr := cx; (* 地址为当前代码分配地址 *)
    size := dx; (* 长度为当前数据代分配位置 *)
  end;
  cx0 := cx; (* 记下当前代码分配位置 *)
  gen(int, 0, dx); (* 生成分配空间指令,分配dx个空间 *)
  statement([semicolon, endsym] + fsys); (* 处理当前遇到的语句或语句块 *)
  gen(opr, 0, 0); (* 生成从子程序返回操作指令 *)
  test(fsys, [], 8); (* 用fsys检查当前状态是否合法,不合法则抛8号错 *)
  listcode (* 列出本层的类PCODE代码 *)
end(* block *);
(* PL/0编译器产生的类PCODE目标代码解释运行过程interpret *)
procedure interpret;
const 
  stacksize = 500; (* 常量定义,假想的栈式计算机有500个栈单元 *)
var 
  p, b, t: integer; (* program base topstack registers *) 
  (* p为程序指令指针,指向下一条要运行的代码 *)
  (* b为基址指针,指向每个过程被调用时数据区中分配给它的局部变量数据段基址 *)
  (* t为栈顶寄存器,类PCODE是在一种假想的栈式计算上运行的,这个变量记录这个计算机的当前栈顶位置 *)
  i: instruction; (* i变量中存放当前在运行的指令 *)
  s: array[1..stacksize] of integer; (* datastore *) (* s为栈式计算机的数据内存区 *)
  (* 通过静态链求出数据区基地址的函数base *)
  (* 参数说明:l:要求的数据区所在层与当前层的层差 *)
  (* 返回值:要求的数据区基址 *)
  function base(l: integer): integer;
  var 
    b1: integer;
  begin
    b1 := b; (* find base 1 level down *) (* 首先从当前层开始 *)
    while l > 0 do (* 如果l大于0,循环通过静态链往前找需要的数据区基址 *)
    begin
      b1 := s[b1]; (* 用当前层数据区基址中的内容(正好是静态链SL数据,为上一层的基址)的作为新的当前层,即向上找了一层 *)
      l := l - 1 (* 向上了一层,l减一 *)
    end;
    base := b1 (* 把找到的要求的数据区基址返回 *)
  end(* base *);
begin
  writeln('start pl0'); (* PL/0程序开始运行 *)
  t := 0; (* 程序开始运行时栈顶寄存器置0 *)
  b := 1; (* 数据段基址为1 *)
  p := 0; (* 从0号代码开始执行程序 *)
  s[1] := 0; 
  s[2] := 0;
  s[3] := 0; (* 数据内存中为SL,DL,RA三个单元均为0,标识为主程序 *)
  repeat (* 开始依次运行程序目标代码 *)
    i := code[p]; (* 获取一行目标代码 *)
    p := p + 1; (* 指令指针加一,指向下一条代码 *)
    with i do 
      case f of (* 如果i的f,即指令助记符是下面的某种情况,执行不同的功能 *)
        lit: (* 如果是lit指令 *)
        begin
          t := t + 1; (* 栈顶指针上移,在栈中分配了一个单元 *)
          s[t] := a (* 该单元的内容存放i指令的a操作数,即实现了把常量值放到运行栈栈顶 *)
        end;
        opr: (* 如果是opr指令 *)
          case a of (* operator *) (* 根据a操作数不同,执行不同的操作 *)
            0: (* 0号操作为从子过程返回操作 *)
            begin (* return *)
              t := b - 1; (* 释放这段子过程占用的数据内存空间 *)
              p := s[t + 3]; (* 把指令指针取到RA的值,指向的是返回地址 *)
              b := s[t + 2] (* 把数据段基址取到DL的值,指向调用前子过程的数据段基址 *)
            end;
            1: (* 1号操作为栈顶数据取反操作 *)
              s[t] := -s[t]; (* 对栈顶数据进行取反 *)
            2: (* 2号操作为栈顶两个数据加法操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *) 
              s[t] := s[t] + s[t + 1] (* 把两单元数据相加存入栈顶 *)
            end;
            3: (* 3号操作为栈顶两个数据减法操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *) 
              s[t] := s[t] - s[t + 1] (* 把两单元数据相减存入栈顶 *)
            end;
            4: (* 4号操作为栈顶两个数据乘法操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := s[t] * s[t + 1] (* 把两单元数据相乘存入栈顶 *)
            end;
            5: (* 5号操作为栈顶两个数据除法操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := s[t] div s[t + 1] (* 把两单元数据相整除存入栈顶 *)
            end;
            6: (* 6号操作为判奇操作 *)
              s[t] := ord(odd(s[t])); (* 数据栈顶的值是奇数则把栈顶值置1,否则置0 *)
            8: (* 8号操作为栈顶两个数据判等操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := ord(s[t] = s[t + 1]) (* 判等,相等栈顶置1,不等置0 *)
            end;
            9: (* 9号操作为栈顶两个数据判不等操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := ord(s[t] <> s[t + 1]) (* 判不等,不等栈顶置1,相等置0 *)
            end;
            10: (* 10号操作为栈顶两个数据判小于操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := ord(s[t] < s[t + 1]) (* 判小于,如果下面的值小于上面的值,栈顶置1,否则置0 *)
            end;
            11: (* 11号操作为栈顶两个数据判大于等于操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := ord(s[t] >= s[t + 1]) (* 判大于等于,如果下面的值大于等于上面的值,栈顶置1,否则置0 *)
            end;
            12: (* 12号操作为栈顶两个数据判大于操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := ord(s[t] > s[t + 1]) (* 判大于,如果下面的值大于上面的值,栈顶置1,否则置0 *)
            end;
            13: (* 13号操作为栈顶两个数据判小于等于操作 *)
            begin
              t := t - 1; (* 栈顶指针下移 *)
              s[t] := ord(s[t] <= s[t + 1]) (* 判小于等于,如果下面的值小于等于上面的值,栈顶置1,否则置0 *)
            end;
            14: (* 14号操作为输出栈顶值操作 *)
            begin
              write(s[t]); (* 输出栈顶值 *)
              write(fa2, s[t]); (* 同时打印到文件 *)
              t := t - 1 (* 栈顶下移 *)
            end;
            15: (* 15号操作为输出换行操作 *)
            begin
              writeln; (* 输出换行 *)
              writeln(fa2) (* 同时输出到文件 *)
            end;
            16: (* 16号操作是接受键盘值输入到栈顶 *)
            begin
              t := t + 1; (* 栈顶上移,分配空间 *)
              write('?'); (* 屏显问号 *)
              write(fa2, '?'); (* 同时输出到文件 *)
              readln(s[t]); (* 获得输入 *)
              writeln(fa2, s[t]); (* 把用户输入值打印到文件 *)
            end;
          end; (* opr指令分析运行结束 *)
        lod: (* 如果是lod指令:将变量放到栈顶 *)
        begin
          t := t + 1; (* 栈顶上移,开辟空间 *)
          s[t] := s[base(l) + a] (* 通过数据区层差l和偏移地址a找到变量的数据,存入上面开辟的新空间(即栈顶) *)
        end;
        sto: (* 如果是sto指令 *)
        begin
          s[base(l) + a] := s[t]; (* 把栈顶的值存入位置在数据区层差l偏移地址a的变量内存 *)
          t := t - 1 (* 栈项下移,释放空间 *)
        end;
        cal: (* 如果是cal指令 *)
        begin (* generat new block mark *)
          s[t + 1] := base(l); (* 在栈顶压入静态链SL *)
          s[t + 2] := b; (* 然后压入当前数据区基址,作为动态链DL *)
          s[t + 3] := p; (* 最后压入当前的断点,作为返回地址RA *)
          (* 以上的工作即为过程调用前的保护现场 *)
          b := t + 1; (* 把当前数据区基址指向SL所在位置 *)
          p := a; (* 从a所指位置开始继续执行指令,即实现了程序执行的跳转 *)
        end;
        int: (* 如果是int指令 *)
          t := t + a; (* 栈顶上移a个空间,即开辟a个新的内存单元 *)
        jmp: (* 如果是jmp指令 *)
          p := a; (* 把jmp指令操作数a的值作为下一次要执行的指令地址,实现无条件跳转 *)
        jpc: (* 如果是jpc指令 *)
        begin
          if s[t] = 0 then (* 判断栈顶值 *)
            p := a; (* 如果是0就跳转,否则不跳转 *)
          t := t - 1 (* 释放栈顶空间 *)
        end;
      end(* with,case *)
  until p = 0; (* 如果p等于0,意味着在主程序运行时遇到了从子程序返回指令,也就是整个程序运行的结束 *)
  close(fa2) (* 关闭用于记录屏幕输入输出的fa2文件 *)
  (* PCODE代码的解释执行过程结束 *)
end(* interpret *);
begin (* main *)
  for ch := ' ' to '!' do (* 这个循环把ssym数组全部填nul *)
    ssym[ch] := nul;
  (* changed because of different character set
  note the typos below in the original where
  the alfas were not given the correct space *)
  (* 下面初始化保留字表,保留字长度不到10个字符的,多余位置用空格填充,便于词法分析时以二分法来查找保留字 *)
  word[1] := 'begin     ';
  word[2] := 'call      ';
  word[3] := 'const     ';
  word[4] := 'do        ';
  word[5] := 'end       ';
  word[6] := 'if        ';
  word[7] := 'odd       ';
  word[8] := 'procedure ';
  word[9] := 'read      ';
  word[10] := 'then      ';
  word[11] := 'var       ';
  word[12] := 'while     ';
  word[13] := 'write     ';
  (* 保留字符号列表,在上面的保留字表中找到保留字后可以本表中相应位置该保留字的类型 *)
  wsym[1] := beginsym;
  wsym[2] := callsym;
  wsym[3] := constsym;
  wsym[4] := dosym;
  wsym[5] := endsym;
  wsym[6] := ifsym;
  wsym[7] := oddsym;
  wsym[8] := procsym;
  wsym[9] := readsym;
  wsym[10] := thensym;
  wsym[11] := varsym;
  wsym[12] := whilesym;
  wsym[13] := writesym;
  (* 初始化符号表,把可能出现的符号赋上相应的类型,其余符号由于开始处的循环所赋的类型均为nul *)
  ssym['+'] := plus;
  ssym['-'] := minus;
  ssym['*'] := times;
  ssym['/'] := slash;
  ssym['('] := lparen;
  ssym[')'] := rparen;
  ssym['='] := eql;
  ssym[','] := comma;
  ssym['.'] := period;
  ssym['#'] := neq;
  ssym[';'] := semicolon;
  (* 初始化类PCODE助记符表,这个表主要供输出类PCODE代码之用 *)
  mnemonic[lit] := ' lit ';
  mnemonic[opr] := ' opr ';
  mnemonic[lod] := ' lod ';
  mnemonic[sto] := ' sto ';
  mnemonic[cal] := ' cal ';
  mnemonic[int] := ' int ';
  mnemonic[jmp] := ' jmp ';
  mnemonic[jpc] := ' jpc ';
  (* 我修改的代码:书上此处均为'xxx  '形式,即助记符后两个空格,通过上网查询原版程序确认为助词符前后各一空格。 *)
  (* 这样改的目的是使后面的输出结果比较美观 *)
  declbegsys := [constsym, varsym, procsym];
  statbegsys := [beginsym, callsym, ifsym, whilesym];
  facbegsys := [ident, number, lparen];
  (* page(output) *)
  (* 由于Turbo Pascal 7.0的文本文件处理方法与源程序中使用的方法有很大不同,因此下面的有关文件处理的代码进行了不少更改。 *)
  assign(fa1, 'fa1.txt'); (* 把文本文件fa1与fa1.txt文件关联起来,用于输出生成的类PCODE代码 *)
  rewrite(fa1); (* 建立并打开fa1.txt文件 *)
  write('input file?  '); (* 提示输入PL/0源程序名 *)
  write(fa1, 'input file? '); (* 同样的提示输出到fa1.txt文件 *)
  readln(fname); (* 获得键盘输入的文件名 *)
  writeln(fa1, fname); (* 把键盘输入打印到fa1.txt文件 *)
  {openf(fin,fname,'r');}
  assign(fin, fname); (* 把PL/0的源程序文件与fin关联 *)
  reset(fin); (* 打开fin所关联的PL/0源程序文件 *) 
  write('list object code ?'); (* 提示是否要列出类PCODE代码 *)
  readln(fname); (* 获得用户输入 *)
  write(fa1, 'list object code ?'); (* 同样的提示写到fa1.txt文件中 *)
  listswitch := (fname[1] = 'y'); (* 如果输入'y'开头的字符串,把listswitch标志置true,否则为false *)
  err := 0; (* 出错次数置0 *)
  cc := 0; (* 词法分析行缓冲区指针置0 *)
  cx := 0; (* 类PCODE代码表指针置0 *)
  ll := 0; (* 词法分析行缓冲区长度置0 *)
  ch := ' '; (* 词法分析当前字符为空格 *)
  kk := al; (* 置kk的值为允许的标识符的最长长度,具体用意见getsym过程注释 *)
  assign(fa, 'fa.txt'); (* 把fa.txt与fa关联。fa用于输出源程序 *)
  rewrite(fa); (* 建立并打开fa.txt *)
  getsym; (* 首次调用词法分析子程序,获取源程序的第一个词(token) *)
  block(0, 0, [period] + declbegsys + statbegsys); (* 开始进行主程序(也就是第一个分程序)的语法分析 *)
  (* 主程序所在层为0层,符号表暂时为空,符号表指针指0号位置 *)
  close(fa); (* 关闭文件 *)
  close(fa1); (* 关闭文件 *)
  if sym <> period then (* 主程序分析结束,应遇到表明程序结束的句号 *)
    error(9); (* 如果不是句号,出现9号错误 *)
  (* 以上可知,一个合法的PL/0源程序应由分程序和句号构成。 *)
  if err = 0 then (* 如果出错次数为0,可以开始解释执行编译产生的代码 *)
  begin
    assign(fa2, 'fa2.txt'); (* 把文本文件fa2与fa2.txt文件关联起来,用于输出类PCODE代码运行结果 *)
    rewrite(fa2); (* 建立并打开fa2文件 *)
    interpret (* 开始解释执行类PCODE代码 *)
  end
  else
    write('errors in pl/0 program'); (* 如果有错误,提示程序有错误 *)
  99: (* 这个标号原来是用于退出程序的,由于Turbo Pascal不支持跨过程的跳转,因此这里这个标号也没用了。 *)
  {closef(fin);}
  close(fin); (* 关闭源程序文件 *)
  writeln
end.
************************************************************************

体验Microsoft.NET–与初学者一起用.NET写猜数字游戏

体验.NET

微软公司正在领导一次新的互联网技术革命,这就是.NET。.NET是一种全新的基于Internet的编程模型。2月13日微软公司在美国正式发布了全新的基于.NET平台的开发工具——Visual Studio.NET,这标志着微软.NET时代的全面到来。

我想通过本文,和大家一起用.NET开发一个简单的小游戏——猜数字,与大家一起分享我在学习.NET技术中的一些心得体会,分享.NET带给我们的全新的开发体验。

体验Microsoft .NET之基础篇

作为一个全新的开发平台,在Visual Studio.NET发布之前,微软公司已经正式发布了.NET Framework的SDK,这是我们进行.NET开发的基本条件。这个曾经被称为是NGWS(Next Generation Windows Services)的SDK提供给了我们包括C#(读音为C Sharp)编译器、VB编译器、ASP.NET运行环境等一系列.NET支持平台和相关的文档。

SDK只是一个简单的开发平台,如果你安装了.NET Framework SDK,你就可以开发一系列的.NET应用,但是你将无法充分体验到.NET带给我们的快速开发的乐趣,你仍需要使用古老的MSDOS命令行的方式来编译你的程序。因此,我们还需要安装Visual Studio.NET集成开发环境,有了它我们才可以真正体验到.NET开发的乐趣。Visual Studio.NET中文正式版已于3月22日正式发布。由于条件所限,本文中使用的Visual Studio.NET为英文正式版,但所涉及到的程序均可以在中文正式版中编译运行。

Microsoft Visual Studio.NET是专门开发基于.NET平台应用的集成开发环境,包括Visual Basic.NET、Visual C++.NET和最新的Visual C#.NET等一系列的开发工具,通过这个强大的开发环境,我们可以轻松构造包括Windows Forms应用程序、ASP.NET或是XML Web Service在内的各种.NET应用。

说了这么多,你该明白该怎么做了吧,打开您的计算机,安装.NET Framework SDK和Visual Studio.NET,然后就和我一起开始我们的.NET之旅吧!

体验Microsoft .NET之C#程序语言

C#语言是.NET平台中一个很重要的组成部分,它是由微软公司领导研究开发的新一代面向组件的编程语言,它既保持了C++语言所具有的强大的功能,又在此基础上提供了更多简单、安全的编程手段。.NET平台自身的很大一部分就是用这种新型的C#语言来开发的。

依照惯例,我们还是从“Hello World!”开始,体验一下C#语言。下面就是一个典型的C# HelloWorld程序:

using System;
public class Hello
{
public static void Main()
{
Console.WriteLine(“Hello world!”);
}
}

怎么样?不难吧。有点像C,有点像C++,有点像Visual Basic,更像JAVA。

程序的第一行指定了一个对于System名字空间(Namespace)的引用,引用了这个名字空间,我们下面才能方便的使用这个名字空间中的类,例如下面的Console类就是属于System这个名字空间的。第二行开始我们定义了一个Hello类,它包含一个静态的Main方法(Method),C#中没有了成员函数的概念,原来的成员函数现在称为是“方法”,而原来的成员变量被称作“字段(Field)”。Main方法是一个C#程序的开始。在我们的例子中,Main方法唯一的一行可执行代码调用了系统Console类的输出方法显示字符串“Hello world!”。

下面我把C#与C++进行一个简单的对比:首先,C#是完全面向对象的程序设计语言,它不再有全局的函数,任何函数都被包含在某个类中成为方法。C#中不再需要函数的前向声明,你所需要的函数可以定义在类中的任何位置。C#在最大程度上避免了指针的使用,同时,原来C++中的::、->和.操作符被统一为了.。C#不再使用#include来包含其它的程序文本,这使得.NET平台的语言无关性得以体现。举个例子,你可以使用Viusal Basic.NET写一个类,然后用C#去调用它甚至在它基础上派生新的类,这使得软件复用达到了一个新的境界。

下面你就可以试一试了,这里,我们暂时不使用Visual Studio.NET,我们用命令行的方式来编译运行这个程序。

打开记事本,输入上面的源代码,注意大小写,然后存盘,把文件扩展名改成.cs(这里我们把这个文件存为hello.cs),这是C#源程序要求的扩展名。然后打开一个DOS窗口,找到你存放.cs文件的目录,输入

csc hello.cs

系统就开始编译你的程序,如果没有出错的话,会生成hello.exe文件,运行这个文件,就可以看到屏幕上的输出了。

下面我们来使用Visual Studio.NET来进行C#程序的开发。

首先肯定是要启动Visual Studio.NET软件。下面就是它的开发界面,很漂亮也很友好。

Visual Studio .NET主界面

Visual Studio .NET主界面

我们点击起始页面上的“New Project”按钮新建项目,在弹出的“New Project”对话框中选择项目类型为“Visual C# Project”,并选取“Console Application”(控制台应用程序)模板,输入合适的项目名称(我们这里用GuessNum1)和存放位置,确定。这时系统会为我们生成一个最简单的C#应用程序的框架,我们可以在其基础上修改成我们自己的程序。

新建项目

新建项目

我们把系统生成的程序框架修改成下面的样子:

using System; //引用系统System名字空间

namespace GuessNum1 //定义属于本程序的名字空间
{
///<summary>
/// Summary description for Class1.
///</summary>
class Class1 //系统自动生成的Class1
{
///<summary>
/// The main entry point for the application.
///</summary>
[STAThread]
static void Main(string[] args) //静态Main方法
{
//
// TODO: Add code to start application here
//
GuessNum gn = new GuessNum(); //GuessNum 类生成一个对象
gn.GenerateRandomNumber(); //产生随机数作为被猜的数字
string answer; //字符串变量,用于保存用户输入的猜测值
do
{
answer = Console.ReadLine();
Console.WriteLine(gn.GetTip(answer));
} while(!gn.IsAnswerRight(answer)); //反复要求用户猜数直到猜测正确
}
}
class GuessNum //我们自己定义的GuessNum类,以后还要多次用到
{
private string correctAnswer; //GuessNum类的私有字段(成员变量),用于保存正确答案
public GuessNum()
{
correctAnswer = “”;
}
public GuessNum(string answer)
{
correctAnswer = answer;
}
public string GenerateRandomNumber()
{
int [] a = new int [10]; //开辟一个十个单元的整形数组
//09十个数字依次填入a[0]a[9]
for(int i = 0; i < 10; i++)
a[i]=i;
//把这个十数字随机打乱
Random j = new Random();
for(int i = 0; i < 10; i++)
{
int t = j.Next(10);
int s;
s = a[i];
a[i] = a[t];
a[t] = s;
}
//取前四个数字组成四位数做为猜数字的正确答案
correctAnswer = a[0].ToString() + a[1].ToString() + a[2].ToString() + a[3].ToString();
return correctAnswer;
}
public string GetTip(string answer) //本方法为用户提供猜测提示,目前还没有真正完工
{
if (IsAnswerRight(answer))
return “4A0B”;
else
return “Wrong!”;
}
public bool IsAnswerRight(string answer) //本方法判断用户的猜测是否正确
{
if (answer == correctAnswer)
return true;
else
return false;
}
}
}
相信在代码输入的过程中你一定会体验到Visual Studio.NET强大的代码编辑功能,自动缩进对齐、智能感应、代码折叠应有尽有。

上面的程序本身没有什么太多的可以解释的地方,可以看到,这个程序随机产生了一个四位数字各不相同的四位数,然后等待用户输入,如果输入正确,就显示“4A0B”(这个不用我再详细解释了吧,玩过猜数字的朋友都知道这个提示的含义,A前面的数字表示你猜对了并放对位置的数字个数,B前面的数字表示你猜对了数字但放错了位置的数字的个数),如果猜错了,就显示“Wrong!”,让用户重新猜测。很明显这个游戏现在还不好玩,猜错了仅仅提示“Wrong!”是远远不够的,应该告诉用户猜对了几个数字和放错位了几个数字才行。不要着急,我们会在后面慢慢完善这个程序。

这个程序中有一个值得注意的地方是它使用了“///”形式的注释,这样的注释可以用来自动产生程序文档,如果在里面加上一些标记还可以产生XML形式的文档。

现在你就可以按下Ctrl+F5键运行程序了,输入一个4位数,如果正确,系统为提示“4A0B”并退出程序,如果不正确就输出“Wrong”。由于没有足够的提示,恐怕你是不太可能猜到正确的数字的,所以还是把窗口关了,我们继续下面的内容。

体验Microsoft .NET之Windows Forms程序设计

前面我们已经在控制台环境下进行了一点C#程序的开发,目的只是让大家熟悉一下C#语言,下面我们将把我们在控制台下开发的程序移植到Windows窗口界面中。

这里,我们首先引入Windows Forms的概念:Windows Forms是微软在.NET平台下提供的一种程序构架(Framework),它可以支持多种程序语言,主要用于开发客户端的窗口应用程序。

下面我们就用Visual Studio.NET帮我们生成一个简单的Windows Forms源程序,我们将在它的基础上工作,方法如下:

打开Visual Studio.NET,点击“New Project”,选择项目类型为“Visual C# Project”,然后选择程序模板为“Windows Application”,输入项目名称“GuessNum2”,确定。

我们按F5键编译运行这个程序,一个空白的窗口就出现了。我们现在要做的就是给这个空白窗口加上我们需要的功能。

首先,我们进行可视化的界面部分的构造,从左边的Toolbox中找到合适的控件,拖曳到空白窗口上,使它成为下面的样子:

窗体设计器

窗体设计器

要说明的一点是,在构造TextBox2时,要注意把它的MultiLine属性和ReadOnly属性设为True。并把ScrollBars属性设为Vertical。控件属性值的修改是通过选中控件后用Visual Studio.NET集成环境右下角的“Properties”区域来实现的,修改过的属性,其属性值的字体会变粗。这个Properties区域还有一个功能就是可以为控件连接不同事件的响应函数,可以通过点击上面的Events按钮来切换功能。

属性设置

属性设置

双击窗体的空白部分,系统自动为你生成了这个窗体的Load事件响应函数Form1_Load(),我们先不着急修改它,先把在上一个程序中写的GuessNum类的代码(不包括Class1类的代码)贴在当前代码窗口中的代码的最后一个}前,使这个类成为当前的GuessNum2名字空间中的一个类。

然后在Form1类中写上下面的代码,即在Form1类中定义一个GuessNum类的对象gn。由于C#不要求前向声明,应此这行代码可以写在Form1类中的任何位置,当然不包括Form1类的方法中,如果你把这行代码写在Form1类的某个方法中,这就不是在类中定义对象而变成是在某个方法中定义的局部对象了。

private GuessNum gn;

然后我们再修改Form1_Load(),把它修改成下面的样子:

private void Form1_Load(object sender, System.EventArgs e)

{

textBox1.Text = “”;

button1.Text = “Guess!”;

//GuessNum类生成一个对象,然后让它产生被猜的数字,最后把这个数字显示在TextBox2

//之所以把它显示在TextBox2中是为了便于你偷看答案,否则凭空猜是几乎不可能猜到答案的

//我们会在后面的程序中完善GuessNum,使它的GetTip()方法可以真正起作用

gn = new GuessNum();

textBox2.Text = gn.GenerateRandomNumber();

}

点击代码编辑器上部的标签,切换回窗口设计器,双击button1按钮,为它添加按钮响应函数如下:

private void button1_Click(object sender, System.EventArgs e)

{

textBox2.Text = (textBox1.Text + ” ” + gn.GetTip(textBox1.Text) + “/r/n” ) + textBox2.Text;

if (gn.IsAnswerRight(textBox1.Text))

textBox2.Text = “Congratulations! You get it!/r/n” + textBox2.Text;

textBox1.Text=””;

}

我们再次使用F5编译运行这个程序,看,很方便的,我们就把刚才在控制台下运行的程序改成了Windows应用程序。

体验Microsoft .NET之ASP.NET

下面我们来看看.NET的重要组成部分ASP.NET的情况。我们将演示用ASP.NET迅速开发一个可以在Web上玩的猜数字游戏。

在Visual Stuido.NET中,我们新建一个ASP.NET应用程序,操作方法与上面的基本相同,只不过在选择项目模板时选择为“ASP.NET Web Application”,这次,我们用GuessNum3作为我们的项目名称,确定后系统会自动与IIS服务器联系,为你建立好虚拟目录和一些相关的文件。

同前面一样,我们按F5运行这个ASP.NET项目,同样的我们也是得到了一个空白的页面。

下面要做的工作与前面的类似,首先要在空白的ASP.NET页面上添加服务器控件。什么是服务器控件?简单的说,服务器控件就是在ASP.NET页面上放置的一种控件,这种控件的正常工作是在服务器端完成的,服务器在处理完控件动作后,再生成标准的HTML文件发送给客户端。比如:我们在页面上放置一个Label控件,并通过程序改变它上面的文字为“Hello World”,服务器在收到用户访问这个页面的请求时,它对Label控件进行控制,改变它的标题属性,最终生成HTML文件发送给用户,用户对于这幕后的一切并不知道,他最终收到的数据,就是一个包含着“Hello World”字符串的HTML页面。

在页面上添加服务器控件的方法与前面在窗体上添加控件的方法完全一致,只要从Toolbox中点中相应的控件,拖放到页面上就可以了。我们最终完成后的页面是这样的:

ASP.NET页面设计器

ASP.NET页面设计器

同样的,不要忘了把textBox2的ReadOnly属性设为True,把TextMode属性设为MultiLine,。另外为了后面的操作可以方便一些,请把这三个控件的(ID)属性的第一个字母改成小写,即把这三个控件的ID由原来的TextBox1、TextBox2、Button1改成textBox1、textBox2和button1。

接下来要做的工作也许会让你觉得有点似曾相识:

双击页面空白处,系统为你生成Page_Load()方法,不管它,在源程序的最后一个}前加入我们上一个程序中的GuessNum类,然后在WebForm1类中加入一行:

private GuessNum gn;

然后修改Page_Load()成下面的样子:

private void Page_Load(object sender, System.EventArgs e)

{

// Put user code to initialize the page here

//判断是第一次访问页面还是刷新过页面

//如果是第一次访问,产生随机数并存在Session

//如果不是第一次访问,从Session中读出前面产生的值用于构造GuessNum对象

if (!Page.IsPostBack)

{

textBox1.Text = “”;

button1.Text = “Guess!”;

gn = new GuessNum();

//下面用到了ASP中熟悉的对象Session,但是ASP.NET中的SessionASP中的更强大

Session[“answer”] = gn.GenerateRandomNumber();

//同上一个Windows Forms程序一样,我们把标准答案先显示在textBox2中,便于你测试程序

textBox2.Text = Session[“answer”].ToString();

}

else

gn = new GuessNum(Session[“answer”].ToString());

}

返回Web表单设计器,双击Button按钮,在出现的button1_Click()中加入与上一个Windows Forms程序中相同的代码。

好了,运行一下试试。不出所料,一个可以在Web上运行的猜数字游戏已经初具雏形了。

经过上面的演示,你是不是对ASP.NET有了一个初步的认识呢?在ASP.NET中,不用再像从前在ASP中那样把脚本插在HTML文件中,进行了界面设计与程序设计的分离(把页面设计的部分放在一个.aspx文件中,把代码部分放在一个.cs或.vb的代码文件中,该技术被称为Code Behind),并且使ASP.NET页面也呈现出一种事件驱动的特性。这就使得代码的重用性得到大大的加强,就像你看到的那样,我们在ASP.NET中使用的代码与在Windows Forms桌面应用程序开发中使用的代码是相当一致的。

另一方面,ASP.NET的代码分离技术不但提高了开发效率,也提高了运行效率,ASP.NET不再是解释执行的,它是在用户第一次访问一个新的页面时,对那个页面的代码进行编译,以后的用户访问就执行的是编译后的代码,运行效率自然有了巨大的提高。这也是为什么我们感觉的ASP.NET网页第一次访问时速度特别慢的原因。

从用户的角度来看,ASP.NET也更容易使用了,访问一个ASP.NET页面就像是使用一个应用程序一样。事实上,我们上面编写的Windows Forms的应用程序也不同于一般的应用程序,如果把它放在Web上,当用户点击指向它的链接时,浏览器会直接自动下载并运行它(当然,微软公司做了很多工作来保证其安全性)。在.NET时代,网络与桌面应用程序的界线已经越来越不明显。

体验Microsoft .NET之Web Service

Web Service是微软在.NET中引入的一个较新的概念。在传统的应用程序开发过程中,开发人员一直通过集成本地系统服务来构建应用程序。现在Web Service的出现,可以让开发人员轻松的构建具有复杂结构的N层系统。Web Serivce是这样的一种应用程序,它使用标准的HTTP协议和XML,将软件的功能体现在网络上。明确一点说,就是在Web服务器上开发一个应用程序,它可以响应远程程序的请求、接受运程程序发来的数据,处理后再将数据返回。

下面我们想通过Web Service为我们的猜数字游戏提供一个产生提示信息的的服务,也就是说,客户端应用程序将猜数字的标准答案与用户所猜的数字提供给服务器上的Web Service,服务器判断用户猜测的正确性,并返回猜对并放对位置的数字个数和猜对但未放对位置的数字个数。有些朋友一定会问,这个操作明明可以在本地完成,为什么要转个大圈子,在服务器上用Web Service完成呢?这个操作确实可以直接在上面的C#程序中添加代码完成,我们不这样做的原因就是为了为大家演示Web Service的用途。你可以设想程序要访问远程服务器上的一个数据库,根据用户提交的不同信息,返回不同的数据,这时Web Service就大有用武之地了。

首先,我们还是使用Visual Studio.NET为我们生成一个空的Web Service项目。与前面不同的是,这一次,我们采用.NET中另一种重要的语言——Visual Basic.NET——来开发我们的Web Service,这没有什么特殊的意思,只不过想与大家一起体验一下全新的Visual Basic.NET语言。

打开Visual Studio.NET,点“New Project”,在Project Type中选择Visual Basic Project,在Template中选择ASP.NET Web Service,在下面输入工程名字GuessNumService,确定。

工程构造好后,我们可以看到一个设计页面,上面有两行字,点“click here to switch to code view”直接切换到代码编辑视图,开始我们的代码编写。设计页面主要是用于添加一些组件或数据库连接。

在代码视图中,我们可以看到一个被注释掉的HelloWorld函数,这其实是一个范例,告诉大家建立Web Service的方法,按照它的样子,我们输入下面的代码:

‘ <WebMethod()> 是给函数指定的一个属性(Attribute),指明这个函数将做为一个Web Service中的函数向外发布

<WebMethod()> Public Function GetTip(ByVal correctAnswer As String, ByVal userAnswer As String) As String

Dim i As Integer

Dim j As Integer

Dim a As Integer

Dim b As Integer

For i = 1 To 4

For j = 1 To 4

If Mid(correctAnswer, j, 1) = Mid(userAnswer, i, 1) Then

If j = i Then

a += 1 ‘VB程序员常常羡慕C++程序员这种简洁的写法,现在VB的程序员也可以用了!

Else

b += 1

End If

End If

Next

Next

下面用到的ToString()方法几乎是任何一种类型的数据都支持的类型转换函数

VB中如何把整型的4转成字符串型?STR(4)吧。在VB.NET中你可写成4.ToString()

GetTip = a.ToString() + “A” + b.ToString() + “B”

End Function

下面我们就可以来测试一下这个Web Service了,按F5键,Visual Studio.NET自动打开IE来测试这个Web Service,我们看到下面的画面:

Web Service

Web Service

这就是.NET为我们自动生成的服务测试页面,这个页面上列出了当前的Service1服务中提供的所有函数,现在只有一个GetTip()。同时这个页面上还提供了一个Service Description的链接,点击它,可以看到以XML描述的服务说明,我们称之为WSDL,即Web Service Description Language。

这里,我提醒大家把浏览器地址栏中的地址Copy下来,一会儿我们会用到它,在我的机器上这个地址是http://localhost/GuessNumService/Service1.asmx,从这里,我们也可以看出,Web Service的文件扩展名是asmx。

现在我们点击“GetTip”来测试这个Web服务,分别在correctAnswer和userAnswer两个文本框中输入数字,然后点击Invoke,结果就会以XML的形式返回。

比如我们分别输入3684和4628,这样的话,用户是猜对了一个数字“6”,还猜到了两个数字“4”和“8”,但放错了位置,所以返回的提示应该是1A2B,测试一下,果然如此!

测试Web Service

测试Web Service

Web Service XML返回结果

Web Service XML返回结果

Web Service 试验成功!我们终于可以开始构造一个完整的猜数字游戏了!

新建一个Visual C#的Windows Application(你也可以直接打开前面做好的GuessNum2,我们先在要做的只是在它基础上的修改),命名为GuessNumFinal,与前面做GuessNum2时一样设计游戏窗体,并以同样的方法,把GuessNum类加入GuessNumFinal名字空间,在Form1类中添加一个GuessNum的私有成员,然后添加窗体的Form1_Load和按钮的button1_Click方法。

下面要做的,就是要修改GuessNum类的GetTip方法,使它不再简单的返回一个“Wrong!”而是通过调用Web Service,把标准答案和用户输入提供给它,让它返回一个“xAyB”形式的提示字符串,然后再把这个字符串返回。当然,你也可以不修改写GuessNum,而是从它基础上派生一个新类,这个工作留给你自己去试验。

说的很容易,做起来呢?也不难!你不用担心要自己用WinSock写一个网络应用程序去访问Web Service,并自己对返回的XML文件进行处理,这些工作Visual Studio.NET已经帮我们做好了!

在Visual Studio.NET集成界面的右上角有一个Solution Explorer,我们用鼠标在里面的Reference上右键单击,然后选择“Add Web Reference”来添加一个对Web Service的引用。

添加Web引用

添加Web引用

在弹出的Add Web Reference对话框的地址栏中输入前面记录下来的地址,回车。等出现了Web Service的测试页面后,点击“Add Reference”按钮。

添加Web Reference

添加Web Reference

这时,我们就可以看到在Solution Explorer中新出现了一个Web Reference,里面有我们的Web Service。其实,我们通过Visual Studio.NET的帮助用这样简单的操作完成的是一系列的工作。首先是根据输入地址从服务器上获取WSDL,然后再根据WSDL的描述生成一个C#的代理类(Proxy Class),然后再把它添到工程中。

现在,我们就可以方便的使用这个类,来使我们的程序与Web Service联系起来,完成我们的需要的操作。

下面可以真正修改GuessNum的GetTip()的代码了。首先,我们在程序源代码的最前面加入:

using GuessNumFinal.localhost;

引用一下我们这个Web Service的代理类所在的名字空间,以方便我们后面代码的书写。(如果你不是新建了GuessNumFinal项目,而是在GuessNum2的基础上修改的话,请把上面的GuessNumFinal改成GuessNum2。)

接下来把GuessNum类的GetTip()方法改成如下的代码:

public string GetTip(string answer)

{

Service1 service = new Service1(); //GuessNumFinal.localhost名字空间中的Service1类生成一个对象

return service.GetTip(correctAnswer, answer); //呼叫Web Service,得到返回值后返回

}

最后,找到Form1_Load()方法中的

textBox2.Text = gn.GenerateRandomNumber();

把它改成下面的代码,我们不再需要偷看答案了!

textBox2.Text = “”;

gn.GenerateRandomNumber();

至此,我们程序终于完成了!按下F5运行程序,来体验一下自己用.NET编写的第一个游戏程序!

体验Microsoft .NET之结尾篇

我们的猜数字游戏做完了,我们的.NET之旅也将接近尾声。作为微软公司一个全新的平台,虽然目前有关.NET的争论还很多,但很多人还是相信.NET会在微软公司的大力支持下越来越成熟,.NET定将成为微软平台软件开发一个里程牌。

为了让大家更好的去了解和学习.NET,最后我在下面列出一些好的参考资料供大家参考:

1. 包含在.NET Framework SDK中的Samples and QuickStart Tutorials

2. 包含在Visual Studio.NET 中的Microsoft Visual Studio .NET Documentation

3. 微软公司网站,MSDN网站

4. http://www.cndot.net等国内外.NET技术网站