跳转至

3. 词法分析

核心任务:从字符流当中识别词法单元(分词+归类)

附加任务:过滤空白字符、记录位置信息、…

模式(pattern)

  • 一个模式描述一类词法单元可能具有的形式
  • 关键字if:“字符序列if”
  • 符号(:“字符序列(”
  • 标识符:“由下划线与大小写字母组成的序列”
  • 数字:“由符号0到9组成的序列,前面可加上-”

词法分析 = 定义模式 + 识别模式

正则表达式(regex)

串和语言

见课件,问求一讲过(有一些概念还是要辨析一下)

自动机

最小化可以跳过,这个如果学过形式语言和自动机的话应该可以 handle,不过我们这年考试不考