3. 词法分析
核心任务:从字符流当中识别词法单元(分词+归类)
附加任务:过滤空白字符、记录位置信息、…
模式(pattern)
- 一个模式描述一类词法单元可能具有的形式
- 关键字if:“字符序列if”
- 符号(:“字符序列(”
- 标识符:“由下划线与大小写字母组成的序列”
- 数字:“由符号0到9组成的序列,前面可加上-”
词法分析 = 定义模式 + 识别模式
正则表达式(regex)
串和语言
见课件,问求一讲过(有一些概念还是要辨析一下)
自动机
最小化可以跳过,这个如果学过形式语言和自动机的话应该可以 handle,不过我们这年考试不考