Flex和Bison
Flex和Bison是Linux和Unix环境下两个非常强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。下面我将详细介绍Flex和Bison的基本概念、功能、用法以及它们之间的关系。
一、Flex
1. 基本概念
Flex(其前身是Lex)是一个词法分析器生成器。它接受一组正则表达式和对应的动作(通常是C语言代码),然后生成一个C程序(词法分析器),该程序能够识别和处理输入文本中的词法单元(如标识符、关键字、运算符等)。
2. 功能
- 词法分析:将输入文本分割成一个个词法单元(token),每个单元都具有一定的意义。
- 正则表达式匹配:使用正则表达式在输入文本中查找特定的字符模式。
- 动作执行:当匹配到正则表达式时,执行相应的动作(如计数、打印等)。
3. 用法
Flex的使用通常包括以下几个步骤:
- 编写Flex程序(.l文件),定义正则表达式和对应的动作。
- 使用Flex工具编译Flex程序,生成C语言源代码(通常是lex.yy.c)。
- 编译生成的C代码,并链接必要的库(如libfl),生成可执行文件。
- 运行可执行文件,对输入文本进行词法分析。
4. Flex程序示例
%{
#include <stdio.h>
#include "y.tab.h" /* 假设与bison一起使用,包含由bison生成的头文件 */ void count() { /* 这里可以添加一些用于调试或统计的代码 */
}
%} %option noyywrap %% /* 关键字 */
PROGRAM|VAR|VAR_INPUT|VAR_OUTPUT|VAR_IN_OUT|VAR_EXTERNAL|TEMP|TEMP_VAR|END_PROGRAM|
BEGIN_PROGRAM|END_VAR|BEGIN_VAR|END_STRUCT|BEGIN_STRUCT|FUNCTION_BLOCK|FUNCTION|
METHOD|INTERFACE|END_INTERFACE|END_FUNCTION_BLOCK|END_FUNCTION|END_METHOD|
TRUE|FALSE|VAR_ACCESS|AT|RETAIN|CONSTANT|TYPE|ALIAS|ARRAY|STRUCT|OF|POINTER|
REF_TO|MOD|DIV|AND|OR|XOR|NOT|SHL|SHR|ROL|ROR|ASGN|ADD|SUB|MUL|REAL|INT|BOOL|
STRING|TIME|DATE|DURATION|LREAL|DINT|UINT|SINT|BYTE|WORD|DWORD|LWORD|USINT|
S5TIME|TIME_OF_DAY|DATE_AND_TIME|TIMESTAMP|TOD|DT|TS { return yytext[0]; } /* 标识符 */
[a-zA-Z_][a-zA-Z0-9_]* { yylval.str = strdup(yytext); return IDENTIFIER; } /* 数字(整数和浮点数) */
[0-9]+(\.[0-9]+)?([eE][-+]?[0-9]+)? { yylval.double_val = atof(yytext); return NUMBER; } /* 字符串 */
\"([^\\\"\n]|(\\.))*\" { yylval.str = strdup(yytext+1); yylval.str[strlen(yylval.str)-1] = '\0'; return STRING; } /* 注释(单行和多行) */
//.* { /* 忽略单行注释 */ }
/* 和多行注释可能需要更复杂的规则来处理嵌套,但这里简化处理 */
/\/*([^*]|\*+[^/*])*\*/ { /* 忽略多行注释 */ } /* 空白字符 */
[ \t\n]+ { /* 忽略 */ } /* 操作符和分隔符 */
[:=.,;(){}\[\]+-*/%<>^|&!~] { return yytext[0]; } /* 其他字符 */
. { fprintf(stderr, "Unknown character '%s'\n", yytext); return ERROR; } %% int yywrap(void) { return 1;
} int main(void) { yylex(); return 0;
} /* 注意:
1. 关键字列表可能不完整,需要根据实际的ST语言规范进行扩展。
2. 注释的处理可能需要更复杂的Flex规则来正确处理嵌套注释,但这里为了简化而省略了。
3. 确保yylval的结构和类型与你的解析器(如bison生成的)兼容。
4. 编译时可能需要链接到flex库和bison生成的解析器。
*/
在这个Flex程序中,我定义了几个部分来匹配ST语言的关键元素:
- 关键字:列出了ST语言中可能使用的一些关键字。注意,这里的关键字列表是不完整的,你需要根据实际的ST语言规范进行扩展。
- 标识符:匹配以字母或下划线开头,后跟字母、数字或下划线的字符串。
- 数字:匹配整数和浮点数。
- 字符串:匹配被双引号包围的字符串,其中可以包含转义字符。
- 注释:简化了单行和多行注释的处理。注意,多行注释的处理可能需要更复杂的规则来正确处理嵌套情况。
- 空白字符:被忽略的空格、制表符和换行符。
- 操作符和分隔符:匹配ST语言中常用的操作符和分隔符。
- 其他字符:任何不匹配上述规则的字符都将被视为未知字符,并打印错误信息。
二、Bison
1. 基本概念
Bison(其前身是Yacc)是一个语法分析器生成器。它接受一个上下文无关文法(CFG)和对应的动作(也通常是C语言代码),然后生成一个C程序(语法分析器),该程序能够根据文法规则分析输入文本的结构,并生成相应的语法树或执行相应的动作。
2. 功能
- 语法分析:确定输入文本中的词法单元是如何彼此关联的,即构建语法树。
- 错误处理:在语法分析过程中检测并报告错误。
- 代码生成:根据语法树生成目标代码(尽管这通常不是Bison的直接功能,但语法树可以用于此目的)。
3. 用法
Bison的使用也包括类似的步骤:
- 编写Bison程序(.y文件),定义文法规则和对应的动作。
- 使用Bison工具编译Bison程序,生成C语言源代码(通常是y.tab.c和y.tab.h)。
- 编译生成的C代码,并链接必要的库(如libbison),生成可执行文件。
- 运行可执行文件,对输入文本进行语法分析。
4. Bison程序示例
%{
#include <stdio.h>
#include <stdlib.h> void yyerror(const char *s); // 假设有一些用于存储解析结果的数据结构
// 例如,一个全局的符号表或AST节点 %} %token IDENTIFIER NUMBER STRING
%token PROGRAM VAR VAR_INPUT VAR_OUTPUT VAR_IN_OUT VAR_EXTERNAL TEMP TEMP_VAR
%token BEGIN_PROGRAM END_PROGRAM BEGIN_VAR END_VAR BEGIN_STRUCT END_STRUCT
%token FUNCTION_BLOCK FUNCTION METHOD INTERFACE END_INTERFACE END_FUNCTION_BLOCK END_FUNCTION END_METHOD
%token TRUE FALSE
%token OPERATOR /* 假设我们有一个通用的OPERATOR token用于所有操作符 */ %start program %% program: PROGRAM IDENTIFIER ';' block { printf("Parsed a program\n"); } ; block: /* 这里可以添加更复杂的块结构,如BEGIN_VAR ... END_VAR, BEGIN_PROGRAM ... END_PROGRAM等 */ declarations ; declarations: /* 变量声明 */ VAR declarations_list ';' | /* 空声明列表 */ {
$$= NULL; /* 假设我们有一个返回类型,这里用NULL表示空 */ } ; declarations_list: IDENTIFIER ':' type | declarations_list ',' IDENTIFIER ':' type ; type: /* 这里可以添加对类型的解析,如INT, REAL, BOOL等 */ IDENTIFIER ; /* 更多的语法规则可以根据需要添加 */ %% void yyerror(const char *s) { fprintf(stderr, "%s\n", s);
} int main(void) { yyparse(); return 0;
} // 注意:这个示例中的语法规则非常简化,并且没有处理ST语言的许多特性。
// 你需要根据实际的ST语言规范来扩展这些规则。
重要说明:
-
Token定义:在Bison文件中,我们使用
%token指令来定义由Flex生成的词法单元(tokens)。这些tokens应该与Flex文件中定义的tokens相匹配。 -
起始符号:
%start program指定了语法分析的起始符号。在这个例子中,我们期望输入以PROGRAM关键字开始。 -
语法规则:我们定义了几个简单的语法规则来解析程序、块和变量声明。这些规则可以根据需要进行扩展和修改。
-
错误处理:
yyerror函数用于处理解析过程中的错误。 -
主函数:
main函数调用yyparse()来启动解析过程。
注意:
- 这个Bison程序是一个非常简化的示例,它不会处理ST语言的全部特性。
- 你需要根据实际的ST语言规范来扩展和修改语法规则。
- 你可能还需要实现一些额外的功能,如符号表管理、抽象语法树(AST)构建等。
- 编译Bison程序时,你需要使用Bison工具生成C代码,并将其与Flex生成的词法分析器代码以及任何额外的C代码一起编译。通常,这可以通过在Makefile中添加适当的规则来完成。
三、Flex和Bison的关系
Flex和Bison通常一起使用来构建编译器或解析器。Flex负责词法分析,将输入文本分割成词法单元;Bison则负责语法分析,确定这些词法单元是如何根据文法规则关联的。Flex生成的词法分析器可以作为Bison生成的语法分析器的输入源,从而实现完整的编译过程。
四、总结
Flex和Bison是Linux和Unix环境下强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。Flex通过正则表达式进行词法分析,而Bison则通过上下文无关文法进行语法分析。两者通常一起使用,以构建完整的编译或解析过程。
相关文章:
Flex和Bison
Flex和Bison是Linux和Unix环境下两个非常强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。下面我将详细介绍Flex和Bison的基本概念、功能、用法以及它们之间的关系。 一、Flex 1. 基本概念 Flex(其…...
Matlab-FPGA 小数转换为定点二进制小数脚本和转coe文件格式脚本
Matlab-FPGA 小数转换为定点二进制小数脚本: % 更新于2023年6月17日,修改旋转因子文件,不修改fpga %首先明确我们的二维FFT的数组维数,此为1024*8的二维矩阵,1024行,8列 column 1024; row 8; nk[]; Ncolumn*row; fo…...
逆向案例二十三——请求头参数加密,某区块链交易逆向
网址:aHR0cHM6Ly93d3cub2tsaW5rLmNvbS96aC1oYW5zL2J0Yy90eC1saXN0L3BhZ2UvNAo 抓包分析,发现请求头有X-Apikey参数加密,其他表单和返回内容没有加密。 直接搜索关键字,X-Apikey,找到疑似加密位置,注意这里…...
CSS 导航栏:设计、定制与优化
CSS 导航栏:设计、定制与优化 CSS(层叠样式表)是网页设计中不可或缺的一部分,它允许开发者通过定义样式来控制网页的布局和外观。在网页设计中,导航栏是一个关键元素,它帮助用户浏览网站并找到他们感兴趣的…...
JS 如何处理链接被用户点击中键的操作
今天在开发中遇到一个问题,在使用类似Bootstrap中的Tabs组件时,当在tab导航链接点击中键时会打开一个新的窗口访问链接,于是我尝试在别的普通链接上点击中键时也会如此,我猜测这是浏览器的默认行为。 由于我开发的是一个浏览器在…...
Android 11 使用HAL层的ffmpeg库(1)
1.frameworks/av/media目录下面的修改 From edd6f1374c1f15783d9920ebda22ea915e503775 Mon Sep 17 00:00:00 2001 From: GW00219471 <zhumingxingnoboauto.com> Date: Wed, 17 Jan 2024 15:16:10 0800 Subject: [PATCH] ?UTF-8?q?[V35CUX-4542]:E7A7BBE6A48Dcux20E8…...
友力科技数据中心搬迁方案
将当前运行机房中的所有设备、应用系统安全搬迁至新数据中心机房,实现平滑切换、平稳过渡,最大限度地降低搬迁工作对业务的影响。 为了确保企事业单位能够顺利完成数据中心机房搬迁工作,我们根据实际经验提供了4个基本原则,希望能…...
GitHub敏感信息扫描工具
目录 功能设计 技术实现 程序使用 文件配置 下载地址 功能设计 GitPrey是根据企业关键词进行项目检索以及相应敏感文件和敏感文件内容扫描的工具,其设计思路如下: 根据关键词在GitHub中进行全局代码内容和路径的搜索(in:file,path),将项目结果做项目信息去重整理得到…...
Linux云计算 |【第一阶段】ENGINEER-DAY4
主要内容: 配置Linux网络参数、配置静态主机名、查看/修改/激活/禁用网络连接、指定DNS、虚拟网络连接、虚拟机克隆、SSH客户端、SCP远程复制、SSH无密码验证(SERVICE-DAY5)、虚拟网络类型 一、网络参数配置 修改网卡配置文件主要是需要配置…...
C++与VLC制作独属于你的动态壁纸背景
文章目录 前言效果展示为什么要做他如何实现他实现步骤获取桌面句柄代码获取桌面句柄libvlc_media_player_set_hwnd函数 动态壁纸代码 总结 前言 在当今的数字世界中,个性化和自定义化的体验越来越受到人们的欢迎。动态壁纸是其中一种很受欢迎的方式,它…...
平凯星辰黄东旭出席 2024 全球数字经济大会 · 开放原子开源数据库生态论坛
7 月 5 日,以“开源生态筑基础,数字经济铸未来”为主题的 2024 全球数字经济大会——开放原子开源数据库生态论坛在北京成功举办。平凯星辰(北京)科技有限公司联合创始人黄东旭发表了题为《TiDB 助力金融行业关键业务系统实践》的…...
Mac OS 下安装 NVM,1秒教会你
1.下载 curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.7/install.sh | bash或者wget -qO- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.7/install.sh | bash 2.安装成功后执行 nvm 提示 command not found 首先查看 ~/.bash_profile 文件是否存在&…...
搭建博客系统#Golang
WANLI 博客系统 项目介绍 基于vue3和gin框架开发的前后端分离个人博客系统,包含md格式的文本编辑展示,点赞评论收藏,新闻热点,匿名聊天室,文章搜索等功能。 点击跳转:Github 项目开源地址 功能展示 B 站…...
算法——滑动窗口(day6)
1004.最大连续1的个数 ||| 1004. 最大连续1的个数 III - 力扣(LeetCode) 题目解析: 这道题如果能转化为滑动窗口的话就会很简单,因为我们如果尝试去把0翻转为1再计数的话等到第2轮又得重新翻转回来,费时费力~ 那么我…...
推荐一款基于Spring Boot 框架开发的分布式文件管理系统,功能齐全,非常便捷(带私活源码)
前言 在数字化时代,文件管理是企业和个人用户的基本需求。然而,现有的文件管理系统往往存在一些痛点,如存储空间有限、文件共享困难、缺乏在线编辑功能、移动端适配性差等。这些问题限制了用户在不同设备和场景下的文件处理能力。 为了解决…...
Mysql-查询
1.基本查询 //查询所有内容 select * from 表名;//查询指定字段 select 字段1,字段2,字段3.....from 表名;//查询时给字段起别名 select 字段1 as 别名1 , 字段2 as 别名2 ... from 表名;//去重查询 select distinct 字段列表 from 表名; …...
广东科学技术职业学院计算机学院领导一行莅临泰迪智能科技参观交流
7月17日,广东科学技术职业学院计算机学院副院长张军、计算机学院副书记吴国庆、计算机学院大数据教学部部长谢文达、科技与校企合作部副部长黄相杰、科技与校企合作部副部长吴胜兵莅临广东泰迪智能科技股份有限公司产教融合实训基地参观交流,泰迪智能科技…...
exo 大模型算力共享;Llama3-70B是什么
目录 exo 大模型算力共享 exo框架的特点 如何使用exo框架 注意事项 结论 Llama3-70B是什么 一、基本信息 二、技术特点 三、性能与应用 四、未来发展 exo 大模型算力共享 exo框架的特点 异构支持:支持多种不同类型的设备,包括智能手机、平板电脑、笔记本电脑以及高…...
测试——Junit
内容大纲: 常用的五个注解 测试用例顺序指定 参数化 测试套件 断言 1. 常用的五个注解 1.1 Test 通常情况下,我们输入要写在main方法下,此时我想直接输出: Test void Test01(){System.out.println("第一个测试用例"); } 1.2 BeforeAll AfterAll BeforeALL在Tes…...
BUG ImportError: cannot import name ‘QAction‘ from ‘PySide6.QtWidgets‘
BUG ImportError: cannot import name ‘QAction’ from ‘PySide6.QtWidgets’ 环境 PySide6 6.7.2详情 在参考 PyQt5 的代码写 Pyside6 的右键菜单时遇到的错误。 错误代码 from PySide6.QtWidgets import QAction错误原因: 在PySdie6中…...
《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一)
CSI-2 协议详细解析 (一) 1. CSI-2层定义(CSI-2 Layer Definitions) 分层结构 :CSI-2协议分为6层: 物理层(PHY Layer) : 定义电气特性、时钟机制和传输介质(导线&#…...
深入解析C++中的extern关键字:跨文件共享变量与函数的终极指南
🚀 C extern 关键字深度解析:跨文件编程的终极指南 📅 更新时间:2025年6月5日 🏷️ 标签:C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录 前言🔥一、extern 是什么?&…...
RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
视觉语言模型(Vision-Language Models, VLMs),为真实环境中的机器人操作任务提供了极具潜力的解决方案。 尽管 VLMs 取得了显著进展,机器人仍难以胜任复杂的长时程任务(如家具装配),主要受限于人…...
Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)
引言 在人工智能飞速发展的今天,大语言模型(Large Language Models, LLMs)已成为技术领域的焦点。从智能写作到代码生成,LLM 的应用场景不断扩展,深刻改变了我们的工作和生活方式。然而,理解这些模型的内部…...
规则与人性的天平——由高考迟到事件引发的思考
当那位身着校服的考生在考场关闭1分钟后狂奔而至,他涨红的脸上写满绝望。铁门内秒针划过的弧度,成为改变人生的残酷抛物线。家长声嘶力竭的哀求与考务人员机械的"这是规定",构成当代中国教育最尖锐的隐喻。 一、刚性规则的必要性 …...
Python 高级应用10:在python 大型项目中 FastAPI 和 Django 的相互配合
无论是python,或者java 的大型项目中,都会涉及到 自身平台微服务之间的相互调用,以及和第三发平台的 接口对接,那在python 中是怎么实现的呢? 在 Python Web 开发中,FastAPI 和 Django 是两个重要但定位不…...
Python环境安装与虚拟环境配置详解
本文档旨在为Python开发者提供一站式的环境安装与虚拟环境配置指南,适用于Windows、macOS和Linux系统。无论你是初学者还是有经验的开发者,都能在此找到适合自己的环境搭建方法和常见问题的解决方案。 快速开始 一分钟快速安装与虚拟环境配置 # macOS/…...
内窥镜检查中基于提示的息肉分割|文献速递-深度学习医疗AI最新文献
Title 题目 Prompt-based polyp segmentation during endoscopy 内窥镜检查中基于提示的息肉分割 01 文献速递介绍 以下是对这段英文内容的中文翻译: ### 胃肠道癌症的发病率呈上升趋势,且有年轻化倾向(Bray等人,2018&#x…...
k8s从入门到放弃之Pod的容器探针检测
k8s从入门到放弃之Pod的容器探针检测 在Kubernetes(简称K8s)中,容器探测是指kubelet对容器执行定期诊断的过程,以确保容器中的应用程序处于预期的状态。这些探测是保障应用健康和高可用性的重要机制。Kubernetes提供了两种种类型…...
【汇编逆向系列】六、函数调用包含多个参数之多个整型-参数压栈顺序,rcx,rdx,r8,r9寄存器
从本章节开始,进入到函数有多个参数的情况,前面几个章节中介绍了整型和浮点型使用了不同的寄存器在进行函数传参,ECX是整型的第一个参数的寄存器,那么多个参数的情况下函数如何传参,下面展开介绍参数为整型时候的几种情…...
