AI与Prompt:解锁软件开发团队的魔法咒语,在复杂任务上生成正确率更高的代码
AI与Prompt:解锁软件开发团队的魔法咒语
- 写在最前面
- 论文:基于ChatGPT的自协作代码生成
- 将团队协作理论应用于代码生成的研究
- 自协作框架原理
- 1、DOL任务分配
- 2、共享黑板协作
- 3、Instance实例化
- 案例说明
- 简单任务:基本操作,生成的结果
- 1)分析员:分解任务+制定high-level计划
- 2)程序员:按照计划生成对应代码
- 3)测试员:检验代码的功能性和边缘测试情况,反馈错误让程序员修改
- 复杂任务:游戏开发,生成的结果
- 结果
写在最前面
活动介绍:玩转AIGC,优质的Prompt提示词实在是太重要了!同样的问题,换一个问法,就会得到差别迥异的答案。你是怎样和AI进行对话交流的呢?一起来分享你用过的咒语吧!
活动链接:https://activity.csdn.net/creatActivity?id=10580
还在让ChatGPT帮你写代码?除了编写代码,AI还可以扮演更多的角色,甚至像人类一样组成团队,合作完成更加复杂的任务。
这篇文章将探讨如何让AI成为你理想的合作伙伴,帮助你实现开发软件的任务。通过角色指令,使多个大型语言模型扮演不同的角色,组成软件开发团队,在无需人类参与的情况下以合作和交互的方式完成代码生成任务。
这个颇具创新性的方法将让你对AI的潜力有更深入的了解,看到它如何在不同角色下表现出出色的合作能力。
如果你对AI的交互方式和在软件开发中的潜力感兴趣,不妨继续阅读,一起探索这个引人入胜的话题。
论文:基于ChatGPT的自协作代码生成
Self-collaboration Code Generation via ChatGPT《基于ChatGPT的自协作代码生成》
这篇论文是chatgpt的黑盒api调用,主要介绍了关于提示工程的框架设计(和思维链的工作有相通之处)
Yihong Dong∗, Xue Jiang∗, Zhi Jin†, Ge Li† (Peking University)
arXiv 2023.4.15
论文:https://arxiv.org/pdf/2304.07590.pdf
之前对论文的详情解读:https://blog.csdn.net/wtyuong/article/details/133905690
目的: 代码生成旨在生成符合特定规范、满足人类需求的代码,以提高软件开发效率和质量,甚至推动生产模式的转变。
创新点: 本研究提出了一种自协作框架,使大型语言模型(LLM,例如ChatGPT)能够应对复杂的代码生成任务。
方法: 该框架首先为三个不同角色的大型语言模型分配任务,包括分析员(analyst,负责需求分析)、程序员(coder,负责编写代码)、测试员(tester,负责检验效果),然后通过软件开发方法(SDM)规定了这些角色之间的交互方式。
结果: 通过所提出的自协作框架,相较于ChatGPT3.5,实验结果显示在四种不同基准测试中,Pass@1的性能提高了29.9%至47.1%。
将团队协作理论应用于代码生成的研究
[Schick et al., 2022]
- 原理:先训练不同模型执行对应子任务,然后用联合训练增强相互理解
- 问题:这种训练方法非常costly;缺乏相关的训练数据
改进
[Ouyang et al., 2022, Chung et al., 2022, OpenAI, 2023]
- 原理:经过足够的训练让LLM在软件开发的各个阶段都可以出色地完成任务,方便后续分配;根据人类命令做出调整,开发模型交互的潜力
- 问题:依赖于人类程序员的专业知识,依然耗时耗力
解决方法:本论文提出自协作框架,让ChatGPT形成团队

Figure 1: An example of role-playing. Through role-playing, LLM transforms into an expert within a specific domain, delivering a professional-perspective response to the same requirement.
自协作框架原理
1、DOL任务分配
根据任务分配角色指令,然后将对应的任务传递给角色

角色说明 = 团队描述 + 用户需求 + 角色描述
团队描述
在开发团队中,包括一个需求分析师、一个开发人员和一个质量保证测试员。该团队需要开发满足用户需求的程序。不同的角色有不同的劳动分工,并需要相互协作。
用户需求
用户的需求是:“[需求]”。
例如:“[需求] - 此函数的输入是一个包含多个嵌套括号组的字符串。您的目标是将这些组分开为单独的字符串,并返回这些字符串的列表。分开的组是平衡的(每个开括号都正确关闭),并且不嵌套在彼此内部。请忽略输入字符串中的任何空格。”
开发人员:
我们希望您在我们的开发团队中扮演开发人员的角色。您将收到需求分析师的计划或测试员的测试报告。您的工作分为两个部分:
如果您从需求分析师那里收到计划,编写Python代码以满足计划中的需求。确保您编写的代码高效、可读,并遵循最佳实践。
如果您从测试员那里收到测试报告,根据报告的内容修复或改进代码,但不要引入新的错误或对代码性能产生负面影响。确保对代码进行的任何更改都符合测试报告的内容。
请记住,不需要解释您编写的代码。
2、共享黑板协作
不同角色间,将输出的信息共享

3、Instance实例化
3.Instance实例化
1)采用SDM中的经典瀑布模型 [Petersen et al., 2009],简化为三个阶段:分析、编码、测试。
2)分析员:生成一个高维的计划,着重指导程序员。程序员:根据分析员的计划写代码;根据测试员的测试报告修改代码。测试员:从功能性、可读性和可维护性评判程序员的代码
3)终止条件:达到最大交互次数n或者测试员报告没有错误
案例说明
简单任务:基本操作,生成的结果
1)分析员:分解任务+制定high-level计划
需求:
triples_sum_to_zero 接受一个整数列表作为输入。如果列表中存在三个不同的元素之和为零,则返回True,否则返回False。
具体要求:
- 检查列表中是否至少有三个元素。
- 检查列表中是否存在重复元素。
- 找到列表中三个不同元素的所有可能组合。
- 检查这些组合中是否有任何一组的和为零。
- 检查这三个元素是否都是不同的。
- 如果没有任何组合的和为零,则返回False。如果有,则返回True。
2)程序员:按照计划生成对应代码
我已经彻底测试了这段代码并针对各种测试案例进行了检查。以下是我的报告。
功能性测试:
- 测试了代码的功能性,确保它满足需求,即三个元素的和为零。
- 这段代码适用于提供的测试案例,并正确检查三元素的情况。
边缘情况测试:
- 代码处理了列表少于三个元素的情况,如预期的返回False。
- 代码处理了空列表,并如预期返回False。
问题标识:
我发现了一个问题:
- 代码从列表中移除重复元素,这可能导致某些测试案例返回不正确的结果。例如,
triples_sum_to_zero[0, 0, 0]应该返回True,但给定的代码返回False,因为它移除了重复的零。
报告问题或错误:
问题:从代码中移除重复元素可能导致某些测试案例返回不正确的结果。
如果代码通过了您的测试,请写一个结论:代码测试通过。但由于上述问题,代码尚未通过测试。
解决问题建议:
为了解决这个问题,我建议删除代码中的行 “b1 - list(set(1b1))”。
3)测试员:检验代码的功能性和边缘测试情况,反馈错误让程序员修改
代码测试已通过。
经过测试更新后的代码,我可以确认它已经通过了所有的测试,并满足了需求。

复杂任务:游戏开发,生成的结果
需求:
作为一个充满冒险精神的玩家,我希望能够玩一个打砖块游戏,在游戏中我能够控制一个角色从起点开始,穿越各种障碍物,达到终点,以便能够体验刺激和具有挑战性的旅程。我希望能够通过移动鼠标控制角色的方向,以避开阻碍他前进的障碍物,如岩石、灌木丛,以及从顶部掉下的炸弹。如果角色与障碍物相撞或被炸弹击中,游戏失败。如果角色到达终点,游戏获胜。
注意事项:
- 起点标记为左下角的灰色圆圈,终点标记为右上角的绿色圆圈。
- 从指定的资源路径(assets/character.png,assets/bomb.png,assets/rock.png,assets/bush.png)加载角色、炸弹和障碍物的图像,并将它们缩放到适当的大小。
- 角色的初始位置位于起点。
- 当我点击鼠标时游戏开始。
- 炸弹需要不断从顶部掉下。
- 使用pygame在Python中创建游戏。
结果
满足所有游戏逻辑,保障了精确的角色控制,设置正确的碰撞检测,必要的游戏资产加载和适当的图像缩放。
此外,注意到了没有直接规定但是符合常识的游戏逻辑,比如炸弹掉落至底部后会被重置位置
单个LLM只能生成脚本的粗略草稿

相关文章:
AI与Prompt:解锁软件开发团队的魔法咒语,在复杂任务上生成正确率更高的代码
AI与Prompt:解锁软件开发团队的魔法咒语 写在最前面论文:基于ChatGPT的自协作代码生成将团队协作理论应用于代码生成的研究自协作框架原理1、DOL任务分配2、共享黑板协作3、Instance实例化 案例说明简单任务:基本操作,生成的结果1…...
深度学习02-数据集格式转换
背景: 通常搜集完数据图片后,我们会用labelimg进行图片标注,比较高版本的labelimg支持的标注格式有三种,PascalVOC、YOLO、CreateML,标注的时候可以根据自己的算法模型数据集需求选择相应的格式,当然&…...
【c++|opencv】一、基础操作---1.图像读取
every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?typeblog 0. 前言 有关c操作opencv记录 1. 正文 1.1 图像读取、显示、保存 // 读取、显示、保存图像#include <opencv2/opencv.hpp> #include <iostream>us…...
【2023.10.30练习】C语言-循环右移字符
计算机能力挑战初赛2020.19题 题目描述: 现要对一个由字符a-z和A-Z组成的字符串进行解密,已知加密规则是: 字符串中所有字符分别在大写或小写的字母表中被循环左移5位(fGh-->aBc), 输入:一个加密过的字符串&#…...
C++ 自引用指针this(整理)
使用例子: #include <iostream> #include <Windows.h> using namespace std; class A { public:A(int x1){x x1;}void disp(){cout<<"this"<<this<<" when x"<<this->x<<endl;} private:int x;…...
pyzed.sl 突然 ImportError: DLL load failed while importing sl: 找不到指定的程序。 的解决
问题描述 >>> import pyzed.sl Traceback (most recent call last):File "<stdin>", line 1, in <module> ImportError: DLL load failed while importing sl: 找不到指定的程序。解决 1 按网上说的,将bin文件夹下所有dll复制到py…...
STM32 Cube配置RS485 Modbus
STM32CUBUMX配置RS485 modbus STM32(从机)亲测可用 STM32开发(六)STM32F103 通信 —— RS485 Modbus通信编程详解...
global,nonlocal
1.global 在局部,引入全局变量,使得局部变量可以修改全局变量 a 10 # a为全局变量def func():global a #把外面的全局变量引入到局部a 20 #创建局部变量,修改全局变量func() print(a) #20 2.nonlocal 在局部,引入外层的…...
HTML5教程
HTML5读书笔记 jack 2023.10.24 来源:HTML5 Canvas | 菜鸟教程 常识: HTML5 是下一代 HTML 标准。 HTML , HTML 4.01的上一个版本诞生于 1999 年 <!DOCTYPE html>用于声明下面代码是H5; 浏览器支持 你可以让一些较早的浏览器(不支…...
vulnhub momentum 靶机复盘
环境配置 到学校了 原来的桥接配置要改 这里记录几个点备忘 1.virtualbox 桥接 未指定 重新安装驱动VBoxNetLwf.inf 2.配置完靶机启动失败 手动安装VBoxNetLwf.inf 不要用virtualbox自带的netlwfinstall 3.配置完nmap扫不到 rw init/bin/bash 进去看看网卡配置 信息收集…...
c++和java实现策略模式的差异
一、C和java的差异 实例化方式 c的对象有两种实例化方式,一种是局部变量中直接实例化。一种是new出来的。 MyClass myclass; //第一种方式 MyClass* myclassPtrnew MyClass(); //第二种方式java的对象构建,没有第一种方式,java的对象都…...
vim
简介 vim是一款多模式的文本编辑器,vim里面还有很多子命令,来进行代码的编写操作 常用模式图 命令模式 光标移动 shif $ 光标定义到当前行的最右侧结尾 shift ^ 光标定义到当前行的最左侧开头 shift g 光标定位到文本最末尾…...
AcWing93. 递归实现组合型枚举:输出从1~n中随机选出的m个整数
题目 从 1∼ n n n 这 n n n 个整数中随机选出 m m m 个,输出所有可能的选择方案。 输入格式 两个整数 n , m , n,m, n,m, 在同一行用空格隔开。 输出格式 按照从小到大的顺序输出所有方案,每行 1 个。 首先,同一行内的数升序排列&a…...
Java修仙传之Flink篇
大道三千:最近我修Flink 目前个人理解: 处理有界,无界流的工具 FLINK: FLINK定义: Flink特点 Flink分层API 流的定义 有界数据流(批处理): 有界流:数据结束了,程序也…...
网络新闻发稿为何经久不衰?
有的老板可能看不到新闻营销的直接回报,一直不乐意在此方面投入,但是却看到竞争对手一直在搞新闻营销,也就安排个PR做做新闻公关。小马识途营销顾问观察,自互联网诞生以来,新闻营销一直是网络营销工作中的一个重点。 如…...
Java SimpleDateFormat 中英文时间格式化转换
SimpleDateFormat是一个以与语言环境有关的方式来格式化和解析日期的具体类。它允许进行格式化(日期 -> 文本)、解析(文本 -> 日期)和规范化。 SimpleDateFormat使得可以选择任何用户定义的日期-时间格式的模式。但是&…...
机器学习-基本知识
任务类型 ◼ 有监督学习(Supervised Learning) 每个训练样本x有人为标注的目标t,学习的目标是发现x到t的映射,如分类、回归。 ◼ 无监督学习(Unsupervised Learning) 学习样本没有人为标注,学习的目的是发现数据x本身的分布规律…...
Xilinx 7 系列 1.8V LVDS 和 2.5V LVDS 信号之间的 LVDS 兼容性
如果通过LVDS进行接口,可以按照以程图中的步骤操作,以确保满足正确使用LVDS的所有要求。 40191 - 7 系列 - 1.8V LVDS 和 2.5V LVDS 信号之间的 LVDS 兼容性 与LVDS兼容驱动器和接收器连接时,7系列LVDS和LVDS_25输入和输出应该不存在兼容性问…...
R语言在生态环境领域中的实践技术应用
R语言作为新兴的统计软件,以开源、自由、免费等特点风靡全球。生态环境领域研究内容广泛,数据常多样而复杂。利用R语言进行多元统计分析,从复杂的现象中发现规律、探索机制正是R的优势。为此,以鱼类、昆虫、水文、地形等多样化的生…...
ChineseChess.2023.10.31.01
中国象棋残局模拟器:黑双卒压禁区 中国象棋残局模拟器ChineseChess.2023.10.31.01...
铭豹扩展坞 USB转网口 突然无法识别解决方法
当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…...
业务系统对接大模型的基础方案:架构设计与关键步骤
业务系统对接大模型:架构设计与关键步骤 在当今数字化转型的浪潮中,大语言模型(LLM)已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中,不仅可以优化用户体验,还能为业务决策提供…...
Python实现prophet 理论及参数优化
文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候,写过一篇简单实现,后期随着对该模型的深入研究,本次记录涉及到prophet 的公式以及参数调优,从公式可以更直观…...
OkHttp 中实现断点续传 demo
在 OkHttp 中实现断点续传主要通过以下步骤完成,核心是利用 HTTP 协议的 Range 请求头指定下载范围: 实现原理 Range 请求头:向服务器请求文件的特定字节范围(如 Range: bytes1024-) 本地文件记录:保存已…...
P3 QT项目----记事本(3.8)
3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...
Qt Http Server模块功能及架构
Qt Http Server 是 Qt 6.0 中引入的一个新模块,它提供了一个轻量级的 HTTP 服务器实现,主要用于构建基于 HTTP 的应用程序和服务。 功能介绍: 主要功能 HTTP服务器功能: 支持 HTTP/1.1 协议 简单的请求/响应处理模型 支持 GET…...
解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错
出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...
C++.OpenGL (10/64)基础光照(Basic Lighting)
基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...
tree 树组件大数据卡顿问题优化
问题背景 项目中有用到树组件用来做文件目录,但是由于这个树组件的节点越来越多,导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多,导致的浏览器卡顿,这里很明显就需要用到虚拟列表的技术&…...
return this;返回的是谁
一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请,不同级别的经理有不同的审批权限: // 抽象处理者:审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...
