【论文阅读】【NeurIPS 24'】MAGIS:多智能体支撑的大语言模型Github问题解决——通过精心设计的智能体协作来增强问题解决能力
论文信息: 题目:MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue ReSolution 链接:NeurIPS 24’ 主要问题类似Github的代码托管平台,其项目通常不是一成不变的,开源软件作者会更新多个版本,并将源码按照版本号推至代码仓,本文的根本目的是解决开源代码产生的各类“issue”,同时研究了多智能体应用对该下游任务的优化性能。本文的主要贡献如下: 我们对llm解决GitHub问题进行了实证分析,探讨了定位代码文件/行、代码变更的复杂性与解决成功率之间的相关性。 我们提出了一种新的基于llm的多智能体框架MAGIS,以减轻现有llm在GitHub问题解决上的局限性。我们设计的四类代理及其在规划和编码方面的协作都释放了llm在存储库级别编码任务上的潜力。 我们在SWE-bench数据集上比较了我们的框架和其他强大的大语言模型竞争对手(即GPT-3.5,...
【CTFSHOW】 web应用安全与防护
第一章Base64编码隐藏前端js代码中有登录逻辑,解码这个base64## HTTP头注入在使用前文获取的口令登录后显示:所以更改User-Agent字段为指定的内容## Base64多层嵌套解码12345678910document.getElementById('loginForm').addEventListener('submit', function(e) { const correctPassword = "SXpVRlF4TTFVelJtdFNSazB3VTJ4U1UwNXFSWGRVVlZrOWNWYzU="; function validatePassword(input) { let encoded = btoa(input); encoded = btoa(encoded + 'xH7jK').slice(3); ...
【计算机面试】面试时的八股问题
我的目标是安全/开发/AI方向,这里整理一些老被问的问题。 计算机网络传输层 层 协议 应用层 HTTP、FTP、SMTP、NFS、Telnet、DNS 传输层 TCP、UDP 网络层 IP、ICMP、ARP、RARP 数据链路层 PPP、Ethernet TCP、UDP相关TCP的可靠传输 校验和:发送方在构造TCP报文段时,会计算包括TCP头部、数据部分以及一个伪头部(包含源IP地址、目的IP地址、协议号和TCP长度)在内的校验和,并将结果填入TCP头部的校验和字段。接收方收到报文后,使用相同的算法重新计算校验和,若结果不为全零,则说明数据在传输过程中可能发生了损坏,接收方将丢弃该报文段并可能触发重传。 序列号/确认应答(seq、ACK):TCP通过序列号(Sequence Number,seq)和确认应答号(Acknowledgment...
【更新中】求职的那些七七八八
记录末9本硕菜鸡开发类岗位秋招历程,若你也在求职,就跳转到第二个标题吧~ 面试小记2025年秋招,多数互联网企业网申始于7-8月(美团、字节等),部分公司提前批网申于6月开始(TP-LINK)。从历年秋招开始的时间对比来看,今年的秋招提前了不少,说是互联网“大年”,但其实放出的机会并未增加多少,甚至可以说有所减少——从投出简历后收到反馈的数量就可见一斑。“互联网寒冬”尚未过去,新一轮毕业生已经在校招季展开厮杀。这一年,AI为校招关键词,焦点被分配在软件开发、算法工程师之上。笔试和面试时也会单独对这一领域单独考察,部分企业重点考察对神经网络底层逻辑的理解,例如简单叙述Transformer...
【杂记】西风的那个夏天
...
【大模型】漏洞检测修复方向
Examining Zero-Shot Vulnerability Repair with Large Language Models(SP 23‘)论文方向:专注于研究软件源码漏洞的大模型修补方案生成,侧重于零样本有效修补方案的生成。文章提出的研究问题为: RQ1 现成llm是否能生成安全的补丁修复漏洞? RQ2 改变prompt中注释的上下文数量是否影响LLM提出修复意见的能力? RQ3 现实世界应用时存在什么挑战? RQ4 llm在修复漏洞方向有多可靠? 论文主要工作针对RQ1、2 漏洞程序代码生成: 指定两种类型的漏洞(CWE787写出边界和CWE89SQL注入),给大模型(Codex)提供相关的短程序,让大模型补全,再通过单元测试和CodeQL运行,评估程序功能。 生成过程中作者设置了不同温度值{0 0.25 0.5 0.75...














