西风的那一年

【论文阅读】【NeurIPS 24'】MAGIS：多智能体支撑的大语言模型Github问题解决——通过精心设计的智能体协作来增强问题解决能力

发表于2025-10-14|博文

论文信息：题目：MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue ReSolution 链接：NeurIPS 24’ 主要问题类似Github的代码托管平台，其项目通常不是一成不变的，开源软件作者会更新多个版本，并将源码按照版本号推至代码仓，本文的根本目的是解决开源代码产生的各类“issue”，同时研究了多智能体应用对该下游任务的优化性能。本文的主要贡献如下：我们对llm解决GitHub问题进行了实证分析，探讨了定位代码文件/行、代码变更的复杂性与解决成功率之间的相关性。我们提出了一种新的基于llm的多智能体框架MAGIS，以减轻现有llm在GitHub问题解决上的局限性。我们设计的四类代理及其在规划和编码方面的协作都释放了llm在存储库级别编码任务上的潜力。我们在SWE-bench数据集上比较了我们的框架和其他强大的大语言模型竞争对手（即GPT-3.5，...

【入海口】西风最后的学生时代-2

发表于2025-10-13|日记

...

【CTFSHOW】 web应用安全与防护

发表于2025-10-10|博文

第一章Base64编码隐藏前端js代码中有登录逻辑，解码这个base64## HTTP头注入在使用前文获取的口令登录后显示：所以更改User-Agent字段为指定的内容## Base64多层嵌套解码12345678910document.getElementById('loginForm').addEventListener('submit', function(e) { const correctPassword = "SXpVRlF4TTFVelJtdFNSazB3VTJ4U1UwNXFSWGRVVlZrOWNWYzU="; function validatePassword(input) { let encoded = btoa(input); encoded = btoa(encoded + 'xH7jK').slice(3); ...

【计算机面试】面试时的八股问题

发表于2025-09-28|博文

我的目标是安全/开发/AI方向，这里整理一些老被问的问题。计算机网络传输层层协议应用层 HTTP、FTP、SMTP、NFS、Telnet、DNS 传输层 TCP、UDP 网络层 IP、ICMP、ARP、RARP 数据链路层 PPP、Ethernet TCP、UDP相关TCP的可靠传输校验和：发送方在构造TCP报文段时，会计算包括TCP头部、数据部分以及一个伪头部（包含源IP地址、目的IP地址、协议号和TCP长度）在内的校验和，并将结果填入TCP头部的校验和字段。接收方收到报文后，使用相同的算法重新计算校验和，若结果不为全零，则说明数据在传输过程中可能发生了损坏，接收方将丢弃该报文段并可能触发重传。序列号/确认应答（seq、ACK）：TCP通过序列号（Sequence Number，seq）和确认应答号（Acknowledgment...

【更新中】求职的那些七七八八

发表于2025-09-25|日记博文

记录末9本硕菜鸡开发类岗位秋招历程，若你也在求职，就跳转到第二个标题吧~ 面试小记2025年秋招，多数互联网企业网申始于7-8月（美团、字节等），部分公司提前批网申于6月开始（TP-LINK）。从历年秋招开始的时间对比来看，今年的秋招提前了不少，说是互联网“大年”，但其实放出的机会并未增加多少，甚至可以说有所减少——从投出简历后收到反馈的数量就可见一斑。“互联网寒冬”尚未过去，新一轮毕业生已经在校招季展开厮杀。这一年，AI为校招关键词，焦点被分配在软件开发、算法工程师之上。笔试和面试时也会单独对这一领域单独考察，部分企业重点考察对神经网络底层逻辑的理解，例如简单叙述Transformer...

【入海口】西风最后的学生时代-1

发表于2025-09-13|日记

...

【杂记】西风的那个夏天

发表于2025-07-03|日记

...

【碎碎念】每段并肩，都不过是擦肩

发表于2025-06-23|日记

...

【大模型】漏洞检测修复方向

发表于2025-06-16|博文

Examining Zero-Shot Vulnerability Repair with Large Language Models（SP 23‘）论文方向：专注于研究软件源码漏洞的大模型修补方案生成，侧重于零样本有效修补方案的生成。文章提出的研究问题为： RQ1 现成llm是否能生成安全的补丁修复漏洞？ RQ2 改变prompt中注释的上下文数量是否影响LLM提出修复意见的能力？ RQ3 现实世界应用时存在什么挑战？ RQ4 llm在修复漏洞方向有多可靠？论文主要工作针对RQ1、2 漏洞程序代码生成：指定两种类型的漏洞（CWE787写出边界和CWE89SQL注入），给大模型（Codex）提供相关的短程序，让大模型补全，再通过单元测试和CodeQL运行，评估程序功能。生成过程中作者设置了不同温度值{0 0.25 0.5 0.75...

【机器学习】一些入门AI的基础知识整理

发表于2025-06-12|博文

...