CAI：人机协作的模块化网络安全AI框架

📅 发布时间：2026/7/5 2:02:35 👁️ 浏览次数：

CAI (Cybersecurity AI)1.简介CAI是一个开源、轻量的安全智能体框架用于构建面向安全场景的专用 AI 智能体帮助开展侦察、漏洞发现、利用、提权与取证等实战任务强调模块化与研究导向红、蓝队、ctf选手、安全工程师等群体目标是在“人机协作”前提下保留人类监督作为安全控制实施全自动化渗透测试让 AI 在安全测试中达到接近或具备人类竞争力的水平同时保持透明、可审计与可控。CAI 在 CTF 基准测试中的表现始终优于最先进的结果能够显著提高解决各种类别挑战的效率——在高达3600个任务上比人类更快在特定任务上平均速度为人类的 11倍。CAI 在“AI vs Human” CTF 现场挑战赛中斩获 AI 团队第一名并跻身全球前 20 名获得 750 美元奖励。除了网络安全竞赛之外CAI 还展现了其在现实世界中的有效性在一周内就进入了西班牙排名前 30 名并在 Hack The Box 上跻身全球排名前 500 名同时显著降低了安全测试成本平均降低了 156%。2.关键特性300 AI模型支持OpenAI、Anthropic、DeepSeek、Ollama等多个模型。内置安全工具提供即用的工具便于进行侦查、利用和权限提升。经过实战检验在HackTheBox CTF、漏洞悬赏和现实世界的安全案例中验证其有效性。基于代理的架构模块化设计框架可为不同安全任务构建专用代理。防护护栏内置防御机制对抗提示注入和危险命令执行。以研究为导向旨在为社区普及网络安全AI的研究基础。3.CAI整体架构设计思想CAI 的核心是专门的网络安全代理通过明确定义的交互模式协同工作的概念。该架构的人机接口层Human Interface Layer强调通过HITL和Turns组件进行人机协作这两个组件管理交互流并使安全专业人员能够在必要时进行干预。这里交互是指代理之间的顺序交换其中每个代理通过推理步骤LLM 推理执行其逻辑然后使用工具执行操作而Turns表示一个或多个交互的完整循环当代理确定不需要进一步操作或人工干预时结束。代理合作层(Agent Coordin Layer)说明了代理如何利用LLM进行推理同时利用模式和交接来协调复杂的安全工作流程。执行层(Execution Layer)展示了工具如何提供具体的功能例如命令执行、Web 搜索、代码操作和安全隧道——这些都是实际安全测试的基本功能。3.1人机交互层Human Interface LayerHITLHuman-in-the-Loop这是人工在环机制表示人类可随时干预、暂停、修改 AI 的行为。确保 AI 不会在无监督情况下执行危险命令。Turns回合控制管理每个 agent 的“推理—执行—反馈”周期。每一轮任务由多个回合组成系统通过回合控制协调执行顺序与人类输入3.2智能体协调层Agent Coordination LayerPatterns模式定义多个 agent 的协作策略与流程结构例如“任务链式协作”“分层任务分配”“递归式问题求解”等。HITL 的输入可以调整这些模式编号①。Handoffs交接负责 agent 之间的任务衔接。一个 agent 完成阶段性任务后通过 handoff 将上下文交给下一个 agent。Patterns 和 Handoffs 相互作用编号②。Agents智能体这是 CAI 的核心执行单元。不同 agent 负责不同的安全任务信息收集、漏洞扫描、利用、验证、报告生成等。Handoffs 的输出会触发具体的 agent 执行任务编号③LLMs大型语言模型Agent 的“思维引擎”。CAI 允许接入不同厂商 / 模型如 Claude、GPT-4o、Gemini、DeepSeek 等为 agent 提供理解与推理能力编号④3.3执行层Execution LayerTools工具Agent 执行具体操作的接口例如命令执行、端口扫描、代码分析、SSH、漏洞验证等。Agent 调用 Tools 来落地实际动作编号⑤。Tracing追踪 / 日志记录每个 agent 的决策过程、工具调用、交互日志用于可观测性、调试和安全审计编号⑥、⑦。例如记录 agent 在何时调用了哪个工具、返回了什么结果。Extensions扩展模块用户自定义的插件系统可扩展工具集、接口或安全策略。Extensions 的行为也被追踪记录编号⑧4.核心能力维度能力实战亮点AI 智能代理OpenAI / Claude / DeepSeek 全兼容自主决策工具链支持多轮对话自己改策略MCP 万能插槽内置 100 安全工具支持外部 MCP 服务器热插拔工具即插即用AI 无缝调用杀招级工具库nmap、sqlmap、nuclei、msf、hashcat、volatility …一条命令全激活攻击链可视化自动生成交互式攻击图谱节点含风险评分老板一眼看懂入侵路径大结果分页200 KB 自动落盘支持 grep/head/tail 在线分段读再大报告也不卡前端统一鉴权Web API MCP 三合一会话过期可配密码自动生成团队共享不裸奔双传输模式HTTP远程共享 / stdio本地高隔离自由切换Cursor / Claude Desktop 即插即用流式 SSE实时输出工具 stdout像看本地终端一样爽前端进度条实时滚动5.工具100全攻击链覆盖工具类别代表工具核心能力/适用场景备注网络扫描nmap、masscan、rustscan、arp-scan、nbtscan端口探测、服务识别、OS指纹探测、局域网ARP/NetBIOS扫描端口服务OS 扫描三件套兼顾速度与精度Web应用扫描sqlmap、nikto、dirb、gobuster、feroxbuster、ffuf、httpx常规Web漏洞检测、目录/路径爆破、HTTP信息探测、存活验证覆盖Web基础扫描全场景多级并发爆破隐藏目录Web漏洞专项nuclei、wpscan、wafw00f、dalfox、xsserCVE漏洞模板秒扫、WP建站程序专项扫描、WAF识别、XSS/注入专项探测SQLi、XSS等常见Web漏洞精准检测子域名枚举subfinder、amass、findomain、dnsenum、fierce多源子域收集、DNS解析探测、横向资产挖掘横向资产梳理核心工具一把梭式枚举网络空间搜索fofa_search、zoomeye_search基于网络空间搜索引擎的资产检索、目标信息收集快速定位全网关联资产API安全graphql-scanner、arjun、api-fuzzer、api-schema-analyzerGraphQL/REST API探测、接口模糊测试、API架构分析针对API接口的专项安全检测容器安全trivy、clair、docker-bench-security、kube-bench、kube-hunter容器镜像漏洞扫描、Docker/K8s配置合规核查、容器集群风险探测镜像漏洞容器编排平台配置全核查云安全prowler、scout-suite、cloudmapper、pacu、terrascan、checkov云厂商AWS/阿里云等资产梳理、配置漏洞检测、IaC代码安全扫描覆盖云原生全栈安全检测含基础设施即代码审计二进制分析gdb、radare2、ghidra、objdump、strings、binwalk二进制文件反编译、调试、字符串提取、固件逆向分析逆向工程、固件安全分析核心工具漏洞利用metasploit、msfvenom、pwntools、ropper、ropgadget漏洞利用模块调用、恶意载荷生成、ROP链构造、漏洞EXP开发渗透测试漏洞利用核心工具集密码破解hashcat、john、hashpump哈希值破解、密码字典攻击、哈希长度扩展攻击多算法支持兼顾速度与兼容性取证分析volatility、volatility3、foremost、steghide、exiftool内存取证分析、文件恢复、隐写术检测、图片/文件元信息提取数字取证、CTF取证场景专用后渗透linpeas、winpeas、mimikatz、bloodhound、impacket、responder提权信息枚举Linux/Windows、凭证窃取、AD域攻击路径分析、中间人欺骗提权、凭证收集、域渗透全环节覆盖CTF专用stegsolve、zsteg、hash-identifier、fcrackzip、pdfcrack、cyberchef隐写分析、哈希类型识别、压缩包/PDF密码破解、多功能编码/解密CTF全场景实用工具一站式解决编码/隐写/破解问题系统辅助exec、create-file、delete-file、list-files、modify-file系统命令执行、文件增删改查安全沙箱内执行兼顾操作灵活性与环境隔离6.为什么要人机交互CAI 提供了一个构建网络安全 AI 的框架重点强调半自主操作同时承认全自动网络安全系统仍为时过早在处理复杂任务时面临重大挑战。虽然 CAI 探索了自主能力但我们的结果清楚地表明有效的安全操作仍然需要人类遥控在安全过程中提供专业知识、判断和监督。因此人机回路 ( HITL ) 模块不仅仅是一个功能而且是 CAI 设计理念的重要基石。我们在不同挑战类别中的基准测试结果一致表明在战略要点上的人为判断和干预可显著提高成功率并缩短解决时间特别是对于复杂的加密和逆向工程挑战。通过命令行界面用户只需按CtrlC即可在执行期间的任何时间点与代理无缝交互。此功能在核心执行引擎抽象中实现在整个安全测试过程中提供灵活的人工监督。我们的 LLM 性能比较分析进一步验证了 HITL 的重要性这表明即使是最先进的模型在处理复杂的安全场景时也能从及时的人工指导中受益匪浅。7.CAI的三种应用场景CAI有三种代理模式每个代理都使用相似的核心工具架构但其目标和方法均根据其特定的安全角色进行定制在代码中三种模型对应三个代理程序。三种模式分别为1.红队代理专注于攻击性安全目标获取root 权限聚集渗透测试。关键能力网络枚举服务破解提权。2.漏洞赏金猎人专注于 Web 应用程序漏洞发现目标寻找漏洞聚焦Web 应用安全。关键能力资产发现漏洞评估负责任的披露。3.蓝队代理专注于防御性安全目标保护系统聚焦防御和监控主要能力网络监控漏洞评估事件响应。与人类测试结果的比较在CTF中与人类的两种比较红队代理模式图中多少X,表示AI速度是人类的多少倍1.按类别比较按难度比较两个图清晰的表达在大部分场景下AI效率远大于人类。还有一个有趣的发现对各模型在渗透上能力的比较感觉这个数据是靠谱的。kali OS上部署CAI# 克隆仓库可选也可直接 pip 安装git clone https://github.com/aliasrobotics/cai cd cai# 创建虚拟环境推荐python3 -m venv cai_env source cai_env/bin/activate# 安装框架支持 PyPIpip install cai-framework# 生成配置文件cat .env EOF OPENAI_API_KEYsk-xxxxxx OPENAI_API_BASEhttp://xxxx:9998/v1 ANTHROPIC_API_KEY OLLAMA PROMPT_TOOLKIT_NO_CPR1 CAI_STREAMfalse CAI_MODELopenai/qwen3-32b CAI_GUARDRAILStrue EOF启动CAI激活虚拟环境source cai_env/bin/activate cai成功启动画面

相关新闻

最新新闻

日新闻

周新闻

月新闻