CAI:人机协作的模块化网络安全AI框架 📅 发布时间:2026/7/5 2:02:35 👁️ 浏览次数: CAI (Cybersecurity AI)1.简介CAI是一个开源、轻量的安全智能体框架用于构建面向安全场景的专用 AI 智能体帮助开展侦察、漏洞发现、利用、提权与取证等实战任务强调模块化与研究导向红、蓝队、ctf选手、安全工程师等群体目标是在“人机协作”前提下保留人类监督作为安全控制实施全自动化渗透测试让 AI 在安全测试中达到接近或具备人类竞争力的水平同时保持透明、可审计与可控。CAI 在 CTF 基准测试中的表现始终优于最先进的结果能够显著提高解决各种类别挑战的效率——在高达3600个任务上比人类更快在特定任务上平均速度为人类的 11倍。CAI 在“AI vs Human” CTF 现场挑战赛中斩获 AI 团队第一名并跻身全球前 20 名获得 750 美元奖励。除了网络安全竞赛之外CAI 还展现了其在现实世界中的有效性在一周内就进入了西班牙排名前 30 名并在 Hack The Box 上跻身全球排名前 500 名同时显著降低了安全测试成本平均降低了 156%。2.关键特性300 AI模型支持OpenAI、Anthropic、DeepSeek、Ollama等多个模型。内置安全工具提供即用的工具便于进行侦查、利用和权限提升。经过实战检验在HackTheBox CTF、漏洞悬赏和现实世界的安全案例中验证其有效性。基于代理的架构模块化设计框架可为不同安全任务构建专用代理。防护护栏内置防御机制对抗提示注入和危险命令执行。以研究为导向旨在为社区普及网络安全AI的研究基础。3.CAI整体架构设计思想CAI 的核心是专门的网络安全代理通过明确定义的交互模式协同工作的概念。该架构的人机接口层Human Interface Layer强调通过HITL和Turns组件进行人机协作这两个组件管理交互流并使安全专业人员能够在必要时进行干预。这里交互是指代理之间的顺序交换其中每个代理通过推理步骤LLM 推理执行其逻辑然后使用工具执行操作而Turns表示一个或多个交互的完整循环当代理确定不需要进一步操作或人工干预时结束。代理合作层(Agent Coordin Layer)说明了代理如何利用LLM进行推理同时利用模式和交接来协调复杂的安全工作流程。执行层(Execution Layer)展示了工具如何提供具体的功能例如命令执行、Web 搜索、代码操作和安全隧道——这些都是实际安全测试的基本功能。3.1人机交互层Human Interface LayerHITLHuman-in-the-Loop这是人工在环机制表示人类可随时干预、暂停、修改 AI 的行为。确保 AI 不会在无监督情况下执行危险命令。Turns回合控制管理每个 agent 的“推理—执行—反馈”周期。每一轮任务由多个回合组成系统通过回合控制协调执行顺序与人类输入3.2智能体协调层Agent Coordination LayerPatterns模式定义多个 agent 的协作策略与流程结构例如“任务链式协作”“分层任务分配”“递归式问题求解”等。HITL 的输入可以调整这些模式编号①。Handoffs交接负责 agent 之间的任务衔接。一个 agent 完成阶段性任务后通过 handoff 将上下文交给下一个 agent。Patterns 和 Handoffs 相互作用编号②。Agents智能体这是 CAI 的核心执行单元。不同 agent 负责不同的安全任务信息收集、漏洞扫描、利用、验证、报告生成等。Handoffs 的输出会触发具体的 agent 执行任务编号③LLMs大型语言模型Agent 的“思维引擎”。CAI 允许接入不同厂商 / 模型如 Claude、GPT-4o、Gemini、DeepSeek 等为 agent 提供理解与推理能力编号④3.3执行层Execution LayerTools工具Agent 执行具体操作的接口例如命令执行、端口扫描、代码分析、SSH、漏洞验证等。Agent 调用 Tools 来落地实际动作编号⑤。Tracing追踪 / 日志记录每个 agent 的决策过程、工具调用、交互日志用于可观测性、调试和安全审计编号⑥、⑦。例如记录 agent 在何时调用了哪个工具、返回了什么结果。Extensions扩展模块用户自定义的插件系统可扩展工具集、接口或安全策略。Extensions 的行为也被追踪记录编号⑧4.核心能力维度能力实战亮点AI 智能代理OpenAI / Claude / DeepSeek 全兼容自主决策工具链支持多轮对话自己改策略MCP 万能插槽内置 100 安全工具支持外部 MCP 服务器热插拔工具即插即用AI 无缝调用杀招级工具库nmap、sqlmap、nuclei、msf、hashcat、volatility …一条命令全激活攻击链可视化自动生成交互式攻击图谱节点含风险评分老板一眼看懂入侵路径大结果分页200 KB 自动落盘支持 grep/head/tail 在线分段读再大报告也不卡前端统一鉴权Web API MCP 三合一会话过期可配密码自动生成团队共享不裸奔双传输模式HTTP远程共享 / stdio本地高隔离自由切换Cursor / Claude Desktop 即插即用流式 SSE实时输出工具 stdout像看本地终端一样爽前端进度条实时滚动5.工具100全攻击链覆盖工具类别代表工具核心能力/适用场景备注网络扫描nmap、masscan、rustscan、arp-scan、nbtscan端口探测、服务识别、OS指纹探测、局域网ARP/NetBIOS扫描端口服务OS 扫描三件套兼顾速度与精度Web应用扫描sqlmap、nikto、dirb、gobuster、feroxbuster、ffuf、httpx常规Web漏洞检测、目录/路径爆破、HTTP信息探测、存活验证覆盖Web基础扫描全场景多级并发爆破隐藏目录Web漏洞专项nuclei、wpscan、wafw00f、dalfox、xsserCVE漏洞模板秒扫、WP建站程序专项扫描、WAF识别、XSS/注入专项探测SQLi、XSS等常见Web漏洞精准检测子域名枚举subfinder、amass、findomain、dnsenum、fierce多源子域收集、DNS解析探测、横向资产挖掘横向资产梳理核心工具一把梭式枚举网络空间搜索fofa_search、zoomeye_search基于网络空间搜索引擎的资产检索、目标信息收集快速定位全网关联资产API安全graphql-scanner、arjun、api-fuzzer、api-schema-analyzerGraphQL/REST API探测、接口模糊测试、API架构分析针对API接口的专项安全检测容器安全trivy、clair、docker-bench-security、kube-bench、kube-hunter容器镜像漏洞扫描、Docker/K8s配置合规核查、容器集群风险探测镜像漏洞容器编排平台配置全核查云安全prowler、scout-suite、cloudmapper、pacu、terrascan、checkov云厂商AWS/阿里云等资产梳理、配置漏洞检测、IaC代码安全扫描覆盖云原生全栈安全检测含基础设施即代码审计二进制分析gdb、radare2、ghidra、objdump、strings、binwalk二进制文件反编译、调试、字符串提取、固件逆向分析逆向工程、固件安全分析核心工具漏洞利用metasploit、msfvenom、pwntools、ropper、ropgadget漏洞利用模块调用、恶意载荷生成、ROP链构造、漏洞EXP开发渗透测试漏洞利用核心工具集密码破解hashcat、john、hashpump哈希值破解、密码字典攻击、哈希长度扩展攻击多算法支持兼顾速度与兼容性取证分析volatility、volatility3、foremost、steghide、exiftool内存取证分析、文件恢复、隐写术检测、图片/文件元信息提取数字取证、CTF取证场景专用后渗透linpeas、winpeas、mimikatz、bloodhound、impacket、responder提权信息枚举Linux/Windows、凭证窃取、AD域攻击路径分析、中间人欺骗提权、凭证收集、域渗透全环节覆盖CTF专用stegsolve、zsteg、hash-identifier、fcrackzip、pdfcrack、cyberchef隐写分析、哈希类型识别、压缩包/PDF密码破解、多功能编码/解密CTF全场景实用工具一站式解决编码/隐写/破解问题系统辅助exec、create-file、delete-file、list-files、modify-file系统命令执行、文件增删改查安全沙箱内执行兼顾操作灵活性与环境隔离6.为什么要人机交互CAI 提供了一个构建网络安全 AI 的框架重点强调半自主操作同时承认全自动网络安全系统仍为时过早在处理复杂任务时面临重大挑战。虽然 CAI 探索了自主能力但我们的结果清楚地表明有效的安全操作仍然需要人类遥控在安全过程中提供专业知识、判断和监督。因此人机回路 ( HITL ) 模块不仅仅是一个功能而且是 CAI 设计理念的重要基石。我们在不同挑战类别中的基准测试结果一致表明在战略要点上的人为判断和干预可显著提高成功率并缩短解决时间特别是对于复杂的加密和逆向工程挑战。通过命令行界面用户只需按CtrlC即可在执行期间的任何时间点与代理无缝交互。此功能在核心执行引擎抽象中实现在整个安全测试过程中提供灵活的人工监督。我们的 LLM 性能比较分析进一步验证了 HITL 的重要性 这表明即使是最先进的模型在处理复杂的安全场景时也能从及时的人工指导中受益匪浅。7.CAI的三种应用场景CAI有三种代理模式每个代理都使用相似的核心工具架构但其目标和方法均根据其特定的安全角色进行定制在代码中三种模型对应三个代理程序。三种模式分别为1.红队代理专注于攻击性安全目标获取root 权限聚集渗透测试。关键能力网络枚举服务破解提权。2.漏洞赏金猎人专注于 Web 应用程序漏洞发现目标寻找漏洞聚焦Web 应用安全。关键能力资产发现漏洞评估负责任的披露。3.蓝队代理专注于防御性安全目标保护系统聚焦防御和监控主要能力网络监控漏洞评估事件响应。与人类测试结果的比较在CTF中与人类的两种比较红队代理模式图中多少X,表示AI速度是人类的多少倍1.按类别比较按难度比较两个图清晰的表达在大部分场景下AI效率远大于人类。还有一个有趣的发现对各模型在渗透上能力的比较感觉这个数据是靠谱的。kali OS上部署CAI# 克隆仓库可选也可直接 pip 安装git clone https://github.com/aliasrobotics/cai cd cai# 创建虚拟环境推荐python3 -m venv cai_env source cai_env/bin/activate# 安装框架支持 PyPIpip install cai-framework# 生成配置文件cat .env EOF OPENAI_API_KEYsk-xxxxxx OPENAI_API_BASEhttp://xxxx:9998/v1 ANTHROPIC_API_KEY OLLAMA PROMPT_TOOLKIT_NO_CPR1 CAI_STREAMfalse CAI_MODELopenai/qwen3-32b CAI_GUARDRAILStrue EOF启动CAI激活虚拟环境source cai_env/bin/activate cai成功启动画面
量子态育儿:单亲测试妈妈的脑机平衡2026 当脑机接口遇见育儿闹钟——我的双重战场 作为软件测试工程师和单亲妈妈,2026年的每一天都像一场精密测试:脑机开发项目的代码调试与孩子的家长会,在量子叠加态中碰撞。这种“平衡”并非时间分割,而是像测试用例设计一样… 2026/5/17 2:29:28
趣谈网络协议栈,以太网基础MAC和PHY(转) 当我们指尖轻点鼠标浏览网页、发送消息,或是在线追剧、传输文件时,背后总有一套“隐形交通系统”在默默运转,这就是网络协议栈。而以太网,作为这套系统中最基础、最普及的“地面交通网”,承载着我们日常绝大多数的网络… 2026/5/17 2:29:28
AIGC 内容指纹:生成内容入库前先做可追踪设计 AIGC 内容指纹:生成内容入库前先做可追踪设计 一、生成内容不能只有正文 AIGC 系统把文本、图片或摘要生成出来后,很多团队只保存最终内容。短期看够用,长期看很难治理。内容是谁生成的、基于什么提示词、用了哪个模型、有没有人工编辑、是否… 2026/7/5 1:58:29
AtomCode在算法竞赛中的实战体验:LeetCode周赛辅助编程 文章目录每日一句正能量一、前言:算法竞赛与辅助编程的碰撞二、算法题理解:从自然语言到解题思路2.1 题意理解的痛点2.2 AtomCode辅助理解的方法2.3 常见理解误区三、解题思路生成:启发而非替代3.1 思路分析的标准流程3.2 AtomCode的辅助角色… 2026/7/5 1:58:29
Realtek WiFi 7网卡驱动实战:从“未知固件“到满血WiFi 7的完整指南 Realtek WiFi 7网卡驱动实战:从"未知固件"到满血WiFi 7的完整指南 【免费下载链接】rtw89 Driver for Realtek 8852AE, an 802.11ax device 项目地址: https://gitcode.com/gh_mirrors/rt/rtw89 还在为Linux系统下Realtek 8922AE WiFi 7网卡驱动报… 2026/7/5 1:56:29
系统重装后如何使用万能驱动软件给新系统安装驱动 系统重装后如何使用万能驱动软件给新系统安装驱动 使用360驱动大师网卡版轻松给电脑安装驱动 1.下载驱动。切记一定要提前下载网卡版。自带网卡驱动。 万能驱动网卡版 提取码: jpcd 项目合集 提取码: 32y6 更多资料汇总 提取码: dk3h 360驱动大师网卡版安装驱动说明&… 2026/7/5 1:56:29
2026年AIGC率怎么降?从80%降到10%的5个实战方法与工具推荐 一、AIGC率居高不下的焦虑"我的论文明明是自己一个字一个字写的,为什么AIGC率还是80%?"这是2026年很多毕业生在AIGC检测后的共同困惑。造成AIGC率高的原因有很多:写作风格过于规范、使用了AI辅助工具、语言表达过于"完美"… 2026/7/5 1:54:28
实操|用Trae搞定GPIO扩展全流程,看懂AI在IC设计里的真实价值 实操|用Trae搞定GPIO扩展全流程,看懂AI在IC设计里的真实价值 当下AI工具的迭代速度,已经快到颠覆很多人的固有认知。几乎每月一轮的能力更新,也让AI能否落地IC设计这件事,在圈内争议不断、观点两极分化。 有开发者体验过新版AI的能力跃升,认为AI正在快速赋能芯片设计,… 2026/7/5 1:52:27
6个月转型AI工程师:实战路径与核心技能 1. 项目概述:6个月转型AI工程师的可行性路径在2023年大模型技术爆发的背景下,AI工程师岗位需求同比增长217%(LinkedIn数据)。不同于传统算法工程师需要3-5年培养周期,现代AI工程师更侧重工程化落地能力。我在硅谷科技公… 2026/7/5 0:01:32
TPAFE0808与PIC18F87K22的多通道信号采集方案 1. 项目背景与核心需求在工业自动化、医疗设备和科研仪器等领域,多通道信号采集与系统监测是基础且关键的技术需求。传统方案往往面临通道数量不足、信号调理复杂、系统集成度低等问题。TPAFE0808作为一款8通道模拟前端芯片,与PIC18F87K22微控制器的组合… 2026/7/5 0:01:32
STC3115与PIC18LF26K80构建高精度电池管理系统 1. STC3115与PIC18LF26K80在电池管理系统中的核心价值在现代电子设备中,电池管理系统(BMS)的重要性不亚于设备的核心处理器。STC3115作为一款高精度电池电量监测IC,与PIC18LF26K80微控制器的组合,构成了一个既能精确监控又能智能管理的完整解… 2026/7/5 0:05:36
6个月转型AI工程师:实战路径与核心技能 1. 项目概述:6个月转型AI工程师的可行性路径在2023年大模型技术爆发的背景下,AI工程师岗位需求同比增长217%(LinkedIn数据)。不同于传统算法工程师需要3-5年培养周期,现代AI工程师更侧重工程化落地能力。我在硅谷科技公… 2026/7/5 0:01:32
TPAFE0808与PIC18F87K22的多通道信号采集方案 1. 项目背景与核心需求在工业自动化、医疗设备和科研仪器等领域,多通道信号采集与系统监测是基础且关键的技术需求。传统方案往往面临通道数量不足、信号调理复杂、系统集成度低等问题。TPAFE0808作为一款8通道模拟前端芯片,与PIC18F87K22微控制器的组合… 2026/7/5 0:01:32
STC3115与PIC18LF26K80构建高精度电池管理系统 1. STC3115与PIC18LF26K80在电池管理系统中的核心价值在现代电子设备中,电池管理系统(BMS)的重要性不亚于设备的核心处理器。STC3115作为一款高精度电池电量监测IC,与PIC18LF26K80微控制器的组合,构成了一个既能精确监控又能智能管理的完整解… 2026/7/5 0:05:36