浅谈PCIE switch 📅 发布时间:2026/7/4 19:35:33 👁️ 浏览次数: PCIe Switch PCIe交换机像是计算机内部的“网络交换机”。作用是把有限的 PCIe 通道Lanes扩展出更多接口让多个 PCIe 设备可以同时连接到 CPU 并进行高速通信。为什么需要 PCIe SwitchCPU 的 PCIe 通道数量有限如果你想在系统里插满好几块高性能显卡GPU、十几块 NVMe 固态硬盘SSD以及多块万兆网卡CPU 通道根本不够用。这时候就需要 PCIe Switch 出马了通道复用扩展 它向上Upstream只占用 CPU 很少的通道比如 16 条向下Downstream却可以延伸出 32 条甚至 64 条通道连给更多的设备Switch 扮演了“集线器/分流器”的角色。数据路由分流 多个下游设备通过 Switch 共享上游带宽Switch 负责调度数据包TLP把数据精确投递到目标设备。工作原理与内部拓扑在逻辑上一个 PCIe Switch 并不是简单的硬件连线它在系统枚举时会被识别为一组桥接设备PCI-to-PCI Bridges。现代的 PCIe Switch如 Broadcom/博通、Microchip/微芯 的产品不仅仅做数据转发它还自带很多功能。1Peer-to-Peer (P2P) 通信如果设备 A 想给设备 B 发数据比如 GPU 1 拷贝数据到 GPU 2数据可以直接在 PCIe Switch 内部转发不需要绕道 CPU 和系统内存。这极大地降低了延迟解放了 CPU。2Non-Transparent Bridging (NTB非透明桥)允许连接两个不同的 CPU 系统多主机拓扑。两个系统通过 NTB 互相隔离各自的内存地址空间但又能实现高速的数据共享常用于高可用群集和双控存储服务器。3热插拔与故障隔离某个下游的 SSD 坏了或者被拔掉Switch 能把这个端口隔离不影响其他端口和整机系统的稳定运行。应用场景1开启 ACS访问控制服务GPU 1 - Switch - CPU/IOMMU - Switch - GPU 2安全隔离、延迟大、阿里云、腾讯云等公有云的多租户虚拟化环境。2关闭ACS任意两个插在同一个 Switch 下的设备就可以不受控地互相读写对方的内存。这在普通的单用户 PC 上没问题但在云计算、多租户服务器里就是灾难。不安全、延迟小、单一用户独占的 AI 训练服务器、高性能计算集群其他概念ATS 的全称是 Address Translation Services地址转换服务。它是 PCIe 规范中的一个重要扩展协议。一句话总结它的核心作用把主机的地址翻译工作“卸载”给 PCIe 设备自己去干从而大幅减少 IOMMU 的查表延迟。在没有 ATS 之前设备每一次进行 DMA直接内存访问数据包发到主控端时IOMMU 都必须临时去查内存里的页表。当并发量极大时IOMMU 的查表性能就会彻底爆掉成为系统瓶颈。在多卡 AI 服务器里如果要开启虚拟化安全隔离IOMMU 就必须介入。此时如果设备支持 ATS两块 GPU 就可以在本地提前把地址翻译好。当它们发出的 TLP 到达 PCIe Switch 时数据包已经带着明明白白的“物理地址标签”了。Switch 只要对准地址窗口直接转发就能实现真正的硬件级 P2P把传输延迟压到最低。
Pyfa终极指南:5个技巧快速掌握EVE Online免费Python舰船配装工具 Pyfa终极指南:5个技巧快速掌握EVE Online免费Python舰船配装工具 【免费下载链接】Pyfa Python fitting assistant, cross-platform fitting tool for EVE Online 项目地址: https://gitcode.com/gh_mirrors/py/Pyfa 您是否曾因在EVE Online中反复登录游戏测… 2026/7/4 19:33:32
Elsevier投稿状态追踪插件:科研工作者的智能审稿监控工具 Elsevier投稿状态追踪插件:科研工作者的智能审稿监控工具 【免费下载链接】Elsevier-Tracker 项目地址: https://gitcode.com/gh_mirrors/el/Elsevier-Tracker 还在为频繁登录Elsevier投稿系统查看论文审稿进度而烦恼吗?Elsevier投稿状态追踪插件… 2026/7/4 19:29:31
YOLOv26模型训练指南:从YOLOv5迁移到高效部署 1. YOLOv26模型训练概述 YOLOv26作为YOLO系列的最新成员,继承了YOLOv5的优秀特性并进行了多项架构改进。使用YOLOv5样本训练YOLOv26模型是一个典型的迁移学习场景,这种训练方式能充分利用已有标注数据的价值,同时发挥新模型架构的优势。在实际… 2026/7/4 19:25:30
如何快速打造个性化表盘:小米手表表盘设计终极指南 如何快速打造个性化表盘:小米手表表盘设计终极指南 【免费下载链接】Mi-Create Unofficial watchface creator for Xiaomi wearables ~2021 and above 项目地址: https://gitcode.com/gh_mirrors/mi/Mi-Create 你是否厌倦了千篇一律的默认表盘?想… 2026/7/4 20:47:44
E-Hentai Downloader:解放双手的图库批量下载工具 E-Hentai Downloader:解放双手的图库批量下载工具 你是否曾因需要手动保存上百张图片而感到手指酸痛?是否经历过因网络中断导致下载进度全部丢失的沮丧?当面对精心整理的图库却要花费数小时进行分类归档时,你是否渴望一种更高效的… 2026/7/4 20:47:44
B站视频下载新姿势:3步解锁离线观看自由 B站视频下载新姿势:3步解锁离线观看自由 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi/BilibiliDow… 2026/7/4 20:47:44
[LangChain中的Multi-Agent模式-04]Skill轻量化智能体构建:避免上下文污染的专业化路径 在技能模式(Skills)中,专门化的能力被打包成可调用的技能,以增强Agent的行为。技能主要是由提示驱动的专业化功能,Agent可以按需调用这些功能。关键Skills的详细说明,请参阅Anthropic的官方文档“[Agen… 2026/7/4 20:43:44
简单大话筛微信小程序游戏源码 简介: 简单大话筛微信小程序游戏源码 源码下载:https://download.csdn.net/download/m0_66047725/92879719 图片: 2026/7/4 20:41:43
Fast-GitHub终极指南:如何让GitHub下载速度提升10倍的免费解决方案 Fast-GitHub终极指南:如何让GitHub下载速度提升10倍的免费解决方案 【免费下载链接】Fast-GitHub 国内Github下载很慢,用上了这个插件后,下载速度嗖嗖嗖的~! 项目地址: https://gitcode.com/gh_mirrors/fa/Fast-GitHub 对于… 2026/7/4 20:39:43
STM32F745VG与MC6470 IMU的高性能姿态控制系统设计 1. MC6470与STM32F745VG的黄金组合解析在工业自动化和机器人控制领域,传感器与微控制器的协同工作能力直接决定了系统的响应速度和定位精度。MC6470作为一款6自由度惯性测量单元(6DOF IMU),与STM32F745VG这款基于ARM Cortex-M7内核的高性能微控制器组合&… 2026/7/4 0:00:28
Playwright自动化测试实战:从零搭建现代Web测试框架 1. 项目概述:为什么是 Playwright?如果你正在为现代 Web 应用的自动化测试头疼,尤其是面对那些充斥着动态加载、复杂交互的单页应用(SPA),那么 Playwright 的出现,很可能就是你的解药。我接触过… 2026/7/4 0:00:28
终极指南:如何将JSXBIN二进制文件转换为可读JSX源代码 终极指南:如何将JSXBIN二进制文件转换为可读JSX源代码 【免费下载链接】jsxbin-to-jsx-converter JSXBin to JSX Converter written in C# 项目地址: https://gitcode.com/gh_mirrors/js/jsxbin-to-jsx-converter 你是否曾经面对过Adobe产品的JSXBIN文件感到… 2026/7/4 0:02:28