快速搭建你的数据智能分析 Agent 📅 发布时间:2026/7/4 19:35:53 👁️ 浏览次数: 本方案目标从月度 2 万条或百万级工单文本中自动发现 10–30 个知识主题生成可读知识卡片主题名称、典型描述、根因、推荐方案每条结论附原始工单 ID确保可追溯LLM 调用次数固定与样本量无关整体处理时间2 万条数据小于 5 分钟核心技术组合EmbeddingBGE-M31024 维聚类k-LLMmeansGitHub: jairoadiazr/k-LLMmeans向量存储ClickHouse 原生 Array(Float32) HNSW 索引Agent 框架LangGraph封装为 KnowledgeMiningTool处理位置Embedding 与 k-LLMmeans 聚类全部在 Agent 侧Python 进程完成ClickHouse仅负责数据拉取、向量持久化存储及 HNSW 索引向量存储设计推荐独立表CREATE TABLE IF NOT EXISTS work_order_embeddings ( order_id String, dt Date, embedding Array(Float32), cluster_id UInt32 DEFAULT 0, cluster_summary String ) ENGINE MergeTree() ORDER BY (dt, order_id); ALTER TABLE work_order_embeddings ADD INDEX embedding_hnsw embedding TYPE hnsw(L2Distance) GRANULARITY 1000;系统架构图输出层Agent 侧 Python LangGraphClickHouse 存储层1.时间范围查询2.拉取文本3.生成向量4.读取向量5.LLM 生成质心6.写入聚类结果7.生成报告宽表 wide_work_order_table 工单名 总结 聊天记录向量表 work_order_embeddings embedding HNSW索引KnowledgeMiningToolBGE-M3 Embedding sentence-transformersk-LLMmeans 聚类引擎LLM\nQwen2.5 / DeepSeek / Grok 仅生成质心总结知识维度报告 Markdown/PDF 知识卡片 可追溯ID处理流程图用户输入时间范围Agent 调用 ClickHouse 拉取工单文本数据Agent 侧 BGE-M3 批量生成 Embedding 拼接工单名 总结 聊天记录向量写入 ClickHouse work_order_embeddings 表 支持增量Agent 侧 k-LLMmeans n_clusters15~20 LLM 仅对质心调用 与样本量无关聚类结果写回 ClickHouse cluster_id cluster_summaryLLM 生成知识报告 每簇包含 主题名称 占比 根因与方案 Top5 工单ID知识维度报告完成 可存入知识库 RAG主要优势聚类结果可解释且 100% 可追溯支持百万级扩展分批 Embedding 子采样LLM 调用次数固定成本可控可直接集成现有 ClickHouse 宽表
Pixel Couplet Gen效果展示:乙巳马年像素春联生成惊艳作品集 Pixel Couplet Gen效果展示:乙巳马年像素春联生成惊艳作品集 1. 项目概览 这是一款基于ModelScope大模型驱动的春联生成器。我们创新性地采用夸张的像素游戏风格(Retro Game UI),将传统元素与红白机美学融合,为用户生成独一无二的马年像素春… 2026/3/31 4:42:34
革命性本地AI聊天应用ChatRTX:基于TensorRT-LLM和RAG的完整指南 革命性本地AI聊天应用ChatRTX:基于TensorRT-LLM和RAG的完整指南 【免费下载链接】trt-llm-rag-windows 项目地址: https://gitcode.com/gh_mirrors/tr/trt-llm-rag-windows ChatRTX是一款革命性的本地AI聊天应用程序,它基于NVIDIA的TensorRT-LLM… 2026/5/17 3:31:18
从云中心到边缘节点,Java Runtime冷启动优化全解析,将延迟压至87ms以内 第一章:Java边缘运行时部署的演进与挑战随着物联网、5G和实时AI推理场景的爆发式增长,Java应用正加速向边缘侧迁移。然而,传统JVM设计面向服务器长期运行环境,其启动延迟高、内存占用大、冷启动慢等特性与边缘设备资源受限、事件驱… 2026/5/17 6:07:32
Windows → Windows VSCode Remote SSH 不同子网下的配置流程 Windows → Windows VSCode Remote SSH 不同子网下的配置流程✅ 一、远程机器(Win10)准备0️⃣ 安装 tailscale 并登录1️⃣ 安装 OpenSSH Server2️⃣ 创建开发用户(不要用 Administrator,这里创建的开发用户名是dev)… 2026/7/4 19:35:33
AI工具选型指南:四款主流大模型实战对比与工作流适配 1. 这不是“选软件”,而是给不同任务配一把趁手的刀你刷到这个问题时,大概率正站在手机应用商店里,手指悬在“豆包”“通义千问”“Kimi”“DeepSeek”几个图标上方,犹豫点哪个下载——这场景我太熟了。过去三年,我帮过… 2026/7/4 19:35:33
浅谈PCIE switch PCIe Switch PCIe交换机像是计算机内部的“网络交换机”。作用是把有限的 PCIe 通道(Lanes)扩展出更多接口,让多个 PCIe 设备可以同时连接到 CPU 并进行高速通信。 为什么需要 PCIe Switch? CPU 的 PCIe 通道数量有限,… 2026/7/4 19:35:33
Pyfa终极指南:5个技巧快速掌握EVE Online免费Python舰船配装工具 Pyfa终极指南:5个技巧快速掌握EVE Online免费Python舰船配装工具 【免费下载链接】Pyfa Python fitting assistant, cross-platform fitting tool for EVE Online 项目地址: https://gitcode.com/gh_mirrors/py/Pyfa 您是否曾因在EVE Online中反复登录游戏测… 2026/7/4 19:33:32
Elsevier投稿状态追踪插件:科研工作者的智能审稿监控工具 Elsevier投稿状态追踪插件:科研工作者的智能审稿监控工具 【免费下载链接】Elsevier-Tracker 项目地址: https://gitcode.com/gh_mirrors/el/Elsevier-Tracker 还在为频繁登录Elsevier投稿系统查看论文审稿进度而烦恼吗?Elsevier投稿状态追踪插件… 2026/7/4 19:29:31
YOLOv26模型训练指南:从YOLOv5迁移到高效部署 1. YOLOv26模型训练概述 YOLOv26作为YOLO系列的最新成员,继承了YOLOv5的优秀特性并进行了多项架构改进。使用YOLOv5样本训练YOLOv26模型是一个典型的迁移学习场景,这种训练方式能充分利用已有标注数据的价值,同时发挥新模型架构的优势。在实际… 2026/7/4 19:25:30
STM32F745VG与MC6470 IMU的高性能姿态控制系统设计 1. MC6470与STM32F745VG的黄金组合解析在工业自动化和机器人控制领域,传感器与微控制器的协同工作能力直接决定了系统的响应速度和定位精度。MC6470作为一款6自由度惯性测量单元(6DOF IMU),与STM32F745VG这款基于ARM Cortex-M7内核的高性能微控制器组合&… 2026/7/4 0:00:28
Playwright自动化测试实战:从零搭建现代Web测试框架 1. 项目概述:为什么是 Playwright?如果你正在为现代 Web 应用的自动化测试头疼,尤其是面对那些充斥着动态加载、复杂交互的单页应用(SPA),那么 Playwright 的出现,很可能就是你的解药。我接触过… 2026/7/4 0:00:28
终极指南:如何将JSXBIN二进制文件转换为可读JSX源代码 终极指南:如何将JSXBIN二进制文件转换为可读JSX源代码 【免费下载链接】jsxbin-to-jsx-converter JSXBin to JSX Converter written in C# 项目地址: https://gitcode.com/gh_mirrors/js/jsxbin-to-jsx-converter 你是否曾经面对过Adobe产品的JSXBIN文件感到… 2026/7/4 0:02:28