相关文章
大模型LLMs框架Langchain之内存管理
写在前文:本文主要做Redis版本和本地版本的内存管理
其实我并不知道这个功能有多少鸡肋...毕竟在工作中,我更加喜欢用JavaPython的混合架构,然后Python会专门处理LLMs相关的,但是比如历史记录什么的,我会在java工程中…
建站知识
2025/5/1 17:23:33
es中安装ik分词器
在线安装ik插件(较慢)
docker exec -it es /bin/bash ./bin/es-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip 看到报错了,我访问一下。就是没有了…
建站知识
2025/4/27 10:45:11
ubuntu 2204键盘按键映射修改
键盘的按键和实际输出不一致,可以通过以下方法重新修改按键keycode.
1.在终端执行如下命令:
xev -event keyboard 上边64是alt_l,但是键盘上对应的super(windows)。
2.vim /usr/share/X11/xkb/keycodes/evdev //<LALT> 64; 注释&l…
建站知识
2025/4/27 7:50:23
向量数据库是什么,它有什么作用?
环境:
向量数据库
问题描述:
向量数据库是什么,它有什么作用 解决方案:
向量数据库是一种专门设计用于高效处理高维向量数据的系统,主要用于存储、索引、查询和检索高维向量数据,特别适合处理非结构化数…
建站知识
2025/5/1 17:00:34
leetcode107 二叉树的层次遍历2
只需要将正常层次遍历的结果翻转即可
遇到的问题:在 level 函数中,res 是按值传递的,这意味着在递归过程中对 res 的修改不会影响外部的 res 变量。因此,最终返回的 res 始终是空的,即使你在 level 函数里添加了元素。…
建站知识
2025/4/28 5:31:51
【原理系列】计算机组成原理-第一遍阅读总结
目录
创作灵感:
总览:
1、计算机抽象与技术
2、ISA指令集架构
3、CPU处理器
4、存储器 创作灵感:
夯实计算机原理,构建知识框架 此系列将总结和记录我对 【深入浅出计算机组成原理-台湾科技大学/元智大学的刘一宇教授】 的…
建站知识
2025/5/1 16:44:57
AI大模型底层技术——Adaptive Rank Allocation
1. Adaptive Rank Allocation
(1) 定义
"Adaptive Rank Allocation" 指的是一种在 LoRA (Low-Rank Adaptation) 微调过程中,根据模型不同层或模块的重要性,自适应地分配 LoRA 秩 (Rank) 的技术。传统的 LoRA 方法通常为所有层或模块设置相同…
建站知识
2025/5/1 12:57:33