从Rust模块化探索到DLB 2.0实践

Meta新注意力机制给 Transformer 升了级！底层架构的革命！

1.导读随着大模型训练日益受到“高质量 token 不足”的限制，如何在有限 token 预算下实现更高效的推理与学习，成为大语言模型架构演进的关键问题。传统 Transformer 注意力机制虽然强大，但其计算本质仍局限于二元关系（dot produ…

建站知识 2026/1/14 16:04:09

机器学习：反向神经元传播公式推导

首先，我们有正向传播的公式： qk1,i∑j1nkwk1,i,j⋅rk,jbk1,i q_{k1,i}\sum_{j1}^{n_{k}} w_{k1,i,j}\cdot r_{k,j}b_{k1,i} qk1,ij1∑nkwk1,i,j⋅rk,jbk1,i ∂l∂wk,i,j∂l∂qk,i⋅∂qk,i∂wk,i,j∂l∂qk,i⋅rk−1,j \begin{aligned} \frac{…

建站知识 2026/1/14 16:13:20

一天一道Sql题(day05)

有用户登录表A，字段如下： 字段类型含义 user_id bigint 用户uid device_id bigint 设备ID login_date string 登录日期求解：如果用户第一天登录算新用户，求每一天登录的新老用户数思路：用开窗函数增加一…

建站知识 2026/1/14 16:13:48

认识神经网络和深度学习

什么是神经网络？什么又是深度学习？二者有什么关系？……带着这些疑问，进入本文的学习。什么是神经网络神经网络（Neural Network）是一种模仿生物神经系统（如大脑神经元连接方式）设计的…

建站知识 2026/1/14 4:23:29

Swift 中的COW（写时复制）

目录 1、为什么需要 COW？2、COW 的工作原理3、如何验证 COW？4、自定义类型如何实现 COW？5、COW 的注意事项6、标准库中的 COW 类型总结在 Swift 中，COW（Copy-On-Write，写时复制）是一种内存优化技术，主要用于值类型（如 Array、Dictionary、String、Set 等），其核心思…

建站知识 2026/1/11 22:55:25