当前位置：首页 > article >正文

基于 pytorch 的手写 transformer + tokenizer

article 2025/2/28 15:23:16

先放出 transformer 的整体结构图，以便复习，接下来就一个模块一个模块的实现它。
在这里插入图片描述

1. Embedding

在这里插入图片描述

Embedding 部分主要由两部分组成，即 Input Embedding 和 Positional Encoding，位置编码记录了每一个词出现的位置。通过加入位置编码可以提高模型的准确率，因为同一个词出现在不同位置可能代表了不同意思，这直接影响了最终的结果，所以要考虑位置因素。

位置编码公式：

STL总结

节流还在用JS吗？CSS也可以实现哦

Linux 路由表说明

剑指 Offer II 031. 最近最少使用缓存

Linux:函数指针做函数参数

OKHttp 源码解析（二）拦截器

中断控制器

每日算法题