5可以在本帖回复面试的公司,遇到的面试题,面试题答案
人多力量大,咕泡的泡泡们再也不怕面试题啦~~~~~~~~
0感觉看完后好像信息从脑子过了一遍,又没记住什么东西。
就记住了BERT---->Encoder-only,GPT----->Decoder-only
自注意力机制的公式:softmax(QK^T/dk)V

然后这个是在说多头注意力机制吧?同一个输入x经过8个不同的注意力头,得到不同的特征Zi,然后把他们“拼接”起来,经过线性变换,最终得到这个输入x的特征Z是这样嘛?

但是在这个里面又说这些不是拼接的,是串联的,有点懵。
0不分块,直接输入一张图片,为什么不行?
0为什么隐层尺寸要设置128,256呢?这个有什么规定嘛?
0其实在真实场景中,大部分还是使用的是预训练权重作为初始化。是这样子嘛?
0比如为啥要做向量存储,存储的意义和目的是啥
0LinkedList在实际业务中的使用场景有哪些?
0现在的服务器在硬件的加持下,性能是比较恐怖的。那么是在什么极端情况下,需要考虑到数组的性能优化?
0疑问:是不是个人应用的时候,可以本地部署小模型?需要硬件要求多少。
0使用seaborn 导入数据集是不是需要翻墙才可以。