待解决 81
5
置顶
互帮互助——那些年遇到的面试题

可以在本帖回复面试的公司,遇到的面试题,面试题答案
人多力量大,咕泡的泡泡们再也不怕面试题啦~~~~~~~~

未回答 0
0
直播课的一刷的一些疑问....

感觉看完后好像信息从脑子过了一遍,又没记住什么东西。
就记住了BERT---->Encoder-only,GPT----->Decoder-only
自注意力机制的公式:softmax(QK^T/dk)V

1.png
然后这个是在说多头注意力机制吧?同一个输入x经过8个不同的注意力头,得到不同的特征Zi,然后把他们“拼接”起来,经过线性变换,最终得到这个输入x的特征Z是这样嘛?

2.png
但是在这个里面又说这些不是拼接的,是串联的,有点懵。

未回答 0
0
不分块,直接输入一张图片,为什么不行?

不分块,直接输入一张图片,为什么不行?

未回答 0
0
神经网络层中尺寸问题

为什么隐层尺寸要设置128,256呢?这个有什么规定嘛?

未回答 0
0
关于初始化的问题

其实在真实场景中,大部分还是使用的是预训练权重作为初始化。是这样子嘛?

未回答 0
0
为啥不讲背景呢 ?

比如为啥要做向量存储,存储的意义和目的是啥

待解决 1
0
LinkedList在实际业务中的使用场景有哪些?

LinkedList在实际业务中的使用场景有哪些?

待解决 1
0
数组的性能问题,在现在的服务器下还要优先考虑的吗?

现在的服务器在硬件的加持下,性能是比较恐怖的。那么是在什么极端情况下,需要考虑到数组的性能优化?

未回答 0
0
疑问:个人应用本地部署小模型?硬件要求

疑问:是不是个人应用的时候,可以本地部署小模型?需要硬件要求多少。

未回答 0
0
seaborn 的数据集导入

使用seaborn 导入数据集是不是需要翻墙才可以。