区别只在于中间层的设计。
于是吕尧绞尽脑汁把自己关于transformer的理解说出来:“我觉得这都不太对劲,循环神经网络有种死记硬背的感觉,能不能设计一种算法,来捕捉输入数据中的内在算法呢?”
“如果是处理自然语言,那我们说话肯定都有重点嘛,如果能通过算法模型找出重点,然后给予数据反馈,是不是会更好?”
王杉本来没把吕尧的建议当回事,可他那聪明的大脑却下意识开始运转起来。
通过算法找重点?
好像也不是不行。
找重点本质上可以认为是求一个离散概率分布的数学期望,这个通过算法,很容易找到简单自然语言中的重点。
“嘶”
王杉忽然低头抱住脑袋,无数的方程式,构想开始在他脑海里翻涌,那一瞬间喷薄而出的灵感仿佛要把他的脑子撑爆。
吕尧这时候不敢说话了,他悄悄退走,并嘱咐别墅内外的人不要打扰王杉。
内容未完,下一页继续阅读