这个网站,把人类叙事彻底分析透了
这个网站,把人类叙事彻底分析透了流行梗随风而过,TV Tropes 永垂不朽。
来自主题: AI资讯
3173 点击 2024-11-04 09:34
流行梗随风而过,TV Tropes 永垂不朽。
RNN每个step的隐状态都取决于上一个step的输出,这种连续的状态转移方式使得RNN天然带有位置信息。
大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token
谷歌刚刷新大模型上下文窗口长度记录,发布支持100万token的Gemini 1.5,微软就来砸场子了。