AI资讯新闻榜单内容搜索-模型训练

仅需200M参数，零样本性能超越有监督！谷歌发布时序预测基础模型TimesFM

TimesFM针对时序数据设计，输出序列长于输入序列，在1000亿时间点数据进行预训练后，仅用200M参数量就展现出超强零样本学习能力！

来自主题: AI技术研报

6143 点击 2024-03-15 15:42

StepCoder将长序列代码生成任务分解为代码完成子任务课程来缓解强化学习探索难题，对未执行的代码段以细粒度优化；还开源了可用于强化学习训练的APPS+数据集。

来自主题: AI技术研报

6678 点击 2024-03-15 15:38

虽然我从来没见过你，但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。

来自主题: AI技术研报

9201 点击 2024-03-15 15:36

OpenAI 的 Sora 在今年 2 月横空出世，把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限，但是在各媒体平台上，Sora 的身影无处不在，大家都在期待着使用它。

来自主题: AI资讯

6860 点击 2024-03-15 15:28

港大发布通用图基座模型OpenGraph，巧妙从LLM中蒸馏零样本图泛化能力。

来自主题: AI技术研报

9567 点击 2024-03-15 12:29

为了让AI更像科学家，他们将人类知识注入大模型…

来自主题: AI技术研报

6832 点击 2024-03-15 12:21

数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。

来自主题: AI技术研报

9217 点击 2024-03-14 16:14

大模型对齐新方法，让数学推理能力直接提升9%。

来自主题: AI技术研报

6945 点击 2024-03-13 11:10

基于大模型的Agent，已经成为了大型的博弈游戏的高级玩家，而且玩的还是德州扑克、21点这种非完美信息博弈。

来自主题: AI技术研报

4233 点击 2024-03-12 18:13

微软亚研院等发布bGPT，仍旧基于Transformer，但是模型预测的是下一个字节（byte）。

来自主题: AI技术研报

9122 点击 2024-03-11 18:04