AI资讯新闻榜单内容搜索-Traini

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Traini
上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

回顾 AGI 的爆发,从最初的 pre-training (model/data) scaling,到 post-training (SFT/RLHF) scaling,再到 reasoning (RL) scaling,找到正确的 scaling 维度始终是问题的本质。

来自主题: AI技术研报
4420 点击    2025-03-06 09:46
跟硅谷的核心AI公司聊完后,得到了这 60 条关键洞察

跟硅谷的核心AI公司聊完后,得到了这 60 条关键洞察

跟硅谷的核心AI公司聊完后,得到了这 60 条关键洞察

对 LLM 来说,Pre-training 的时代已经基本结束了。视频模型的 Scaling Law,瓶颈还很早。具身智能:完全具备人类泛化能力的机器人,在我们这代可能无法实现

来自主题: AI资讯
7085 点击    2025-01-24 12:57
Atom Capital:中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

Atom Capital:中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

Atom Capital:中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

2024又是AI精彩纷呈的一年。LLM不再是AI舞台上唯一的主角。随着预训练技术遭遇瓶颈,GPT-5迟迟未能问世,从业者开始从不同角度寻找突破。以o1为标志,大模型正式迈入“Post-Training”时代;开源发展迅猛,Llama 3.1首次击败闭源模型;中国本土大模型DeepSeek V3,在GPT-4o发布仅7个月后,用 1/10算力实现了几乎同等水平。

来自主题: AI资讯
7790 点击    2025-01-19 10:38
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic

Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic

Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic

随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。

来自主题: AI技术研报
4425 点击    2024-10-14 15:46
Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现,后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文,总结了科技巨头们所使用的模型后训练配方。

来自主题: AI技术研报
10597 点击    2024-08-19 14:47
20万铲屎官,已经通过AI和宠物闲聊 | New Things

20万铲屎官,已经通过AI和宠物闲聊 | New Things

20万铲屎官,已经通过AI和宠物闲聊 | New Things

AI“狗语翻译器”,让人类与狗跨物种交流。

来自主题: AI资讯
9524 点击    2024-08-05 13:44
ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性

ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性

ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性

针对视觉-语言预训练(Vision-Language Pretraining, VLP)模型的对抗攻击,现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性,但这些对抗样本高度依赖于代理模型生成,存在代理模型过拟合的风险。

来自主题: AI技术研报
9654 点击    2024-07-21 17:12