AI资讯新闻榜单内容搜索-CaT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CaT
突发:甲骨文CEO下台!刚和OpenAI签下3000亿美元大单,或因路线斗争

突发:甲骨文CEO下台!刚和OpenAI签下3000亿美元大单,或因路线斗争

突发:甲骨文CEO下台!刚和OpenAI签下3000亿美元大单,或因路线斗争

昨天,甲骨文突然宣布换帅!本月初刚去白宫参加闭门晚宴的CEO Safra Catz卸任,接任者是甲骨文云基础设施总裁Clay Magouyrk和甲骨文行业总裁Mike Sicilia。埃里森下定了决心,All in AI。

来自主题: AI资讯
6806 点击    2025-09-24 09:56
突破后训练瓶颈?Meta超级智能实验室又一力作:CaT解决RL监督难题

突破后训练瓶颈?Meta超级智能实验室又一力作:CaT解决RL监督难题

突破后训练瓶颈?Meta超级智能实验室又一力作:CaT解决RL监督难题

为了回答这一问题,来自牛津大学、Meta 超级智能实验室等机构的研究者提出设想:推理计算是否可以替代缺失的监督?本文认为答案是肯定的,他们提出了一种名为 CaT(Compute as Teacher)的方法,核心思想是把推理时的额外计算当作教师信号,在缺乏人工标注或可验证答案时,也能为大模型提供监督信号。

来自主题: AI技术研报
4200 点击    2025-09-23 10:09
美团王兴,又开源一款大模型!

美团王兴,又开源一款大模型!

美团王兴,又开源一款大模型!

最近,美团在AI开源赛道上在猛踩加速。今天,在开源其首款大语言模型仅仅24天后,美团又开源了其首款自研推理模型LongCat-Flash-Thinking。与其基础模型LongCat-Flash类似,效率也是LongCat-Flash-Thinking的最大特点。美团在技术报告中透露,LongCat-Flash-Thinking在自研的DORA强化学习基础设施完成训练

来自主题: AI技术研报
6581 点击    2025-09-22 23:05
集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源

集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源

集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源

创智、基流、智谱、联通、北航、清华、东南联合打造了高效率、高可靠、高可视的 GPU 集合通信库 VCCL(Venus Collective Communication Library),VCCL 已部署于多个生产环境集群中。

来自主题: AI技术研报
6082 点击    2025-09-21 11:08
20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

当我了解到一群平均年龄只有21岁的年轻创业者,在短短几天内就从Y Combinator、General Catalyst等顶级投资机构手中拿到500万美元融资时,我意识到他们可能找到了一个真正的痛点。这家叫Human Behavior的公司,正试图用AI彻底改变企业理解用户行为的方式。他们的方法听起来简单得令人怀疑:让AI直接"观看"用户使用产品的录像,然后自动分析出用户的真实意图和行为模式。

来自主题: AI资讯
6819 点击    2025-09-09 17:59
冲上热搜!美团大模型,靠「快」火了

冲上热搜!美团大模型,靠「快」火了

冲上热搜!美团大模型,靠「快」火了

国内外开发者:亲测,美团新开源的模型速度超快!

来自主题: AI技术研报
6670 点击    2025-09-03 11:41
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

没想到啊,最新SOTA的开源大模型…… 来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。

来自主题: AI资讯
7563 点击    2025-09-01 15:12
独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。

独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。

独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。

昨天,美团低调地开源了其560B参数的混合专家(MoE)模型——LongCat-Flash。 一时间,大家的目光都被吸引了过去,行业内的讨论大多围绕着它在公开基准测试中媲美顶尖模型的性能数据,以及其精巧的MoE架构设计。

来自主题: AI资讯
7246 点击    2025-09-01 11:59