提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交
提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交大语言模型(LLM)能力提升引发对潜在风险的担忧,洞察其内部“思维过程”、识别危险信号成AI安全核心挑战。
搜索
大语言模型(LLM)能力提升引发对潜在风险的担忧,洞察其内部“思维过程”、识别危险信号成AI安全核心挑战。
AI生态系统的总收入与已投入的资金相比仍然相形见绌,如果说有什么不同的话,那就是我去年对科技巨头们在AI上赚取多少收入的估计可能还太高了。
在 3D 重建领域,无论是 NeRF 还是最新的 3D Gaussian Splatting(3DGS),在生成逼真新视角时仍面临一个核心难题:视角一旦偏离训练相机位置,图像就容易出现模糊、鬼影、几何错乱等伪影,严重影响实际应用。
大语言模型在数学证明中常出现推理漏洞,如跳步或依赖特殊值。斯坦福等高校团队提出IneqMath基准,将不等式证明拆解为可验证的子任务。结果显示,模型的推理正确率远低于答案正确率,暴露出其在数学推理上的缺陷。
只训练数学,却在物理化学生物战胜o1!强化学习提升模型推理能力再添例证。
大家好,我是袋鼠帝 最近我发现好几个AI交流群炸锅了 起因是一款AI编程工具,大家聊得热火朝天。这款AI编程工具叫:Augment Code,它的slogen是更好的上下文、更好的Agent、更好的代码
AI战火越烧越旺,苹果也坐不住了!据爆料,库克正密谋史上最大手笔收购——他盯上了估值高达140亿美元的AI搜索新星Perplexity!这场豪赌不仅会改写Siri和Safari的命运,更是苹果对抗OpenAI和谷歌的一记重拳。谁说苹果不焦虑?这次要动真格了。
最近这段时间又一匹AI coding黑马正在快速崛起,感兴趣的朋友可以先看下这个视频,在Every最新一期播客里,他们对当前所有AI coding产品做了一个评级分类,而跟Claude code共同排在S级的就是最近Sourcegraph刚推出的Ampcode,而爆火的Cursor也只排在了第二档次的A级。
让产品团队共享设计语言,以构建可用、智能和安全的Gen AI体验
今年以来具身智能赛道最大的单笔融资