
数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免大模型数学能力骤降,“罪魁祸首”是猫猫?只需在问题后加一句:有趣的事实是,猫一生绝大多数时间都在睡觉。
大模型数学能力骤降,“罪魁祸首”是猫猫?只需在问题后加一句:有趣的事实是,猫一生绝大多数时间都在睡觉。
“在百川智能的那段时间,我和同事们始终处在一种很亢奋的状态。尽管我们常常工作到深夜,甚至一两点钟才下班,但内心非常地充实和开心。”如今回忆起那段经历时,前百川工具链负责人徐文健的眼中依然有光。
你可能没发觉,AI 在很多地方都已经开始「替你创作」了。你最近听的歌、刷到的直播、点开的短片,背后可能并没有真实的「人」。
一位患者饱受下巴疼痛和咔咔声折磨五年,专家束手无策。绝望中,他求助ChatGPT,竟在10秒内找到解决办法!ChatGPT如何在短短几秒内快速破解医学难题?
Agent 产品正发布得火热,但要说到真正懂企业、懂决策的 Agent 还不算常有。其背后,还有大量企业积累的业务数据,在等待被高效利用起来。数据 Agent 会成为一个好解法吗?
Jack Clark 是最关注和熟悉中国在芯片、计算和模型上进展的 AI Lab 领导人之一。他毫不吝啬对中国 AI 进展的认可,将 DeepSeek R1 视作“推理模型大范围扩散”的起点,近期又把 HyperHetero 使用的异构集群叫做通过“超级智能进行持续自我训练”的垫脚石。
灾难前兆,再一次预警。就在最近,微软又裁掉了9000人,最黑色幽默的是,Xbox一位高管甚至建议被裁员工用AI来疗伤?虽然2025年才过了一半,但全美科技行业中已有94000人被裁,接下来这个数字恐怕只会越来越多。
签约项目超120个,协议投资额超400亿元。 7月4日,以“数链首都 宜启未来”为主题的宜宾市2025京津冀投资推介活动在北京举行。活动期间共签约项目122个,签约总金额达403.08亿元,涵盖基金机构、数字经济、新型储能、动力电池、智能网联新能源汽车、低空经济等领域,主要包括鼎晖投资、弘毅投资、大连金慧、同方科技、追觅生态链企业等。
当前,AI正以前所未有的速度席卷全球,医疗是这波浪潮中最耀眼的明星。 被誉为“女版巴菲特”的Cathie Wood(木头姐)发布的报告中提到,医疗保健是AI最被低估的应用领域,引发市场的强烈讨论,海内外AI医疗股暴涨。
这篇文章,我会从几个真实的案例出发,深度拆解一下星流这款产品,以及聊聊:为什么我认为「可控」才是真正的生产力?星流到底如何做到「可控」?以及,「可控性」为什么会是下一阶段 AIGC 的竞争关键?