
内幕曝光:OpenAI模型坦承不会第六题,3人俩月拿下IMO金牌!
内幕曝光:OpenAI模型坦承不会第六题,3人俩月拿下IMO金牌!OpenAI在短短两个月内,让AI从挣扎于小学数学题跃升至国际数学奥林匹克(IMO)金牌水平,背后是通用AI技术的突破。
OpenAI在短短两个月内,让AI从挣扎于小学数学题跃升至国际数学奥林匹克(IMO)金牌水平,背后是通用AI技术的突破。
在可验证强化学习(RLVR)的推动下,大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中,LLM 往往需要结合外部工具进行多轮交互,现有 RL 算法在平衡模型的长程推理与多轮工具交互能力方面仍存在不足。
爱在西元前的歌词里唱到:「当古文明只剩下难解的语言,传说就成了永垂不朽的诗篇。」如今借助DeepMind推出的生成式AI工具Aeneas,考古学家面对古代碑文不再抓瞎了。
日前有网友发现沉浸式翻译扩展程序的部分用户数据暴露在互联网上,这些数据包含部分敏感内容例如加密货币钱包私钥甚至是企业 / 机构的商业合同等。严格来说此次问题并非安全漏洞而是沉浸式翻译提供的功能存在缺陷,即没有对快照链接进行保护导致搜索引擎爬虫可以直接抓取内容并将其放置互联网上公开索引。
厌倦了在Google News、X等平台间切换导致的信息茧房,我发现Particle News通过AI将碎片化新闻整合为“故事拼盘”,并加入多视角分析、即时问答和政治光谱可视化功能,有望打破信息茧房束缚。
千呼万唤始出来的GPT-5上线后,却遇冷了… 特别是OpenAI一刀切替换所有模型后,GPT-4o反而被网友们纷纷招魂。 原因无他,GPT-5太人机。
“听说 Showrunner AI 能直接生成剧本,还被好莱坞大导演抢着用。”我对这种跨界的 “新物种” 总是充满好奇,这玩意儿,是不是又一个噱头?虽仍处于封闭测试的阶段,却已有超 10 万用户挤入等候名单。这个 Showrunner AI,得好好研究研究。
全栈开源生态系统:涵盖Agent框架(MiroFlow)、模型(MiroThinker)、数据(MiroVerse)和训练基础设施(MiroTrain / MiroRL)的全栈开源方案,所有组件和流程均开放共享,便于学习、复用与二次开发。
这家刚揣进 1200 万美金 A 轮融资(Team8 领投)的公司,不看病、不开刀,专做一件事:把医院散落的临床指南,变成医生口袋里的 “智能导航”,在医疗软件死亡率高达 70% 的赛道里,它用 92% 的临床采用率杀出血路,此前获 500 万美元天使投资。
近年来,AI社交赛道作为一个快速崛起的“品种”,曾凭借玩法新颖与技术想象力迅速吸引了市场关注。然而,随着入局者增加,赛道逐渐暴露出增长瓶颈:玩法趋于固化、功能高度同质化、用户体验缺乏持续吸引力。种种迹象都在指向一个信号:市场正在走向降温与饱和。