
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?文生图 or 图生文?不必纠结了!
文生图 or 图生文?不必纠结了!
大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。
前百度集团副总裁、小度科技CEO景鲲离职创业的GenSpark,最近从AI搜索向AI Agent转型,看来是想脱离AI搜索的竞争红海,向更智能的Agents服务领域进发,推特上很多网友评价,此次新产品比较有看点。
前OpenAI研究员Daniel Kokotajlo团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来:从2025年最贵AI诞生,到2027年自我进化的Agent-5渗透政府决策,人类可能在不知不觉中交出主导权。
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。
最近一直在用4o抽各种好玩的卡,但每个提示词都要单独写,于是我就在琢磨能不能搞个通用提示词和稳定的风格出来。
去年 Anthropic 发布 Computer Use 的时候,引发了一次大家对 AI agent 的想象。
谷歌AI团队再掀风暴,Gemini负责人Sissie Hsiao立即卸任,由Google Labs负责人Josh Woodward全面接管。这次领导层变动透露出谷歌正重新思考AI战略布局,以对抗风头正劲的OpenAI。AI竞赛进入新阶段,谷歌急需找到突破口,Gemini能否翻盘值得关注。
当大多数AI Agent仍在挣扎于结构化推理能力不足的困境时,本文带来了一个来自认知科学领域的突破性解决方案。
无人在意的角落,又一款中国AI产品在海外默默“杀疯了”。