谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己
谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己OpenAI发布最新研究,却在里面夸了一波Claude。他们提出名为GDPval的新基准,用来衡量AI模型在真实世界具有经济价值的任务上的表现。具体来说,GDPval覆盖了对美国GDP贡献最大的9个行业中的44种职业,这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验的行业专家的代表性工作设计而成。
搜索
OpenAI发布最新研究,却在里面夸了一波Claude。他们提出名为GDPval的新基准,用来衡量AI模型在真实世界具有经济价值的任务上的表现。具体来说,GDPval覆盖了对美国GDP贡献最大的9个行业中的44种职业,这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验的行业专家的代表性工作设计而成。
不怕故障的机器人大脑来了这个大脑,就是估值已达45亿美元(截至今年6月)的Skild AI新推出的Skild Brain,它在一个包含十万种机器人姿态的虚拟环境中,训练了相当于一千年的时间才得以成型。更值得一提的是,此模型从未在这些机器人上进行过训练,它对它们的控制能力完全是涌现出来的。
作为一名从移动互联网时代「穿越」而来的连续创业者,他经历过完整的周期起伏。而在 AI 时代,他选择不做具体的品类选手,而是成为一个「赛道服务者」。他创立的矩阵魔方 ( Cubo Group ),在过去一年多里,服务了超过 100 个 AI 产品的全球化营销,其中既有从零崛起的明星项目,也有在 4 个月内实现 ARR 从数百万到 5000 万美金的惊人增长案例。
我一个 AI 圈的,为啥会关注到电影圈呢?倒不是因为我爱看电影,而是因为电影节的放映单元,突然冒出来了我们圈子里几个“老熟人”:Seedream(图像创作模型)、Seedance(视频生成模型)、即梦 AI。
最近 flowith 推出了全新画布,交互形态全新升级,现在 AI 生成的任意内容,都可以被很方便的右键点击节点,存入任意知识库,后续工作都可以调用。说实话,flowith 是一款上手门槛比较高的产品,它不像一般对话式的 ChatBot 那样简单,
两项最新研究更新了Brynjolfsson最初提出的生产力悖论,揭示企业和入门级岗位所面临的危机——以及初创公司的机遇。20世纪90年代,Erik Brynjolfsson及其同事提出“生产力悖论”:尽管信息技术快速进步、电脑在工作场所普及,生产率增长却依旧乏力。该悖论指出,仅拥有新技术不足以推动生产力,还需组织变革、技能提升和业务流程创新等补充因素。
你有没有想过,AI助手的终极形态应该是什么样的?是更聪明的聊天机器人,还是能真正帮你完成复杂工作的数字员工?今天,当我体验了Kimi刚刚发布的"OK Computer" Agent模式后,我突然意识到:AI行业可能正在经历一次根本性的范式转变——从"回答问题"到"完成任务"。
9 月 25 日,生数科技新一代图生视频大模型 Vidu Q2 正式全球上线,打破了原有 AI 生成的表情太假,动作飘忽不定,运动幅度不够大,无法指哪打哪的行业问题,实现从 “视频生成” 到 “演技生成”,从 “动态流畅” 到 “情感表达” 的革命性跨越,标志着 AI 视频生成技术正式从追求 “形似” 进入追求 “神似” 的新纪元
其实大语言模型的“教育”问题也差不多。研究者在训练和使用这些模型时,离不开提示词。这就像一份人生剧本,告诉模型“你是谁?”“你要做什么?”“你能做到哪里?”但问题是,提示词到底应该像家长一样,
谷歌最新发布的Gemini Robotics 1.5系列模型,让机器人真正学会了「思考」,还能跨不同具身形态学习技能。这意味着,未来的机器人将成为和人类协作、主动完成复杂任务的智能伙伴。