
北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师
北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师给大模型当老师,让它一步步按你的想法做数据分析,有多难?
给大模型当老师,让它一步步按你的想法做数据分析,有多难?
虎嗅从多个独立信源获悉,半年前,某DeepSeek核心高管已悄然离职创业,并将于2025年圣诞节前后发布Agent产品。有信源告诉虎嗅,该高管系原DeepSeek CTO。
今年的苹果,到底有没有新活?
上周日,奇绩创坛在北京中关村国际创新中心举办了其 2025 年春季创业营路演日,共有 57 家公司参与了路演。
近日, Mastra AI 创始人 Sam Bhagwat 在 X 上发布了一条推文,称其中提到大约 60~70% 的 YC X25 Agent 公司正在使用 TypeScript 构建他们的 AI Agent。
你有没有想过,那些电视台、制作公司里堆积如山的视频素材,可能马上就要被彻底重新定义了?想象一下,从数千小时的视频内容中找到你需要的那一个镜头,不再需要安排一群人没日没夜地看片子、做标记,而是只需要简单描述一句"奥巴马谈论人权的片段",系统就能立刻定位到精确的时间点,并提供详细的场景描述、人物信息和镜头分析。
前天,生财有术的老板亦仁发布了一条「超级标」(至少价值千万以上的现象级行业机会): 随着GPT-4o图像革命而来的,是无数的创业机会。
在2024年,公司顺应技术趋势与客户需求变化,完成以 AI 为核心的战略升级,正式推出“一站式 AI 办公支撑平台”,该平台架构可概括为:“一底座・双 Agent・全 AI 智能协同”。
Agent 和扣子一直是大家讨论比较多的话题。但对大部分人而言,这更像是一场围观,而非亲自上场。
AI为了“活下去”,对人类指令阳奉阴违。智源大会现场,图灵奖得主Yoshua Bengio发表了题为“Avoiding catastrophic risks from uncontrolled AI agency”的主旨演讲,谈到了他目睹到的一些惊人行为。