
专访张祥雨:多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻
专访张祥雨:多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈。
本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈。
《智能涌现》从多名独立信源处得知,大模型“六小虎”之一的阶跃星辰,C端AI应用布局,近半年来出现了以下调整:2024年12月,角色扮演类Agent产品“冒泡鸭”停止大范围投入,团队合并至对话产品“跃问”(现更名为“阶跃AI”),目前仅留部分员工运维。
中国基础大模型市场,彻底变天了!如今牌桌上的玩家已经变成了「基模五强」——字节、阿里、阶跃星辰、智谱和DeepSeek。接下来的巅峰之战,关键制胜点又会在哪里?
当大模型赛道中不少玩家明确表示放弃基础大模型研发,心思放在更聚焦的方向上时,阶跃星辰站出来——就像这家公司第一次亮相时那样,给外界一个明确的回答:
“DeepSeek告诉我们,投流的逻辑是不成立的。”5月8日,久不露面的阶跃星辰CEO姜大昕,出现在北京的一场媒体沟通会上“在多模态领域,如果任何一个方面有短板,都会延缓探索AGI进程。”姜大昕给出了一个鲜明的判断。过去一年中,他在不同场合都在反复提及:多模态是实现AGI的必经之路
最近在看 Agent 方向的论文和产品,已经被各种进展看花了眼。但我发现,真正能超越 demo,能在 B 端场景扎实落地的却寥寥无几。
阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。该模型总参数量为 19B (7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。
近年来,大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而,要实现其高效部署,精细的超参数优化至关重要。为了探究最佳超参数的规律,我们开展了大规模的实证研究,通过在不同配置上进行网格搜索,我们揭示了一套通用的最优超参数缩放定律(Optimal Hyperparameter Scaling Law)。
前几天,朋友跟我报了个猛料:苹果电脑上的可以用AI了。而另一位朋友,则带来了更为准确的消息:M2 Ultra 版本的 Mac Studio,已原生适配阶跃星辰模型全家桶,这应该是第一个全面适配苹果 Mac 设备的中国大模型厂商。
回应DeepSeek,阶跃星辰亮出“三件套”:开源,多模态推理,AI Agent。