六小虎「阶跃星辰」疯狂了!连发6款大模型,多模态霸榜第一
六小虎「阶跃星辰」疯狂了!连发6款大模型,多模态霸榜第一提一个冷知识。
搜索
提一个冷知识。
在AI时代,所见并非所得。
下一代 AI 的发展,似乎遇到了难以逾越的瓶颈。去年 12 月,OpenAI 在 ChatGPT 两周年期间连续发布了 12 天,我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。
当人们已经快要对人工智能产生审美疲劳的时候,这段由ChatGPT掀起的新一波技术革命浪潮不过才进入了第二年。以它为代表的生成式AI(GenAI)不断进化出新的功能,从文本到视频,GenAI的“创造力”使得它对内容领域的冲击特别明显。
人大清华团队提出Search-o1框架,大幅提升推理模型可靠性。尤其是「文档内推理」模块有效融合了知识学习与推理过程,在「搜索+学习」范式基础上,使得模型的推理表现与可靠性都更上一层楼。
代理型人工智能具有显著的潜力。
特朗普刚一上任,就和OpenAI联手了整了个大的:「星际之门计划」正式启动!4年,5000亿美金,美国的AI曼哈顿计划,今日正式开启。
WaveForms致力于开发音频大模型(LLMs),通过创新的端到端音频处理技术,实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同,WaveForms的音频模型不是语音转文本再转语音,而是能够直接处理音频,实现更自然的对话和情感互动。
自由画布类 AIGC 工具:从近期新品(更新)窥见发展趋势——自律才能给我自由。图像 & 视频多主体一致功能:模型上下文能力的重要体现,未来各家模型的标配。指定 AI 生图里的文字,我找到了 9 种解决方案,其中有 2 种快过时了
早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。