AI资讯新闻榜单内容搜索-模型

Kubernetes环境中作业帮大模型服务流量调度优化实践

随着人工智能技术的快速发展，大语言模型在自然语言处理领域引发了深刻变革。大语言模型在实际应用中的使用越来越广泛，这些模型通常部署在云原生的基础设施上，需要复杂的流量管理机制以确保服务的稳定性、性能、可扩展性和成本效益。在 Kubernetes（K8S）这一容器编排标准中，现有的 Ingress 组件的流量转发机制提供了基于主机名和请求路径的基本流量路由功能。

来自主题: AI资讯

7708 点击 2025-08-02 13:04

多模态后训练反常识：长思维链SFT和RL的协同困境

在语言模型领域，长思维链监督微调（Long-CoT SFT）与强化学习（RL）的组合堪称黄金搭档 —— 先让模型学习思考模式，再用奖励机制优化输出，性能通常能实现叠加提升。

来自主题: AI技术研报

8380 点击 2025-08-02 12:49

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

视频大型语言模型（Video LLMs）的发展日新月异，它们似乎能够精准描述视频内容、准确的回答相关问题，展现出足以乱真的人类级理解力。

来自主题: AI技术研报

7646 点击 2025-08-02 12:43

你的Prompt已达性能极限？试试这个0成本的优化 | 马里兰大学最新

上下文学习（In-Context Learning, ICL）、few-shot，经常看我文章的朋友几乎没有人不知道这些概念，给模型几个例子（Demos），它就能更好地理解我们的意图。但问题来了，当您精心挑选了例子、优化了顺序，结果模型的表现还是像开“盲盒”一样时……有没有可能，问题出在一个我们谁都没太在意的地方，这些例子，到底应该放在Prompt的哪个位置？

来自主题: AI资讯

7277 点击 2025-08-02 12:37

谷歌IMO金牌模型可以用了！推理性能秒了o3、Grok 4

谷歌拿下IMO（国际数学奥林匹克竞赛）金牌的模型——Gemini 2.5 Deep Think，现在可以用起来了。谷歌拿下IMO（国际数学奥林匹克竞赛）金牌的模型——Gemini 2.5 Deep Think，现在可以用起来了。

来自主题: AI资讯

9723 点击 2025-08-02 11:41

GPT-5真身曝光，首测编程惊艳全网！一句话秒生游戏，OpenAI双雄备战AGI

GPT-5更近了！今天，神秘模型Horizon Alpha火遍全网，编码首测性能逆天，各种三方基准实测相继放出。就在发布前夕，OpenAI核心大脑专访坦言模型还有瓶颈，但坚信Scaling Law没有尽头。

来自主题: AI资讯

7195 点击 2025-08-01 16:44

中国在AI领域超越美国已是板上钉钉？吴恩达：美国无法保持领先

中国在人工智能领域已经成为全球竞争的重要力量。根据斯坦福 2025 年 AI 指数报告，美国虽然仍领先于顶级模型数量，但中国正在迅速缩小差距 —— 在 MMLU、HumanEval 等基准测试中的差距已从几乎双位数下降到几乎持平。

来自主题: AI资讯

8352 点击 2025-08-01 16:12

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

近期，随着OpenAI-o1/o3和Deepseek-R1的成功，基于强化学习的微调方法（R1-Style）在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现，但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报

8861 点击 2025-08-01 16:08

字节Seed发布扩散语言模型，推理速度达2146 tokens/s，比同规模自回归快5.4倍

用扩散模型写代码，不仅像开了倍速，改起来还特别灵活！字节Seed最新发布扩散语言模型Seed Diffusion Preview，这款模型主要聚焦于代码生成领域，它的特别之处在于采用了离散状态扩散技术，在推理速度上表现出色。

来自主题: AI资讯

7906 点击 2025-08-01 16:04

驯服复杂表格：九天重磅开源，开启「人与表格对话」智能新时代

7 月 26 日，在 WAIC 2025 世界人工智能大会上，中国移动九天人工智能研究院全面开源九天结构化数据大模型 “数据 - 模型 - 测评” 三位一体的完整模型体系，包括了结构化数据体系、TReB 标准化测评框架、支持微调及推理全流程模型。

来自主题: AI资讯

7839 点击 2025-08-01 15:58