AI资讯新闻榜单内容搜索-Claude

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude
国产游戏理解模型刷新SOTA,对话逗逗AI CEO:开源模型+行业数据是突破关键

国产游戏理解模型刷新SOTA,对话逗逗AI CEO:开源模型+行业数据是突破关键

国产游戏理解模型刷新SOTA,对话逗逗AI CEO:开源模型+行业数据是突破关键

游戏理解领域模型LynkSoul VLM v1,在游戏场景中表现显著超过了包括GPT-4o、Claude 4 Sonnet、Gemini 2.5 Flash等一众顶尖闭源模型。背后厂商逗逗AI,亦在现场吸引了不少关注的目光。

来自主题: AI资讯
8751 点击    2025-10-11 17:25
250份文档就能给大模型植入后门:不分参数规模

250份文档就能给大模型植入后门:不分参数规模

250份文档就能给大模型植入后门:不分参数规模

大模型安全的bug居然这么好踩??250份恶意文档就能给LLM搞小动作,不管模型大小,600M还是13B,中招率几乎没差。这是Claude母公司Anthropic最新的研究成果。

来自主题: AI技术研报
9384 点击    2025-10-11 12:04
刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局

刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局

刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局

Anthropic宣布任命前Stripe CTO Rahul Patil为新任首席技术官,此次换帅旨在强化Anthropic的AI基础设施,以应对Claude产品快速增长带来的算力和能耗压力。同时,也是为了面对OpenAI和Meta数千亿美元级的基础设施投入而进行的一次战略调整。

来自主题: AI资讯
10501 点击    2025-10-03 11:52
GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

核心速递: GLM-4.6 发布,榜单排名提升,价格不变 实测效果对齐 Claude 4,超越其他国产模型 GLM 开发者包月套餐升级,1/7 价格取得 Claude 4 9/10 的效果,值得使用

来自主题: AI产品测评
10548 点击    2025-10-01 17:12
节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6,刚好撞车 Claude Sonnet 4.5。但有一点不同,智谱的 GLM-4.6 会继续开源,它即将上线 Hugging Face、ModelScope 等平台,遵循 MIT 协议。

来自主题: AI资讯
9052 点击    2025-10-01 11:46
Claude Sonnet 4.5被炸出来了,依旧最强编程,连续30小时自主运行写代码

Claude Sonnet 4.5被炸出来了,依旧最强编程,连续30小时自主运行写代码

Claude Sonnet 4.5被炸出来了,依旧最强编程,连续30小时自主运行写代码

最强编程模型让位了。 但没有换人,依然是Claude。 新发布的Claude Sonnet 4.5,在SWE-bench上的成绩比Sonnet 4提升了1.8个百分点,而且提质不加价。

来自主题: AI资讯
8447 点击    2025-09-30 16:20
刚刚,Claude Sonnet 4.5重磅发布,编程新王降临!

刚刚,Claude Sonnet 4.5重磅发布,编程新王降临!

刚刚,Claude Sonnet 4.5重磅发布,编程新王降临!

今天凌晨,Claude Sonnet 4.5发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象

来自主题: AI资讯
9395 点击    2025-09-30 09:42
陈丹琦新作:大模型强化学习的第三条路,8B小模型超越GPT-4o

陈丹琦新作:大模型强化学习的第三条路,8B小模型超越GPT-4o

陈丹琦新作:大模型强化学习的第三条路,8B小模型超越GPT-4o

结合RLHF+RLVR,8B小模型就能超越GPT-4o、媲美Claude-3.7-Sonnet。陈丹琦新作来了。他们提出了一个结合RLHF和RLVR优点的方法,RLMT(Reinforcement Learning with Model-rewarded Thinking,基于模型奖励思维的强化学习)。

来自主题: AI技术研报
9462 点击    2025-09-28 23:03
iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

据 9to5Mac 报道,iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 开发者测试版隐藏的代码显示,苹果正在为 App Intents 引入 MCP 支持打基础。这也意味着未来,我们能让 ChatGPT、Claude 或其他任何兼容 MCP 的 AI 模型直接与 Mac、iPhone 和 iPad 应用交互。

来自主题: AI资讯
7719 点击    2025-09-27 16:08
谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己

谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己

谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己

OpenAI发布最新研究,却在里面夸了一波Claude。他们提出名为GDPval的新基准,用来衡量AI模型在真实世界具有经济价值的任务上的表现。具体来说,GDPval覆盖了对美国GDP贡献最大的9个行业中的44种职业,这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验的行业专家的代表性工作设计而成。

来自主题: AI技术研报
10558 点击    2025-09-26 16:03