AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

现有的方法对大语言模型(LLM)「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架,通过为每个有害问题制定详细评分指南,显著降低了误判率,揭示了越狱攻击的真实成功率远低于此前估计,并为未来研究提供了更可靠的评估标准。

来自主题: AI技术研报
6665 点击    2025-08-02 13:15
谷歌深夜放出 IMO 金牌模型,多项测试力压 Grok 4、OpenAI o3!网友评论两极分化

谷歌深夜放出 IMO 金牌模型,多项测试力压 Grok 4、OpenAI o3!网友评论两极分化

谷歌深夜放出 IMO 金牌模型,多项测试力压 Grok 4、OpenAI o3!网友评论两极分化

昨夜,谷歌宣布向 Google AI Ultra 订阅用户推出 Deep Think 功能,Gemini 2.5 Deep Think 模型在今年的国际数学奥林匹克竞赛 (IMO) 上夺得金牌。

来自主题: AI资讯
6502 点击    2025-08-02 13:09
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

视频大型语言模型(Video LLMs)的发展日新月异,它们似乎能够精准描述视频内容、准确的回答相关问题,展现出足以乱真的人类级理解力。

来自主题: AI技术研报
6802 点击    2025-08-02 12:43
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。

来自主题: AI资讯
8775 点击    2025-08-02 11:41
思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报
7701 点击    2025-08-01 16:08
又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一个SOTA基础模型开源,而且依然是国产。 刚刚,阶跃星辰兑现了WAIC上的承诺,将最新多模态推理模型Step-3正式开源! 在MMMU等多个多模态榜单上,它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报
7292 点击    2025-08-01 12:52
刚刚,特朗普祭出AI医疗新政,苹果、谷歌、OpenAI联手,2026年重塑美国医疗!

刚刚,特朗普祭出AI医疗新政,苹果、谷歌、OpenAI联手,2026年重塑美国医疗!

刚刚,特朗普祭出AI医疗新政,苹果、谷歌、OpenAI联手,2026年重塑美国医疗!

7月30日,特朗普宣布了一项新的医疗科技发展计划,旨在利用AI等技术,构建一个以患者为中心,更加智能、安全、个性化的医疗生态系统。

来自主题: AI监管政策
8395 点击    2025-08-01 11:45
WAIC 2025落幕,AI硬件终于找到突破口

WAIC 2025落幕,AI硬件终于找到突破口

WAIC 2025落幕,AI硬件终于找到突破口

今年WAIC现场,AI硬件公司未来智能现场展出了其今年刚刚推出的两款新品AI会议耳机Pro 3和Air 2,其中内置了面向个人商务办公场景的AI Agent——viaim大脑。

来自主题: AI资讯
7286 点击    2025-08-01 11:36
Figma上市首日暴涨250%的深层逻辑:为什么AI时代协作平台更加不可替代?

Figma上市首日暴涨250%的深层逻辑:为什么AI时代协作平台更加不可替代?

Figma上市首日暴涨250%的深层逻辑:为什么AI时代协作平台更加不可替代?

你有没有想过,为什么在AI能生成一切的时代,一个"画图工具"反而更值钱了?7月31日,Figma正式登陆纽约证券交易所,首日收盘市值高达563亿美元,P/S倍数超过60倍。相比之下,SaaS行业的平均P/S倍数仅为7倍,这个数字不仅远远超过Adobe、Salesforce等成熟SaaS公司的估值水平,甚至比两年前Adobe试图收购它的200亿美元报价还要令人震撼。

来自主题: AI资讯
6594 点击    2025-08-01 11:31