AI资讯新闻榜单内容搜索-AI模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI模型
允许AI自我进化,人类将迅速灭亡!Anthropic创始人警告

允许AI自我进化,人类将迅速灭亡!Anthropic创始人警告

允许AI自我进化,人类将迅速灭亡!Anthropic创始人警告

Anthropic联合创始人兼首席科学官Jared Kaplan,认为在2027-2030年期间,我们将不得不做出是否允许 AI 自我进化的抉择,而允许的话很可能导致AI失控,毁灭全人类。Anthropic在迅速提升AI模型性能不断逼近AGI奇点的同时,也在同时让「9人特种部队」用1.4万字的「AI宪法」防范AI失控。

来自主题: AI资讯
9787 点击    2025-12-11 11:26
刚刚,DeepSeek梁文锋入选Nature年度十大人物!被称为「科技颠覆者」

刚刚,DeepSeek梁文锋入选Nature年度十大人物!被称为「科技颠覆者」

刚刚,DeepSeek梁文锋入选Nature年度十大人物!被称为「科技颠覆者」

刚刚,梁文锋入选《自然》2025年度十大人物榜单!Nature给出的评语是:科技颠覆者!正式报道中,则用「这位中国金融奇才的DeepSeek AI模型惊艳了世界」。

来自主题: AI资讯
9130 点击    2025-12-09 10:17
OpenAI发布Codex实战手册,GPT5.1的持续工作极限为2小时17分钟

OpenAI发布Codex实战手册,GPT5.1的持续工作极限为2小时17分钟

OpenAI发布Codex实战手册,GPT5.1的持续工作极限为2小时17分钟

2小时17分钟,这是截至2025年8月,前沿AI模型在保持50%成功率的前提下,能够维持连续推理工作的时长。这个数字意味着AI已经从处理“秒级”的代码片段,跨越到了处理“小时级”的复杂工程任务。

来自主题: AI技术研报
9076 点击    2025-11-26 15:14
AI模型大战:Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择?

AI模型大战:Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择?

AI模型大战:Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择?

前沿AI竞赛在2025年11月达到高潮。48小时内,谷歌推出Gemini 3 Pro宣称在主要推理基准测试中领先,而OpenAI立即用GPT-5.1-Codex-Max反击,这是一款专门训练用于通过创新"压缩"(compaction)技术自主工作超过24小时的专业编码模型[43]。加上Claude Sonnet 4.5已确立的编码统治地位和激进的安全过滤器,开发者面临前所未有的选择:

来自主题: AI技术研报
8822 点击    2025-11-21 17:09
Gemini 3 来了:忘掉聊天,一句话生成一个世界 (附与Gemini 团队沟通实录)

Gemini 3 来了:忘掉聊天,一句话生成一个世界 (附与Gemini 团队沟通实录)

Gemini 3 来了:忘掉聊天,一句话生成一个世界 (附与Gemini 团队沟通实录)

Gemini3太强了。 11月18日,在所有人的期待中,Google的最新AI模型Gemini3正式发布。这次,一切都回到了Google的节奏。 彻底屠榜 这是一个几乎“屠榜”了所有评测集的模型,而且

来自主题: AI资讯
8636 点击    2025-11-19 00:16
AI跌价900倍,连一瓶矿泉水都比它贵!

AI跌价900倍,连一瓶矿泉水都比它贵!

AI跌价900倍,连一瓶矿泉水都比它贵!

过去一年,AI模型的价格暴跌百倍!同样一句话,去年要10块,现在只要几分钱。可与此同时,家政、育儿、心理咨询、维修.....这些「手工活」越来越贵。科技正在疯狂通缩,生活却越来越通胀。这不是经济学笑话,而是Jevons与Baumol共同制造的现实:当机器更聪明,人工就更昂贵。

来自主题: AI资讯
8575 点击    2025-11-06 09:43
美团新独立APP,点不了菜只能点AI

美团新独立APP,点不了菜只能点AI

美团新独立APP,点不了菜只能点AI

用外卖的打法做AI模型?美团这是跟“又快又稳”杠上了(doge)。

来自主题: AI技术研报
5696 点击    2025-11-03 14:49
谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

当AI模型排行榜开始被各种刷分作弊之后,谁家大模型最牛这个问题就变得非常主观,直到一家线上排行榜诞生,它叫:LMArena。在文字、视觉、搜索、文生图、文生视频等不同的AI大模型细分领域,LMArena上每天都有上千场的实时对战,由普通用户来匿名投票选出哪一方的回答更好。

来自主题: AI资讯
7762 点击    2025-11-03 09:41
均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事

均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事

均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事

大模型后训练的痛点:均值优化忽略低概率高信息路径,导致推理能力停滞。RiskPO双管齐下,MVaR目标函数推导梯度估计,多问题捆绑转化反馈,实验中Geo3K准确率54.5%,LiveCodeBench Pass@1提升1%,泛化能力强悍。

来自主题: AI技术研报
6854 点击    2025-10-25 14:32