AI资讯新闻榜单内容搜索-o1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o1
OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。

来自主题: AI技术研报
7113 点击    2025-01-01 17:28
我用8道变态烧脑题,测出了o1的国内最强平替

我用8道变态烧脑题,测出了o1的国内最强平替

我用8道变态烧脑题,测出了o1的国内最强平替

我本来以为今年的模型考核就到这儿了,没想到老朋友智谱在 2024 年最后一天又整活儿了,突然就发布了 GLM 系列的类 o1 模型——GLM-Zero-Preview。

来自主题: AI资讯
6850 点击    2025-01-01 12:45
2024的最后一天,由智谱AI新上线的o1为这一年划上句点。

2024的最后一天,由智谱AI新上线的o1为这一年划上句点。

2024的最后一天,由智谱AI新上线的o1为这一年划上句点。

当你登录智谱清言的时候,就能看到他们上线了这个Zero推理模型,不过是以智能体的形式出现的。

来自主题: AI资讯
7022 点击    2024-12-31 15:26
DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。

来自主题: AI资讯
6360 点击    2024-12-31 14:49
斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧

斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧

斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧

随着 o1、o1 Pro 和 o3 的成功发布,我们明显看到,推理所需的时间和计算资源逐步上升。可以说,o1 的最大贡献在于它揭示了提升模型效果的另一种途径:在推理过程中,通过优化计算资源的配置,可能比单纯扩展模型参数更为高效。

来自主题: AI技术研报
8198 点击    2024-12-30 14:32
o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份

o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份

o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份

世界顶尖免疫学家Derya Unutmaz与o1 pro合作,让它帮忙评析自己的论文,发现它反馈的深度远超预期,令他感到震撼。此外,o1 pro还在解决人文研究问题上展现了卓越的能力。

来自主题: AI资讯
7007 点击    2024-12-29 17:52
OpenAI o1在金融研究中的应用:超越华尔街

OpenAI o1在金融研究中的应用:超越华尔街

OpenAI o1在金融研究中的应用:超越华尔街

近期NexusTrade的创始人Austin Starks撰文介绍了他使用OpenAI o1模型构建投资组合的一些经验。并展示如何使用OpenAI o1彻底改变金融市场的研究、分析和交易方式。

来自主题: AI资讯
6806 点击    2024-12-29 11:06
OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

本月,OpenAI科学家就当前LLM的scaling方法论能否实现AGI话题展开深入辩论,认为将来AI至少与人类平分秋色;LLM scaling目前的问题可以通过后训练、强化学习、合成数据、智能体协作等方法得到解决;按现在的趋势估计,明年LLM就能赢得IMO金牌。

来自主题: AI技术研报
6617 点击    2024-12-28 13:48
跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们

跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们

跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们

上线一周, gemini-2.0-flash-exp、gemini-2.0-flash-thinking-exp 已经成为了我日常对话频率最高的模型之一。

来自主题: AI资讯
8014 点击    2024-12-28 12:06
o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

今天想跟大家聊一个科技圈和生物医学圈都值得关注的“炸裂”事件。一位顶尖的免疫学专家,Derya Unutmaz博士,刚刚分享了一段让他“震撼到情绪激动”的经历:他把自己和学生撰写的关于MAIT细胞的综述文章,交给o1-Pro进行评估,结果AI给出的评论和洞察碾压了他

来自主题: AI技术研报
6727 点击    2024-12-27 16:11