AI资讯新闻榜单内容搜索-o1-preview

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: o1-preview
4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开

4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开

4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开

只用4500美元成本,就能成功复现DeepSeek?就在刚刚,UC伯克利团队只用简单的RL微调,就训出了DeepScaleR-1.5B-Preview,15亿参数模型直接吊打o1-preview,震撼业内。

来自主题: AI资讯
6897 点击    2025-02-11 15:26
AMD把o1炼成了实验室助手,自动科研经费节省84%

AMD把o1炼成了实验室助手,自动科研经费节省84%

AMD把o1炼成了实验室助手,自动科研经费节省84%

芯片强者AMD最新推出科研AI,o1-preview竟成天选打工人?! 注意看,只需将科研idea和相关笔记一股脑丢给AI,研究报告甚至是代码就能立马出炉了。

来自主题: AI技术研报
7502 点击    2025-01-10 16:25
4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

微软又把OpenAI的机密泄露了??在论文中明晃晃写着: o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……

来自主题: AI技术研报
6866 点击    2025-01-02 14:03
OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。

来自主题: AI技术研报
7101 点击    2025-01-01 17:28
推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。

来自主题: AI资讯
7305 点击    2024-12-20 16:07
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务

Meta全新发布的基准Multi-IF涵盖八种语言、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于英语。

来自主题: AI技术研报
5736 点击    2024-11-25 15:45
Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。

来自主题: AI技术研报
5372 点击    2024-11-24 21:22