AI资讯新闻榜单内容搜索-大语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大语言模型

告别无效计算！新TTS框架拯救19%被埋没答案，推理准确率飙升

告别无效计算！新TTS框架拯救19%被埋没答案，推理准确率飙升

告别无效计算！新TTS框架拯救19%被埋没答案，推理准确率飙升

大语言模型通过 CoT 已具备强大的数学推理能力，而 Beam Search、DVTS 等测试时扩展（Test-Time Scaling, TTS）方法可通过分配额外计算资源进一步提升准确性。然而，现有方法存在两大关键缺陷：路径同质化（推理路径趋同）和中间结果利用不足（大量高质量推理分支被丢弃）。

来自主题: AI技术研报

9595 点击 2025-09-03 12:03

第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

8913 点击 2025-09-03 11:22

OpenAI大神：人工智能导论课程停在15年前，本科首选该是机器学习导论

OpenAI大神：人工智能导论课程停在15年前，本科首选该是机器学习导论

OpenAI大神：人工智能导论课程停在15年前，本科首选该是机器学习导论

如今，人工智能已经成为科技发展的主流，尤其是 ChatGPT 问世以来，大语言模型（LLM）正在深刻影响社会、企业和个人的方方面面。

来自主题: AI资讯

10085 点击 2025-09-02 11:45

科研智能体「漫游指南」—助你构建领域专属科研智能体

科研智能体「漫游指南」—助你构建领域专属科研智能体

科研智能体「漫游指南」—助你构建领域专属科研智能体

当前基于大语言模型（LLM）的智能体构建通过推动自主科学研究推动 AI4S 迅猛发展，催生一系列科研智能体的构建与应用。然而人工智能与自然科学研究之间认知论与方法论的偏差，对科研智能体系统的设计、训练以及验证产生着较大阻碍。

来自主题: AI技术研报

8525 点击 2025-09-01 14:48

谷歌Nature震撼发文，Gemini教练暴打专家！医学双料冠军，秒出睡眠报告

谷歌Nature震撼发文，Gemini教练暴打专家！医学双料冠军，秒出睡眠报告

谷歌Nature震撼发文，Gemini教练暴打专家！医学双料冠军，秒出睡眠报告

谷歌DeepMind最新Nature王炸，直接把Gemini版大模型PH-LLM调教成了「AI健康私教」，把可穿戴冷冰冰的数据，直接变成睡眠健身建议，结果准确率暴打人类医生。

来自主题: AI技术研报

7849 点击 2025-08-27 18:56

从需求分析到代码生成，LLM都能干点啥？一文读懂291个软工Benchmark！

从需求分析到代码生成，LLM都能干点啥？一文读懂291个软工Benchmark！

从需求分析到代码生成，LLM都能干点啥？一文读懂291个软工Benchmark！

大语言模型正加速重塑软件工程领域的各个环节，从需求分析到代码生成，再到自动化测试，几乎无所不能，但衡量这些模型到底「好不好用」、「好在哪里」、「还有哪些短板」，一直缺乏系统、权威的评估工具。

来自主题: AI技术研报

8352 点击 2025-08-27 11:42

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

当大语言模型（LLM）走向千行百业，推理效率与显存成本的矛盾日益尖锐。

来自主题: AI资讯

8485 点击 2025-08-26 19:21

全球开源大模型，前十五名全是中国的

全球开源大模型，前十五名全是中国的

全球开源大模型，前十五名全是中国的

近日，随着新一代大语言模型（LLM）的一波更新，开源大模型再次成为了热门讨论话题。软件工程师、自媒体 Rohan Paul 发现了一个惊人的现象：Design Arena 排行榜上排名前十几位开源 AI 模型全部来自中国。

来自主题: AI资讯

8970 点击 2025-08-26 12:20

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语，那么我们能学好语言吗？这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报

8784 点击 2025-08-26 12:11

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来，大语言模型（LLMs）展现出强大的语言理解与生成能力，推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等，已经深刻改变了人机交互方式。

来自主题: AI技术研报

8297 点击 2025-08-26 11:30

上一页当前第14页,共64页下一页