AI资讯新闻榜单内容搜索-大语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大语言模型

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

8721 点击 2025-03-12 14:53

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

10027 点击 2025-03-12 13:52

可自定义的推理框架SoT-Agent，通过小路由模型自适应推理，更灵活，更经济 | 最新

可自定义的推理框架SoT-Agent，通过小路由模型自适应推理，更灵活，更经济 | 最新

可自定义的推理框架SoT-Agent，通过小路由模型自适应推理，更灵活，更经济 | 最新

本文介绍了一项突破性的AI推理技术创新——思维草图(SoT)框架。该框架从人类认知过程中获取灵感，通过一个200M大小的路由模型将LLM引导到概念链、分块符号化和专家词汇三种推理范式，巧妙地解决了大语言模型推理过程中的效率瓶颈。

来自主题: AI技术研报

7715 点击 2025-03-11 16:21

富士康开发出台湾首个推理大模型FoxBrain，性能落后于DeepSeek

富士康开发出台湾首个推理大模型FoxBrain，性能落后于DeepSeek

富士康开发出台湾首个推理大模型FoxBrain，性能落后于DeepSeek

北京时间3月10日，据《华尔街日报》报道，富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型，性能上落后于DeepSeek的部分大模型。鸿海周一表示，已自主研发了具备推理能力的人工智能(AI)大语言模型FoxBrain，并在四周内完成训练。FoxBrain最初为公司内部使用而设计，具备数据分析、数学运算、推理以及代码生成的能力。

来自主题: AI资讯

10896 点击 2025-03-10 17:46

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

近年来，大语言模型（LLM）的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力，已经在对话生成、代码编写、知识问答等任务中展现出了卓越的表现。

来自主题: AI技术研报

8698 点击 2025-03-10 14:15

AI玩手机越玩越6！西湖大学发布新智能体：会自我进化的AppAgentX

AI玩手机越玩越6！西湖大学发布新智能体：会自我进化的AppAgentX

AI玩手机越玩越6！西湖大学发布新智能体：会自我进化的AppAgentX

人工智能正迎来前所未有的变革，其中，大语言模型（LLM）的崛起推动了智能系统从信息处理向自主交互迈进。

来自主题: AI技术研报

8548 点击 2025-03-09 13:39

Free QWQ - 世界首个免费无限制分布式 QwQ API

Free QWQ - 世界首个免费无限制分布式 QwQ API

Free QWQ - 世界首个免费无限制分布式 QwQ API

大家好，很高兴在这里向各位介绍我们的产品 Free QWQ。这是世界上第一个完全免费、无限制、无需注册登录的分布式 AI 算力平台，基于 QwQ 32B 大语言模型提供强大的 AI 服务。

来自主题: AI资讯

10179 点击 2025-03-09 12:02

CVPR 2025｜北大开源多模态驱动的定制化漫画生成框架DiffSensei，还有4.3万页漫画数据集

CVPR 2025｜北大开源多模态驱动的定制化漫画生成框架DiffSensei，还有4.3万页漫画数据集

CVPR 2025｜北大开源多模态驱动的定制化漫画生成框架DiffSensei，还有4.3万页漫画数据集

北京大学、上海人工智能实验室、南洋理工大学联合推出 DiffSensei，首个结合多模态大语言模型（MLLM）与扩散模型的定制化漫画生成框架。该框架通过创新的掩码交叉注意力机制与文本兼容的角色适配器，实现了对多角色外观、表情、动作的精确控制

来自主题: AI技术研报

10962 点击 2025-03-07 14:15

DeepSearcher深度解读：Agentic RAG的出现，传统RAG的黄昏

DeepSearcher深度解读：Agentic RAG的出现，传统RAG的黄昏

DeepSearcher深度解读：Agentic RAG的出现，传统RAG的黄昏

技术上，从传统的关键词检索，到RAG，大家已经不满足于只是生成对应的简单回答。而是期待大语言模型能够更好地应用于企业级场景，产生更大的价值。不久前，OpenAI推出了最新的深度内容生成神器“DeepResearch”，用户只需一个"特斯拉的合理市值是多少"的提问，

来自主题: AI技术研报

10491 点击 2025-03-05 12:06

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向。按照思考方法收集训练数据集，通过有监督学习微调大语言模型；训练一个一致性奖励模型，并将该模型用作奖励函数，以使用强化学习来微调大语言模型。结果大语言模型的推理能力和计划能力，以及执行计划的能力得到了增强。

来自主题: AI资讯

7395 点击 2025-03-04 19:46

上一页当前第30页,共62页下一页