AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报
7510 点击    2024-09-21 18:19
KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

近日,来自海德堡大学的研究人员推出了图语言模型 (GLM),将语言模型的语言能力和知识图谱的结构化知识,统一到了同一种模型之中。

来自主题: AI技术研报
8209 点击    2024-09-20 20:01
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。

来自主题: AI资讯
9670 点击    2024-09-20 13:29
时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

近期,浙大和 Salesforce 学者进一步发现:语言模型或许帮助有限,但是图像模型能够有效地迁移到时序预测领域。

来自主题: AI资讯
3911 点击    2024-09-19 15:24
战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

斯坦福大学的最新研究通过大规模实验发现,尽管大型语言模型(LLMs)在新颖性上优于人类专家的想法,但在可行性方面略逊一筹,还需要进一步研究以提高其实用性。

来自主题: AI技术研报
9569 点击    2024-09-17 23:12
COLM 24 | 从正确中学习?大模型的自我纠正新视角

COLM 24 | 从正确中学习?大模型的自我纠正新视角

COLM 24 | 从正确中学习?大模型的自我纠正新视角

大型语言模型(LLMs)虽然进展很快,很强大,但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】,大概就是看自己输出的结果,自己反思一下有没有错,如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报
8173 点击    2024-09-17 21:26
华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

大语言模型(如 GPT-4)具备强大的语言处理能力,但其独立运作时仍存在局限性,如无法进行复杂计算,获取不到实时信息,难以提供专业定制化功能等。而大语言模型的工具调用能力使其不仅限于文字处理,更能提供全面、实时、精确的服务,极大地扩展了其应用范围和实际价值。

来自主题: AI技术研报
7525 点击    2024-09-15 14:32
36 亿融资“造假”被揭穿,挣钱太难了,前苹果 AI 工程师 3 年打造的“欧洲 OpenAI”宣告退出模型竞赛

36 亿融资“造假”被揭穿,挣钱太难了,前苹果 AI 工程师 3 年打造的“欧洲 OpenAI”宣告退出模型竞赛

36 亿融资“造假”被揭穿,挣钱太难了,前苹果 AI 工程师 3 年打造的“欧洲 OpenAI”宣告退出模型竞赛

近日 Aleph Alpha 开始将其商业重点从开发大型语言模型转向生成式 AI 操作系统和咨询服务。

来自主题: AI资讯
7786 点击    2024-09-11 09:33