AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU， MBZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报

5596 点击 2024-10-22 14:38

最新认知Prompt，模拟人类认知操作COP来增强LLM问题解决能力 | ICLR2025

最新认知Prompt，模拟人类认知操作COP来增强LLM问题解决能力 | ICLR2025

最新认知Prompt，模拟人类认知操作COP来增强LLM问题解决能力 | ICLR2025

最近，来自德国奥尔登堡大学计算智能实验室的研究人员Oliver Kramer和Jill Baumann提出了一种创新的方法——认知提示（Cognitive Prompting），通过模拟人类认知过程来提升LLM的问题解决能力。这项研究将在ICLR 2025会议上发表，本文将为各位读者朋友详细解读这一突破性的技术。

来自主题: AI技术研报

4962 点击 2024-10-22 09:43

重磅：用DSPy写最佳推理轨迹搜索DOTS，让LLM能动态推理 |乔治梅森大学和腾讯AI最新

重磅：用DSPy写最佳推理轨迹搜索DOTS，让LLM能动态推理 |乔治梅森大学和腾讯AI最新

重磅：用DSPy写最佳推理轨迹搜索DOTS，让LLM能动态推理 |乔治梅森大学和腾讯AI最新

近日，来自乔治梅森大学和腾讯AI实验室的研究团队在这一领域取得了重大突破。他们提出了一种名为DOTS（Dynamic Optimal Trajectory Search）的创新方法，通过最佳推理轨迹搜索，显著提升LLMs的动态推理能力。

来自主题: AI技术研报

5458 点击 2024-10-21 14:51

清华开源混合精度推理系统MixQ，实现大模型近无损量化并提升推理吞吐

清华开源混合精度推理系统MixQ，实现大模型近无损量化并提升推理吞吐

清华开源混合精度推理系统MixQ，实现大模型近无损量化并提升推理吞吐

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。 MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。

来自主题: AI资讯

4014 点击 2024-10-21 14:15

深度｜如何最大化 GPU 利用效率，让 ROI 最大化？

深度｜如何最大化 GPU 利用效率，让 ROI 最大化？

深度｜如何最大化 GPU 利用效率，让 ROI 最大化？

前不久在人工智能的帮助下，两位科学家获得了诺贝尔物理学奖。可以说人工智能已经在很多领域被广泛应用了。随着大语言模型（LLM）和深度学习的广泛应用，GPU 也已成为机器学习工程师和研究人员最重要的计算资源之一。

来自主题: AI资讯

8122 点击 2024-10-21 14:14

遥感影像也能AI搜索？从像素到语义，快速实现

遥感影像也能AI搜索？从像素到语义，快速实现

遥感影像也能AI搜索？从像素到语义，快速实现

近期在LLM方面，AI搜索热度居高不下，遥感业务也能做AI搜索。

来自主题: AI技术研报

4083 点击 2024-10-21 11:34

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

来自主题: AI技术研报

5401 点击 2024-10-20 17:34

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

近日，来自谷歌和苹果的研究表明：AI模型掌握的知识比表现出来的要多得多！这些真实性信息集中在特定的token中，利用这一属性可以显著提高检测LLM错误输出的能力。

来自主题: AI技术研报

3966 点击 2024-10-20 17:16

英伟达nGPT重塑Transformer，AI训练速度暴增20倍！文本越长，加速越快

英伟达nGPT重塑Transformer，AI训练速度暴增20倍！文本越长，加速越快

英伟达nGPT重塑Transformer，AI训练速度暴增20倍！文本越长，加速越快

LLM训练速度还可以再飙升20倍！英伟达团队祭出全新架构归一化Transformer（nGPT），上下文越长，训练速度越快，还能维持原有精度。

来自主题: AI技术研报

4680 点击 2024-10-20 17:11

NeurIPS 2024 Oral | 小参数，大作为！揭秘非对称 LoRA 架构的高效性能

NeurIPS 2024 Oral | 小参数，大作为！揭秘非对称 LoRA 架构的高效性能

NeurIPS 2024 Oral | 小参数，大作为！揭秘非对称 LoRA 架构的高效性能

大型语言模型（LLMs）虽然在适应新任务方面取得了长足进步，但它们仍面临着巨大的计算资源消耗，尤其在复杂领域的表现往往不尽如人意。

来自主题: AI技术研报

4980 点击 2024-10-20 16:58

上一页当前第70页,共131页下一页