AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

本文首先简单回顾了『等效交互可解释性理论体系』(20 篇 CCF-A 及 ICLR 论文),并在此基础上,严格推导并预测出神经网络在训练过程中其概念表征及其泛化性的动力学变化,即在某种程度上,我们可以解释在训练过程中神经网络在任意时间点的泛化性及其内在根因。

来自主题: AI技术研报
9403 点击    2024-08-04 13:55
领英 AI 落地复盘:多 Agent 配合、端到端输出

领英 AI 落地复盘:多 Agent 配合、端到端输出

领英 AI 落地复盘:多 Agent 配合、端到端输出

在过去的六个月,LinkedIn 开发了基于自身业务的生成式AI应用。领英团队希望能重新设计求职流程,改变专业内容的浏览方式。

来自主题: AI技术研报
10536 点击    2024-08-04 13:26
DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本,大概是Llama 3预训练的15%,耗费资金可达12.9M美元。

来自主题: AI技术研报
8056 点击    2024-08-03 15:03
GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR,layout detection等方法对PDF长文档进行解析。但随着多模态大模型的发展,PDF长文档的端到端阅读理解成为了可能。

来自主题: AI技术研报
10483 点击    2024-08-03 14:38
首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

大模型展现出了卓越的指令跟从和任务泛化的能力,这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习(RLHF)。

来自主题: AI技术研报
10648 点击    2024-08-03 14:29
顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

热议数月的 Character AI 寻求收购的消息,终于尘埃落定。 据 C.AI 官方博客,公司与 Google 达成协议,核心创始人 Noam Shazeer、Daniel De Freitas 以及研究团队,将加入 Google,剩余「大部分团队」将留在 C.AI,继续打造产品。

来自主题: AI技术研报
6797 点击    2024-08-03 11:22
RAG 高效应用指南 05:再谈文档智能解析

RAG 高效应用指南 05:再谈文档智能解析

RAG 高效应用指南 05:再谈文档智能解析

在这篇文章中,笔者将讨论以下几个问题: • 什么是文档智能解析 • 文档智能解析有哪些方法 • 文档智能解析的开源实现

来自主题: AI技术研报
10030 点击    2024-08-03 11:17
RAG 高效应用指南 04:语义路由

RAG 高效应用指南 04:语义路由

RAG 高效应用指南 04:语义路由

在这篇文章中,笔者将讨论以下几个问题: • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报
9565 点击    2024-08-03 11:05
RAG 高效应用指南 03:Query 理解

RAG 高效应用指南 03:Query 理解

RAG 高效应用指南 03:Query 理解

在这篇文章中,笔者将讨论以下几个问题: • 为什么要进行 query 理解 • query 理解有哪些技术(从 RAG 角度) • 各种 query 理解技术的实现(基于 LangChain)

来自主题: AI技术研报
11526 点击    2024-08-03 10:57
RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

在本篇文章中,笔者将讨论以下几个问题: • 向量模型在 RAG 系统中的作用 有哪些性能不错的向量模型(从 RAG 角度) 不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量 如何 Finetune 向量模型

来自主题: AI技术研报
12971 点击    2024-08-03 10:44
RAG 高效应用指南:01

RAG 高效应用指南:01

RAG 高效应用指南:01

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨,提供一系列具体的方法和建议。同时读者也需要记住,提高 RAG 系统性能是一个持续的过程,需要不断地评估、优化和迭代。

来自主题: AI技术研报
11980 点击    2024-08-02 17:11
OpenDevin出技术报告了,大模型Agent开发者必读

OpenDevin出技术报告了,大模型Agent开发者必读

OpenDevin出技术报告了,大模型Agent开发者必读

今年 3 月,「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是,Devin 并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。

来自主题: AI技术研报
9337 点击    2024-08-02 16:16
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报
9433 点击    2024-08-02 16:07
AI金融创新实践|上海「Open Day」圆满落幕

AI金融创新实践|上海「Open Day」圆满落幕

AI金融创新实践|上海「Open Day」圆满落幕

7月25日,非凡产研举办的《金融科技新动力:AI在金融创新与服务中的应用》主题活动在上海圆满落幕。 活动特别邀请到了三位AI+金融领域的资深专家深擎科技创始人&CEO 柴志伟、澜码科技创始人兼CEO 周健、甜新科技合伙人 郭尔东分别进行了专题分享,跟参会嘉宾进行了答疑互动。

来自主题: AI技术研报
9360 点击    2024-08-02 12:02
【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比,然后将其应用到大模型的训练中。 Token配比结论:通用知识50%;数学与逻辑25%;代码17%;多语言8%。

来自主题: AI技术研报
9828 点击    2024-08-02 11:53
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。

来自主题: AI技术研报
7079 点击    2024-08-01 15:55
还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。

来自主题: AI技术研报
7299 点击    2024-08-01 15:50
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。

来自主题: AI技术研报
6602 点击    2024-08-01 15:41
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。

来自主题: AI技术研报
9882 点击    2024-08-01 15:32
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

多模态对比学习(如CLIP)通过从互联网上抓取的数百万个图像-字幕对中学习,在零样本分类方面取得了显著进展。 然而,这种依赖带来了隐私风险,因为黑客可能会未经授权地利用图像-文本数据进行模型训练,其中可能包括个人和隐私敏感信息。

来自主题: AI技术研报
7922 点击    2024-08-01 15:32
探索AI Agent的认知架构及记忆的实现机制

探索AI Agent的认知架构及记忆的实现机制

探索AI Agent的认知架构及记忆的实现机制

Agent的记忆实现和调用是提高Agent智能水平的关键。

来自主题: AI技术研报
11112 点击    2024-08-01 11:57
ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了

ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了

ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了

近年来,针对单个物体的 Text-to-3D 方法取得了一系列突破性进展,但是从文本生成可控的、高质量的复杂多物体 3D 场景仍然面临巨大挑战。之前的方法在生成场景的复杂度、几何质量、纹理一致性、多物体交互关系、可控性和编辑性等方面均存在较大缺陷。

来自主题: AI技术研报
11235 点击    2024-07-31 17:34
揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化

揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化

揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化

在 2024 年全球开发者大会上,苹果重磅推出了 Apple Intelligence,这是一个全新的个性化智能系统, 可以提供实用的智能服务,覆盖 iPhone、iPad 和 Mac,并深度集成在 iOS 18、iPadOS 18 和 macOS Sequoia 中。

来自主题: AI技术研报
10216 点击    2024-07-31 17:32