AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
人工智能驱动的科学研究(AI4S)在药物研发与临床实践中的应用进展

人工智能驱动的科学研究(AI4S)在药物研发与临床实践中的应用进展

人工智能驱动的科学研究(AI4S)在药物研发与临床实践中的应用进展

在当今数字化时代,人工智能(artificial intelligence,AI)技术迅猛发展,尤其是生成式技术,如ChatGPT(chat generative pre-trained transformer),对人类生活的影响日益深远。

来自主题: AI技术研报
11384 点击    2024-08-19 17:38
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。

来自主题: AI技术研报
10150 点击    2024-08-19 14:52
Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现,后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文,总结了科技巨头们所使用的模型后训练配方。

来自主题: AI技术研报
11739 点击    2024-08-19 14:47
机器人策略学习的Game Changer?伯克利提出Body Transformer

机器人策略学习的Game Changer?伯克利提出Body Transformer

机器人策略学习的Game Changer?伯克利提出Body Transformer

过去几年间,Transformer 架构已经取得了巨大的成功,同时其也衍生出了大量变体,比如擅长处理视觉任务的 Vision Transformer(ViT)。本文要介绍的 Body Transformer(BoT) 则是非常适合机器人策略学习的 Transformer 变体。

来自主题: AI技术研报
9399 点击    2024-08-19 14:08
10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

发布40天后,最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta,而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报
6756 点击    2024-08-16 14:49
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?

来自主题: AI技术研报
6278 点击    2024-08-16 14:17
大模型指令调优数据集万字评测!腾讯上交大联合出品

大模型指令调优数据集万字评测!腾讯上交大联合出品

大模型指令调优数据集万字评测!腾讯上交大联合出品

随着大模型的快速发展,指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。

来自主题: AI技术研报
10717 点击    2024-08-15 17:10
Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?

Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?

Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?

最近的论文表明,LLM等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅8B的Llama 3.1模型搜索100次,即可在Python代码生成任务上达到GPT-4o同等水平。

来自主题: AI技术研报
9403 点击    2024-08-15 16:05
从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

最近ACL 2024 论文放榜,扫了下,SMoE(稀疏混合专家)的论文不算多,这里就仔细梳理一下,包括动机、方法、有趣的发现,方便大家不看论文也能了解的七七八八,剩下只需要感兴趣再看就好。

来自主题: AI技术研报
4336 点击    2024-08-15 10:17
首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策

首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策

首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策

近日,来自佐治亚理工学院的研究人员开发了RTNet,首次表明其「思考方式」与人类非常相似。

来自主题: AI技术研报
10805 点击    2024-08-14 16:45
超级AI即将诞生?史上最强超算9月上线,英伟达最强芯片加持

超级AI即将诞生?史上最强超算9月上线,英伟达最强芯片加持

超级AI即将诞生?史上最强超算9月上线,英伟达最强芯片加持

天网离我们还有多远?现在,科学家们希望通过一个强大的超算网络,来加速发展人类级别的人工智能,预计在2025年前全面投入运行。

来自主题: AI技术研报
9351 点击    2024-08-14 16:40
北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

只用提示词,多模态大模型就能更懂场景中的人物关系了。

来自主题: AI技术研报
10514 点击    2024-08-13 16:56
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症

2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症

2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症

Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的潜力。

来自主题: AI技术研报
5239 点击    2024-08-12 17:18
数百万晶体数据训练、解决晶体学相位问题,深度学习方法PhAI登Science

数百万晶体数据训练、解决晶体学相位问题,深度学习方法PhAI登Science

数百万晶体数据训练、解决晶体学相位问题,深度学习方法PhAI登Science

时至今日,晶体学所测定的结构细节和精度,从简单的金属到大型膜蛋白,是任何其他方法都无法比拟的。然而,最大的挑战——所谓的相位问题,仍然是从实验确定的振幅中检索相位信息。

来自主题: AI技术研报
10520 点击    2024-08-11 16:58
ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

在过去的几年中,大型语言模型(Large Language Models, LLMs)在自然语言处理(NLP)领域取得了突破性的进展。这些模型不仅能够理解复杂的语境,还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报
9873 点击    2024-08-11 13:25
给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA

给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA

给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA

自从 Sora 发布以来,AI 视频生成领域变得更加「热闹」了起来。过去几个月,我们见证了即梦、Runway Gen-3、Luma AI、快手可灵轮番炸场。

来自主题: AI技术研报
9972 点击    2024-08-11 13:18
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。

来自主题: AI技术研报
7285 点击    2024-08-10 11:45
LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」

LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」

LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」

前段时间冲上热搜的问题「9.11比9.9大吗?」,让几乎所有LLM集体翻车。看似热度已过,但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷,以及未来的潜在改进方向。

来自主题: AI技术研报
9565 点击    2024-08-09 14:38
MSU世界视频编码器大赛成绩出炉,腾讯包揽全部指标第一名

MSU世界视频编码器大赛成绩出炉,腾讯包揽全部指标第一名

MSU世界视频编码器大赛成绩出炉,腾讯包揽全部指标第一名

今日获悉,由莫斯科国立大学举办的 MSU 世界视频编码器大赛结果揭晓。在全部参赛编码器中,腾讯编码器包揽所有 15 项指标的全部第一,再次斩获全场最佳。

来自主题: AI技术研报
8954 点击    2024-08-09 13:09