AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型都会标注图像了,简单对话即可!来自清华&NUS

大模型都会标注图像了,简单对话即可!来自清华&NUS

大模型都会标注图像了,简单对话即可!来自清华&NUS

多模态大模型集成了检测分割模块后,抠图变得更简单了!

来自主题: AI技术研报
8893 点击    2024-01-04 10:43
ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

对于ChatGPT变笨原因,学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出:在训练数据截止之前的任务上,大模型表现明显更好。

来自主题: AI技术研报
4476 点击    2024-01-01 23:12
基础模型+机器人:现在已经走到哪一步了

基础模型+机器人:现在已经走到哪一步了

基础模型+机器人:现在已经走到哪一步了

机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。

来自主题: AI技术研报
4505 点击    2024-01-01 22:58
GPTs的出现,会使prompt engineering失去价值吗?

GPTs的出现,会使prompt engineering失去价值吗?

GPTs的出现,会使prompt engineering失去价值吗?

不会,prompt engineering 仍然是一个基本技能。GPTs 就是一个简化版的 Agent,这段提示词就是你能用来控制这个 Agent 最重要指令。

来自主题: AI技术研报
5671 点击    2024-01-01 11:52
告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

如果 AI 是一辆豪华跑车,那么 LoRA 微调技术就是让它加速的涡轮增压器。LoRA 强大到什么地步?它可以让模型的处理速度提升 300%。还记得 LCM-LoRA 的惊艳表现吗?其他模型的十步,它只需要一步就能达到相媲美的效果。

来自主题: AI技术研报
8151 点击    2024-01-01 11:14
8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相似,很多人将其形容为 GPT-4 的「缩小版」。

来自主题: AI技术研报
6081 点击    2024-01-01 11:08
无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现:只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报
1855 点击    2023-12-31 12:01
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报
4456 点击    2023-12-30 15:16
字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级理解方面的能力(例如物体分割)相对有限。

来自主题: AI技术研报
10200 点击    2023-12-28 17:37
大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench

大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench

大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench

作为连接人类与大模型的桥梁,大模型对 「Prompt (提示词)」 究竟有多敏感?同样的prompt,可能写错个单词、写法不一样,都会出现不一样的结果。

来自主题: AI技术研报
8576 点击    2023-12-27 14:30
我用ChatGPT设计了一颗芯片

我用ChatGPT设计了一颗芯片

我用ChatGPT设计了一颗芯片

使用LLM来制造芯片, 过去一年多以来,ChatGPT引发的AI浪潮席卷全球。

来自主题: AI技术研报
9540 点击    2023-12-26 15:22
成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局

成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局

成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局

游戏行业真在加速拥抱大语言模型等AI技术,不论是大厂还是独立游戏制作人,都开始依靠LLM的技术创立全新的AI NPC体验。

来自主题: AI技术研报
9216 点击    2023-12-25 15:52
华人团队用大模型实现“读心术”:大脑活动直接变文字 | NeurIPS 2023

华人团队用大模型实现“读心术”:大脑活动直接变文字 | NeurIPS 2023

华人团队用大模型实现“读心术”:大脑活动直接变文字 | NeurIPS 2023

NeurIPS收录的一项新研究,让大模型也学会“读心术”了!通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。

来自主题: AI技术研报
6872 点击    2023-12-18 15:13
NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²

NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²

NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²

美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。

来自主题: AI技术研报
5658 点击    2023-12-18 14:28
源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

软件开发人员对代码生成 AI 已经不陌生,它们已经成为提高生产力的利器。本文中,伊利诺伊大学香槟分校(UIUC)张令明老师团队带来了代码生成 AI 领域的又一力作 ——Magicoder,在短短一周之内狂揽 1200 多颗 GitHub Star,登上 GitHub Trending 日榜,并获推特大佬 AK(@_akhaliq)发推力荐。

来自主题: AI技术研报
9439 点击    2023-12-18 11:03
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。

来自主题: AI技术研报
5842 点击    2023-12-17 19:41
大模型视角下的因果推断

大模型视角下的因果推断

大模型视角下的因果推断

在数字化建设不断推进的今天,随着技术的不断发展,从统计学、机器学习、深度学习,再到因果学习以及最新的热门大模型方向,九章云极 DataCanvas 始终紧贴最前沿的、最能助力企业和落地实践的方向,不断进行着面向决策和面向智能的探索。本文将分享大模型时代下的因果推断。

来自主题: AI技术研报
5458 点击    2023-12-17 12:27
Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4,而所花成本还不到三分之一。

来自主题: AI技术研报
8311 点击    2023-12-17 12:15
GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT 4.5疑似大泄漏: 一个是新模型将具备全新多模态能力,文本语音图片以及视频和3D信息全都能一并处理,并且还可以跨模态理解。

来自主题: AI技术研报
8208 点击    2023-12-15 18:57
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架

HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架

HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架

在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。

来自主题: AI技术研报
8178 点击    2023-12-10 14:27
一战、二战情景复现?AI Agent 成功还原多场人类战争,为理解历史事件提供新工具

一战、二战情景复现?AI Agent 成功还原多场人类战争,为理解历史事件提供新工具

一战、二战情景复现?AI Agent 成功还原多场人类战争,为理解历史事件提供新工具

日前,由美国罗格斯大学和密西根大学研究团队提出的 AI Agent——WarAgent 便成功模拟了包括第一次世界大战、第二次世界大战和中国古代战国时期战争在内的历史重大国际冲突。

来自主题: AI技术研报
10505 点击    2023-12-06 17:34
横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%

横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%

横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%

哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了sota性能。

来自主题: AI技术研报
9743 点击    2023-12-04 18:01