AI资讯新闻榜单内容搜索-大语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大语言模型
小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

我们都知道,大语言模型(LLM)能够以一种无需模型微调的方式从少量示例中学习,这种方式被称为「上下文学习」(In-context Learning)。这种上下文学习现象目前只能在大模型上观察到。比如 GPT-4、Llama 等大模型在非常多的领域中都表现出了杰出的性能,但还是有很多场景受限于资源或者实时性要求较高,无法使用大模型。

来自主题: AI技术研报
3920 点击    2023-11-27 12:49
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效

视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效

视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效

最近,除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。首先,作为最早探索视频生成领域的领头羊之一,Runway 升级了其 Gen-2 模型,带来了电影级别的高清晰度,令人瞩目,并称视频生成的一致性得到了重大改进。

来自主题: AI资讯
7370 点击    2023-11-25 09:51
微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!

微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!

微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!

微软AI4Science部门发布230页报告,详细描述了GPT-4为代表的大语言模型在生物,药物发现,计算化学,偏微分方程,材料设计等5个科研领域的应用潜力。而且,作者还把目前GPT-4表现不好的地方也贴心地标记出来,防止科研人员踩雷。

来自主题: AI技术研报
8132 点击    2023-11-21 00:35
梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?

梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?

梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?

现代认知科学认为,人类会在头脑中构建关于周围真实世界的抽象模型——世界模型(world model)。获取“世界模型”的问题一直是人工智能研究的焦点。OpenAI 联合创始人兼首席科学家 Ilya Sutskever 认为, ChatGPT 已经学到了关于真实世界的复杂抽象模型。

来自主题: AI技术研报
4147 点击    2023-11-19 22:56
6000字解读:当前大语言模型LLM研究的10大挑战

6000字解读:当前大语言模型LLM研究的10大挑战

6000字解读:当前大语言模型LLM研究的10大挑战

大模型赛道已经吸引了大量企业或创业者投入,那么,目前大模型赛道都有哪些主流研究方向和共同挑战?这篇文章里,作者梳理了LLM研究的十大挑战,一起来看看

来自主题: AI技术研报
4740 点击    2023-11-10 14:38
AI大语言模型LLM,为啥老被翻译成“法学硕士”?

AI大语言模型LLM,为啥老被翻译成“法学硕士”?

AI大语言模型LLM,为啥老被翻译成“法学硕士”?

LLM这个缩写在机器翻译中被误解为“法学硕士”,而不是“大语言模型”。 • 机器翻译系统通常依赖上下文和大量文本数据来学习翻译,导致LLM更容易被翻译成“法学硕士”。

来自主题: AI资讯
1633 点击    2023-11-06 09:58
物理所联合院网络中心发布AI模型MatChat,预测无机材料合成路径

物理所联合院网络中心发布AI模型MatChat,预测无机材料合成路径

物理所联合院网络中心发布AI模型MatChat,预测无机材料合成路径

中国科学院物理研究所/北京凝聚态物理国家研究中心SF10组和中国科学院计算机网络信息中心共同合作,将AI大模型应用于材料科学领域,将数万个化学合成路径数据投喂给大语言模型LLAMA2-7b,从而获得了MatChat模型

来自主题: AI技术研报
5044 点击    2023-11-04 10:43
专攻芯片设计,英伟达推出定制版大语言模型ChipNeMo!

专攻芯片设计,英伟达推出定制版大语言模型ChipNeMo!

专攻芯片设计,英伟达推出定制版大语言模型ChipNeMo!

在刚刚开幕的ICCAD 2023大会上,英伟达团队展示了用AI模型测试芯片,引发了业界关注。来自英伟达的研究团队开发了一种名为ChipNeMo的定制LLM,以公司内部数据为基础进行训练,用于生成和优化软件,并为人类设计师提供帮助。

来自主题: AI资讯
4863 点击    2023-11-01 14:56
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型的一个典型问题。最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。

来自主题: AI技术研报
2624 点击    2023-11-01 09:49