AI资讯新闻榜单内容搜索-语言模型

350亿参数、开放权重，Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。

来自主题: AI技术研报

7004 点击 2024-03-12 18:54

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。

来自主题: AI资讯

6441 点击 2024-03-11 17:28

用童话训练AI模型：微小语言模型进入成熟期

微软找到了探索语言生成模型参数的新切入点！

来自主题: AI资讯

7222 点击 2024-03-10 16:28

Inflection-2.5发布：情商最高大模型、性能媲美GPT-4计算量仅为40%，App日活已破百万

本周四，美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。仅用 40% 计算量，实现与 GPT-4 相媲美性能。

来自主题: AI技术研报

8515 点击 2024-03-09 10:20

挑战OpenAI的新模型免费上线，40%计算量性能逼近GPT-4

本周四，美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。

来自主题: AI技术研报

5079 点击 2024-03-08 15:11

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低 bit，以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言，模型量化显得更加重要。

来自主题: AI技术研报

9697 点击 2024-03-07 13:53

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型，能够完成各种屏幕QA问答、总结摘要等任务。

来自主题: AI技术研报

10494 点击 2024-03-05 10:35

北大具身智能成果入选CVPR'24：只需一张图一个指令，就能让大模型玩转机械臂

只靠一张物体图片，大语言模型就能控制机械臂完成各种日常物体操作吗？

来自主题: AI技术研报

9269 点击 2024-03-03 17:50

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

谷歌DeepMind、UC伯克利和MIT的研究人员认为，如果用大语言模型的思路来做大视频模型，能解决很多语言模型不擅长的问题，可能能更进一步接近世界模型。

来自主题: AI技术研报

7124 点击 2024-03-03 17:31

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

2023 年我们正见证着多模态大模型的跨越式发展，多模态大语言模型（MLLM）已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。以 Llama 2，Mixtral 为代表的大语言模型（LLM），以 GPT-4、Gemini、LLaVA 为代表的多模态大语言模型跨越式发展。

来自主题: AI资讯

9833 点击 2024-03-01 13:47