AI资讯新闻榜单内容搜索-LLM

拯救被「掰弯」的GPT-4！西交微软北大联合提出IN2训练治疗LLM「中间迷失」

近日，西交微软北大联合提出信息密集型训练大法，使用纯数据驱动的方式，矫正LLM训练过程产生的偏见，在一定程度上治疗了大语言模型丢失中间信息的问题。

来自主题: AI技术研报

8275 点击 2024-05-22 13:08

上周，一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena

来自主题: AI资讯

9409 点击 2024-05-21 15:53

真正与GPT-4o齐头并进的国产大模型来了！刚刚，LMSYS揭开最新榜单，黑马Yi-Large在中文分榜上与GPT-4o并列第一，而在总榜上位列世界第七，紧追国际第一阵营，并登上了国内大模型盲测榜首。

来自主题: AI资讯

9423 点击 2024-05-21 14:55

此次，苹果提出的多模态大语言模型（MLLM） Ferret-UI ，专门针对移动用户界面（UI）屏幕的理解进行了优化，其具备引用、定位和推理能力。

来自主题: AI技术研报

4924 点击 2024-05-20 18:56

当计算预算低时，重复使用高质量数据更好；当不差钱时，使用大量数据更有利。

来自主题: AI技术研报

6810 点击 2024-05-20 18:52

最公平的大模型基准测试诞生了！来自LLM竞技场，最接近人类偏好，数据新鲜、速度快、成本低，严格分离学渣和学霸。

来自主题: AI技术研报

9596 点击 2024-05-20 16:20

GPT-4可以通过图灵测试吗？

来自主题: AI资讯

9035 点击 2024-05-18 17:41

红极一时的思维链技术，可能要被推翻了！

来自主题: AI技术研报

4395 点击 2024-05-14 10:49

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门，成为了Hacker News等许多科技媒体的头版头条。

来自主题: AI技术研报

2919 点击 2024-05-11 13:06

传统上，大型语言模型（LLMs）被认为是顺序解码器，逐个解码每个token。

来自主题: AI技术研报

3995 点击 2024-05-10 23:29