AI资讯新闻榜单内容搜索-LLM

国产模型人均「第一」太假？字节扣子模型广场竞技，全民投票！

每家国产大模型都说自己是第一，该信谁的？最近，字节推出了扣子模型广场，全体国产LLM开启大混战！你一票，我一票，谁是第一，大众说了算。投票连小朋友都能参与，模型生态从此彻底从黑盒到白盒。

来自主题: AI资讯

8741 点击 2024-06-13 19:47

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。

来自主题: AI技术研报

7732 点击 2024-06-12 15:33

一个常被许多领导者引用、但很可能是被杜撰出来的名言是：“外行谈战略和战术，内行谈运营。”战术视角看到的是一个个独特的难题，而运营视角看到的是组织中需要需要改变的不协调的模式。战略视角看到的是机会，运营视角则看的是挑战。

来自主题: AI技术研报

10033 点击 2024-06-12 15:05

古代中国是一个“万般皆下品，唯有读书高”的社会，尽管民众对读书多的人很佩服并不仅仅是因为学问，更因为读书可以当官。

来自主题: AI资讯

10139 点击 2024-06-12 12:37

都是可选择的一环

来自主题: AI资讯

11000 点击 2024-06-12 12:34

之前分享了我们在运营LLM应用时磨练出来的战术(tactics)【指之前的Part I 和Part II两篇文章】。战术是具体的：是为实现目标而采取的具体行动。我们还分享了对运营（Operations）的看法：为了执行战术，达到目标，而制定的更高层次的流程。

来自主题: AI技术研报

9815 点击 2024-06-11 20:02

近些年，语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型（LLM）有能力解决多种不同的任务，它们也正在成为越来越常用的工具。

来自主题: AI技术研报

10087 点击 2024-06-11 10:08

大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报

10877 点击 2024-06-11 10:06

在基准测试上频频屠榜的大模型们，竟然被一道简单的逻辑推理题打得全军覆没？最近，研究机构LAION的几位作者共同发表了一篇文章，以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题，揭示了LLM基准测试的盲区。

来自主题: AI技术研报

10965 点击 2024-06-10 14:23

最近，德国研究科学家发表的PANS论文揭示了一个令人担忧的现象：LLM已经涌现出「欺骗能力」，它们可以理解并诱导欺骗策。而且，相比前几年的LLM，更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。

来自主题: AI技术研报

9544 点击 2024-06-09 18:23