AI资讯新闻榜单内容搜索-训练

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

小米大模型第二代来了！相比第一代，训练数据规模更大、品质更高，训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报

7426 点击 2024-11-13 09:12

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

研究人员通过案例研究，利用大型语言模型（LLMs）如GPT-4、Claude 3和Llama 3.1，探索了思维链（CoT）提示在解码移位密码任务中的表现；CoT提示虽然提升了模型的推理能力，但这种能力并非纯粹的符号推理，而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报

4856 点击 2024-11-13 09:07

连OpenAI都推不动Scaling Law了？MIT把「测试时训练」系统研究了一遍，发现还有路

昨天，The Information 的一篇文章让 AI 社区炸了锅。

来自主题: AI技术研报

5784 点击 2024-11-12 17:18

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露？ ETH有了新发现

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报

5465 点击 2024-11-12 16:38

胜诉！新闻企业与openai就模型训练的数据版权纠纷一案有结果了｜附判决原文和翻译

去年以来，包括纽约时报、Raw Story、The Intercept和AlterNet等在内的多家机构，针对ChatGPT所属的公司OpenAI提起诉讼，指控ChatGPT非法使用了新闻网站文章用于训练。近日，纽约联邦法官驳回了Raw Story和Alternet对OpenAI聊天机器人的训练数据提起的版权诉讼。

来自主题: AI资讯

13914 点击 2024-11-12 15:15