AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
首个多模态连续学习综述,港中文、清华、UIC联合发布

首个多模态连续学习综述,港中文、清华、UIC联合发布

首个多模态连续学习综述,港中文、清华、UIC联合发布

连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前学习的任务的性能,因为不受约束的微调会使参数远离旧任务的最优状态。

来自主题: AI技术研报
4180 点击    2024-11-13 16:02
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。

来自主题: AI技术研报
3812 点击    2024-11-13 13:41
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

研究人员通过案例研究,利用大型语言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思维链(CoT)提示在解码移位密码任务中的表现;CoT提示虽然提升了模型的推理能力,但这种能力并非纯粹的符号推理,而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报
3408 点击    2024-11-13 09:07
CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报
4132 点击    2024-11-12 16:38
胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

去年以来,包括纽约时报、Raw Story、The Intercept和AlterNet等在内的多家机构,针对ChatGPT所属的公司OpenAI提起诉讼,指控ChatGPT非法使用了新闻网站文章用于训练。近日,纽约联邦法官驳回了Raw Story和Alternet对OpenAI聊天机器人的训练数据提起的版权诉讼。

来自主题: AI资讯
10905 点击    2024-11-12 15:15
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报
4427 点击    2024-11-12 15:06