AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。

来自主题: AI技术研报
3802 点击    2024-11-13 13:41
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

研究人员通过案例研究,利用大型语言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思维链(CoT)提示在解码移位密码任务中的表现;CoT提示虽然提升了模型的推理能力,但这种能力并非纯粹的符号推理,而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报
3400 点击    2024-11-13 09:07
CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报
4118 点击    2024-11-12 16:38
胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

胜诉!新闻企业与openai就模型训练的数据版权纠纷一案有结果了|附判决原文和翻译

去年以来,包括纽约时报、Raw Story、The Intercept和AlterNet等在内的多家机构,针对ChatGPT所属的公司OpenAI提起诉讼,指控ChatGPT非法使用了新闻网站文章用于训练。近日,纽约联邦法官驳回了Raw Story和Alternet对OpenAI聊天机器人的训练数据提起的版权诉讼。

来自主题: AI资讯
10893 点击    2024-11-12 15:15
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报
4414 点击    2024-11-12 15:06
Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI

Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI

Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI

Ilya终于承认,自己关于Scaling的说法错了!现在训练模型已经不是「越大越好」,而是找出Scaling的对象究竟应该是什么。他自曝,SSI在用全新方法扩展预训练。而各方巨头改变训练范式后,英伟达GPU的垄断地位或许也要打破了。

来自主题: AI资讯
5273 点击    2024-11-12 14:39
用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

现在,用LLM一键就能生成百万级领域知识图谱了?! 来自中科大MIRA实验室研究人员提出一种通用的自动化知识图谱构建新框架SAC-KG

来自主题: AI技术研报
3151 点击    2024-11-11 21:21
两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

上海大学本科生研发的新框架能有效应对知识图谱补全中的灾难性遗忘和少样本学习难题,提升模型在动态环境和数据稀缺场景下的应用能力。这项研究不仅推动了领域发展,也为实际应用提供了宝贵参考。

来自主题: AI技术研报
2901 点击    2024-11-11 14:57