AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
「连续数值分布式表征」加持,浙大UIUC让语言模型擅长表格预测 | ICLR 2024 Spotlight

「连续数值分布式表征」加持,浙大UIUC让语言模型擅长表格预测 | ICLR 2024 Spotlight

「连续数值分布式表征」加持,浙大UIUC让语言模型擅长表格预测 | ICLR 2024 Spotlight

来自浙江大学和伊利诺伊大学厄巴纳-香槟分校的研究者发表了他们关于「表格语言模型」(Tabular Language Model)的研究成果

来自主题: AI技术研报
9875 点击    2024-06-15 16:23
Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据

Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据

Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据

训练数据的数量和质量,对LLM性能的重要性已经是不言自明的事实。然而,Epoch AI近期的一篇论文却给正在疯狂扩展的AI模型们泼了冷水,他们预测,互联网上可用的人类文本数据将在四年后,即2028年耗尽。

来自主题: AI技术研报
10969 点击    2024-06-15 16:20
英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o

英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o

英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o

刚刚,英伟达全新发布的开源模型Nemotron-4 340B,有可能彻底改变训练LLM的方式!从此,或许各行各业都不再需要昂贵的真实世界数据集了。而且,Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至可以和GPT-4掰手腕!

来自主题: AI技术研报
6133 点击    2024-06-15 15:58
SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D资产的一个重要类别,服装资产的往往来源于平面板片与物理模拟等流程,而不是直接在3D上建模。

来自主题: AI技术研报
8386 点击    2024-06-15 15:44
大模型理解复杂表格,字节&中科大出手了

大模型理解复杂表格,字节&中科大出手了

大模型理解复杂表格,字节&中科大出手了

只要一个大模型,就能解决打工人遇到的表格难题!

来自主题: AI技术研报
9634 点击    2024-06-15 13:28
万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

近年来,大语言模型(Large Language Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种语言生成任务上的出色表现,大语言模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。然而,大语言模型的落地应用受到其较大的推理开销的限制,对部署资源、用户体验、经济成本都带来了巨大挑战。

来自主题: AI技术研报
11337 点击    2024-06-14 10:35
2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源

2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源

2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源

用KV缓存加速大模型的显存瓶颈,终于迎来突破。 北大、威斯康辛-麦迪逊、微软等联合团队提出了全新的缓存分配方案,只用2.5%的KV cache,就能保持大模型90%的性能。 这下再也不用担心KV占用的显存容量过高,导致显卡不够用了。

来自主题: AI技术研报
6556 点击    2024-06-13 21:21
Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!

Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!

Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!

距上次Karpathy AI大课更新之后,又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。

来自主题: AI资讯
10298 点击    2024-06-13 11:41