AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源

集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源

集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源

创智、基流、智谱、联通、北航、清华、东南联合打造了高效率、高可靠、高可视的 GPU 集合通信库 VCCL(Venus Collective Communication Library),VCCL 已部署于多个生产环境集群中。

来自主题: AI技术研报
6386 点击    2025-09-21 11:08
马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错

马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错

马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错

字节跳动Seed团队联合哥伦比亚大学商学院推出了FinSearchComp,这是首个完全开源的金融搜索与推理基准测试。该基准包含635个金融专家精心设计的问题,覆盖全球和大中华两个市场,并在多个主流模型产品上进行了全面评测。

来自主题: AI技术研报
6672 点击    2025-09-21 11:07
阿里云容器服务覆盖AI全流程,团队透露:OpenAI训练GPT时就用了我们的开源能力

阿里云容器服务覆盖AI全流程,团队透露:OpenAI训练GPT时就用了我们的开源能力

阿里云容器服务覆盖AI全流程,团队透露:OpenAI训练GPT时就用了我们的开源能力

拿下中国AI云市场第一后,阿里云又敞开说了。 援引第三方机构Omdia数据,中国AI云市场规模达到223亿元,阿里云占比35.8%位列第一。围绕这一领先地位的技术根基,阿里云的弹性计算、集群、容器、人工智能平台等技术产品负责人来了场AI Infra分享会。

来自主题: AI资讯
7170 点击    2025-09-21 10:46
理解帮助生成?RecA自监督训练让统一多模态模型直升SOTA

理解帮助生成?RecA自监督训练让统一多模态模型直升SOTA

理解帮助生成?RecA自监督训练让统一多模态模型直升SOTA

谢集,浙江大学竺可桢学院大四学生,于加州大学伯克利分校(BAIR)进行访问,研究方向为统一多模态理解生成大模型。第二作者为加州大学伯克利分校的 Trevor Darrell,第三作者为华盛顿大学的 Luke Zettlemoyer,通讯作者是 XuDong Wang, Meta GenAl Research Scientist、

来自主题: AI技术研报
5091 点击    2025-09-21 10:42
陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准

陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准

陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准

全球创新企业家、慈善家陈天桥旗下的 MiroMind 团队在这一 AI 未来大考中,连续第二周蝉联冠军。与专注文本输出的生成式模型不同,MiroMind 采用记忆驱动机制,专为预测与决策设计,旨在打造全球最好的预测大模型。

来自主题: AI资讯
6306 点击    2025-09-20 13:52
浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

2025年9月18日,由浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎教授团队联合华为技术有限公司计算产品线共同研发的国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型在“华为全联接大会2025”正式发布。

来自主题: AI技术研报
6645 点击    2025-09-20 13:05
让 llama.cpp 支持多模态向量模型

让 llama.cpp 支持多模态向量模型

让 llama.cpp 支持多模态向量模型

几周前,我们发布了 jina-embeddings-v4 模型的 GGUF 版本,大幅降低了显存占用,提升了运行效率。不过,受限于 llama.cpp 上游版本的运行时,当时的 GGUF 模型只能当作文本向量模型使用而无法支持多模态向量的输出。

来自主题: AI技术研报
7435 点击    2025-09-20 09:42
宝可梦游戏:下一代 AI 的训练场 | Kevin Lu, Thinking Machines

宝可梦游戏:下一代 AI 的训练场 | Kevin Lu, Thinking Machines

宝可梦游戏:下一代 AI 的训练场 | Kevin Lu, Thinking Machines

宝可梦游戏的开放世界、长周期、巨大行动空间和高难度特性,为训练能应对现实世界复杂性(如稀疏奖励、探索挑战)的AI提供了理想沙盒。对比AI的机械尝试和人类的“乐趣驱动”探索,文章阐释人类特有的好奇心美学对于科学发现的关键价值,并探讨AI赋能游戏设计(个性化体验、无限故事/行动空间)以优化人类乐趣的潜力。

来自主题: AI技术研报
7593 点击    2025-09-19 13:53
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

就在最新的Nature新刊中,DeepSeek一举成为首家登上《Nature》封面的中国大模型公司,创始人梁文锋担任通讯作者。纵观全球,之前也只有极少数如DeepMind者,凭借AlphaGo、AlphaFold有过类似荣誉。

来自主题: AI资讯
8207 点击    2025-09-18 16:35
B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

最近在 B 站上,你是否也刷到过一些 “魔性” 又神奇的 AI 视频?比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色,连情感和韵律都做到了高度还原!更让人惊讶的是,它们居然全都是靠 AI 生成的!

来自主题: AI技术研报
6221 点击    2025-09-18 15:54