AI资讯新闻榜单内容搜索-训练

国产千卡千亿模型训练平台落地：70B到130B大模型训练，线性加速比达91%

国内首个以国产全功能GPU为底座的大规模算力集群，正式落地了！这便是来自摩尔线程的KUAE智算中心，全国产千卡千亿模型训练平台。

来自主题: AI资讯

11807 点击 2023-12-21 11:03

NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破：在星际2灵活策略应对职业选手

近日，腾讯 AI Lab 的游戏 AI 团队宣布了其决策智能 AI "绝悟" 在《星际争霸 2》中的最新研究进展，提出一种创新的训练方法显著提升了 AI 的局内策略应变能力，使其在考虑了 APM 公平的对战环境中，与 3 位国内顶尖的神族职业选手各进行多达 20 局神族 vs 神族的对战，稳定地保持 50% 及以上的胜率。

来自主题: AI资讯

6691 点击 2023-12-20 17:50

Gemini自曝中文用百度文心一言训练，网友看呆：大公司互薅羊毛？？

在谷歌Vertex AI平台使用该模型进行中文对话时，Gemini-Pro直接表示自己是百度语言大模型。

来自主题: AI资讯

5484 点击 2023-12-18 15:04

苹果版CUDA来了！专为自家芯片打造，M3 Max可跑每秒迭代2.8次

苹果新发布适用于苹果芯片的机器学习框架MLX，MLX是一个类似于NumPy的阵列框架，旨在为使用苹果硬件的研究人员简化 ML 模型的训练和部署。

来自主题: AI资讯

9324 点击 2023-12-18 14:45

字节回应被OpenAI“拉黑”：年中已停止使用GPT训练模型

对海外AI业务依赖于国外厂商API的字节而言，微软的态度将至关重要。

来自主题: AI资讯

10085 点击 2023-12-17 11:54

首个GPT-4驱动的人形机器人！无需编程+零样本学习，还可根据口头反馈调整行为

让GPT-4操纵人形机器人，事先不做任何编程or训练，能搞成啥样儿？答案是：太猎奇了！

来自主题: AI资讯

6862 点击 2023-12-13 16:54

随意指定CLIP关注区域！上交复旦等发布Alpha-CLIP：同时保持全图+局部检测能力

本文介绍了一个名为Alph-CLIP的框架，它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后，Alpha-CLIP可以在保证CLIP原始感知能力的前提下，关注到任意指定区域。通过替换原始CLIP的应用场景，Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。

来自主题: AI资讯

9504 点击 2023-12-13 16:14

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免 LLM 产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少 LLM 幻觉（hallucinations，即错误事实）? 如何在数据政策更改后快速迭代 LLM？这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下，对于 LLM 的安全可信部署至关重要。

来自主题: AI资讯

8084 点击 2023-12-13 15:35

一套参数，狂揽160个SOTA！厦大等重磅开源「视觉感知基础模型」APE

由厦门大学等机构提出的全新视觉感知基础模型APE，只需一个模型外加一套参数，就能在160个测试集上取得当前SOTA或极具竞争力的结果。而且训练和推理代码以及模型权重全部开源，无需微调，开箱即用。

来自主题: AI资讯

10686 点击 2023-12-11 20:40

弥合化学反应预训练和条件分子生成之间的差距，北大&望石智慧提出「统一」模型

化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。

来自主题: AI资讯

7807 点击 2023-12-10 12:11

AI资讯新闻榜单内容搜索-训练

国产千卡千亿模型训练平台落地：70B到130B大模型训练，线性加速比达91%

NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破：在星际2灵活策略应对职业选手

Gemini自曝中文用百度文心一言训练，网友看呆：大公司互薅羊毛？？

​苹果版CUDA来了！专为自家芯片打造，M3 Max可跑每秒迭代2.8次

字节回应被OpenAI“拉黑”：年中已停止使用GPT训练模型

首个GPT-4驱动的人形机器人！无需编程+零样本学习，还可根据口头反馈调整行为

随意指定CLIP关注区域！上交复旦等发布Alpha-CLIP：同时保持全图+局部检测能力

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

一套参数，狂揽160个SOTA！厦大等重磅开源「视觉感知基础模型」APE

弥合化学反应预训练和条件分子生成之间的差距，北大&望石智慧提出「统一」模型

苹果版CUDA来了！专为自家芯片打造，M3 Max可跑每秒迭代2.8次