AI资讯新闻榜单内容搜索-模型

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

OpenAI 前首席科学家、联合创始人 Ilya Sutskever 曾在多个场合表达观点：只要能够非常好的预测下一个 token，就能帮助人类达到通用人工智能（AGI）。

来自主题: AI资讯

5153 点击 2024-10-21 14:23

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。 MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。

来自主题: AI资讯

4759 点击 2024-10-21 14:15

前不久在人工智能的帮助下，两位科学家获得了诺贝尔物理学奖。可以说人工智能已经在很多领域被广泛应用了。随着大语言模型（LLM）和深度学习的广泛应用，GPU 也已成为机器学习工程师和研究人员最重要的计算资源之一。

来自主题: AI资讯

9146 点击 2024-10-21 14:14

比传统MoE推理速度更快、性能更高的新一代架构，来了！这个通用架构叫做MoE++，由颜水成领衔的昆仑万维2050研究院与北大袁粒团队联合提出。

来自主题: AI技术研报

6023 点击 2024-10-21 11:22

内存占用小，训练表现也要好……大模型训练成功实现二者兼得。来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira，成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。

来自主题: AI技术研报

5428 点击 2024-10-21 10:58

简单高效的大模型检索增强系统LightRAG，香港大学黄超团队最新研究成果。开源两周时间在GitHub上获得将近5k标星，并登上趋势榜。

来自主题: AI技术研报

6320 点击 2024-10-21 10:23

能拿下数学奥赛银牌水平的AI是否达到了12岁陶哲轩的水平？陶神本人的回答来了

来自主题: AI技术研报

4778 点击 2024-10-21 09:53

Indeed Hiring Lab 评估了OpenAI开发的生成式AI模型GPT-4在超过2800项工作技能中的表现。

来自主题: AI技术研报

5364 点击 2024-10-21 09:45

来自主题: AI技术研报

6594 点击 2024-10-20 17:34

2022年诞生的ChatGPT，已经在相当程度上实现了大模型的Scaling law（尺度定律）和通用能力涌现。

来自主题: AI资讯

4904 点击 2024-10-20 17:28