AI资讯新闻榜单内容搜索-AL

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数规模急剧扩张而面临严峻的训练成本。

来自主题: AI技术研报

10796 点击 2024-02-04 13:59

随着多模态大语言模型（Multimodal Large Language Model，MLLM）的快速发展，以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中，这使得借助多模态 agent 实现手机操作助手成为了可能。

来自主题: AI资讯

8676 点击 2024-02-04 13:39

作为图领域首个通用框架，OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

来自主题: AI技术研报

9115 点击 2024-02-03 19:30

·美国联邦通信委员会将在未来几周内表决，是否将使用AI生成的语音拨打机器人电话（robocall）定为非法。委员们将在未来几周内对该提案进行表决。

来自主题: AI资讯

6002 点击 2024-02-03 14:40

加拿大滑铁卢大学的研究人员在《Nature Computational Science》发表题为《Language models for quantum simulation》的 Perspective 文章，强调了语言模型在构建量子计算机方面所做出的贡献，并讨论了它们在量子优势竞争中的未来角色。

来自主题: AI技术研报

6424 点击 2024-02-03 13:04

一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 个新模型，其中就包括更小且高效的 text-embedding-3-small 嵌入模型。

来自主题: AI技术研报

6483 点击 2024-02-03 12:47

Bard又双叒升级了！谷歌正式解禁Bard生图能力，文生图Imagen 2模型加持，效果对标DALL·E。

来自主题: AI资讯

10191 点击 2024-02-02 17:46

一个体量仅为2B的大模型，能有什么用？答案可能超出你的想象。

来自主题: AI资讯

8503 点击 2024-02-02 16:18

Mistral-Medium竟然意外泄露？此前仅能通过API获得，性能直逼GPT-4。

来自主题: AI资讯

11722 点击 2024-02-02 11:57

在 AI 赛道中，与动辄上千亿参数的模型相比，最近，小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型，其在每个基准测试中，都优于 Llama 2 13B，并且在代码、数学和推理方面也优于 LLaMA 1 34B。

来自主题: AI技术研报

10564 点击 2024-02-02 11:50