AI资讯新闻榜单内容搜索-基础大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 基础大模型
Step-3 发布:包括发布会上没说的,都在这了

Step-3 发布:包括发布会上没说的,都在这了

Step-3 发布:包括发布会上没说的,都在这了

今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。MoE 架构,321B 总参,38B 激活

来自主题: AI资讯
7965 点击    2025-07-25 23:25
大模型竞赛转向:决胜关键为何是“后训练”?

大模型竞赛转向:决胜关键为何是“后训练”?

大模型竞赛转向:决胜关键为何是“后训练”?

随着基础大模型在通用能力上的边际效益逐渐递减、大模型技术红利向产业端渗透,AI的技术范式也开始从原来的注重“预训练”向注重“后训练”转移。后训练(Post-training),正从过去锦上添花的“调优”环节,演变为决定模型最终价值的“主战场”。

来自主题: AI技术研报
6101 点击    2025-07-20 12:30
华为盘古大模型“抄袭”阿里Qwen?官方回应

华为盘古大模型“抄袭”阿里Qwen?官方回应

华为盘古大模型“抄袭”阿里Qwen?官方回应

7月5日下午16:59分,隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于“抄袭”指控进行了官方回应。诺亚方舟实验室表示,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型

来自主题: AI资讯
8563 点击    2025-07-06 11:06
印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

作为首批入选印度“IndiaAI Mission”国家级项目、承担构建印度主权基础大模型任务的公司之一,Sarvam AI 近日发布了名为 Sarvam-M 的模型。这是一个基于 Mistral Small 构建的 240 亿参数、权重开放的混合语言模型。

来自主题: AI资讯
9031 点击    2025-05-27 14:44
Nature重磅!中国团队打造全球最大单细胞大模型,官宣开源,细胞版Deepseek来了!

Nature重磅!中国团队打造全球最大单细胞大模型,官宣开源,细胞版Deepseek来了!

Nature重磅!中国团队打造全球最大单细胞大模型,官宣开源,细胞版Deepseek来了!

刚刚,全球规模最大的单细胞基础大模型来了,而且是纯国产!近日,中山大学杨跃东教授团队联合重庆大学、华为、新格元生物科技,研发单细胞基础大模型CellFM,成果发表在Nature Communications上。

来自主题: AI资讯
9048 点击    2025-05-23 16:15
国产大模型「五强争霸」,决战AGI!

国产大模型「五强争霸」,决战AGI!

国产大模型「五强争霸」,决战AGI!

中国基础大模型市场,彻底变天了!如今牌桌上的玩家已经变成了「基模五强」——字节、阿里、阶跃星辰、智谱和DeepSeek。接下来的巅峰之战,关键制胜点又会在哪里?

来自主题: AI资讯
8061 点击    2025-05-13 09:58
多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化

多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化

多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化

当大模型赛道中不少玩家明确表示放弃基础大模型研发,心思放在更聚焦的方向上时,阶跃星辰站出来——就像这家公司第一次亮相时那样,给外界一个明确的回答:

来自主题: AI资讯
5943 点击    2025-05-12 10:36
国产AI六小虎已经有俩变病猫,他们活下去的理由不好找

国产AI六小虎已经有俩变病猫,他们活下去的理由不好找

国产AI六小虎已经有俩变病猫,他们活下去的理由不好找

昨天,是国产 AI 六小虎之一百川智能成立的两周年,CEO 王小川发布全员信强调公司方向: “ 减少多余动作,专注医学方向。”要知道,两年前,百川智能刚成立的时候,其愿景可是 “ 旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用 ”,非常宏大。

来自主题: AI资讯
7898 点击    2025-04-12 11:00
真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

今天,银河通用机器人发布了端到端具身抓取基础大模型「GraspVLA」,全球第一个预训练完全基于仿真合成大数据的具身大模型,展现出了比OpenVLA、π0、RT-2、RDT等模型更全面强大的泛化性和真实场景实用潜力。

来自主题: AI技术研报
4096 点击    2025-01-10 12:23