LLM省钱大测评!48块GH200,首个百亿级参数量实证
LLM省钱大测评!48块GH200,首个百亿级参数量实证EfficientLLM项目聚焦LLM效率,提出三轴分类法和六大指标,实验包揽全架构、多模态、微调技术,可为研究人员提供效率与性能平衡的参考。
EfficientLLM项目聚焦LLM效率,提出三轴分类法和六大指标,实验包揽全架构、多模态、微调技术,可为研究人员提供效率与性能平衡的参考。
DeepSeek 猝不及防地更新了,不是 R2,而是 R1 v2。
对于会计部门而言,总账系统是最为关键的软件。作为汇总所有财务交易的核心枢纽,它提供了生成准确财务报表所需的基础数据。本周三,Rillet 宣布完成 2500 万美元 A 轮融资,由红杉资本领投,现有投资者跟投。
刚刚,可灵2.1正式上线了。
视觉语言模型(Vision-Language Models, VLMs),为真实环境中的机器人操作任务提供了极具潜力的解决方案。
你是否曾对大语言模型(LLMs)下达过明确的“长度指令”?
即使RLVR(可验证奖励强化学习)使用错误的奖励信号,Qwen性能也能得到显著提升?
来自中国人民大学高瓴人工智能学院与值得买科技 AI 团队在 CVPR 2025 会议上发表了一项新工作,首次提出了一种从静态图像直接生成同步音视频内容的生成框架。其核心设计 JointDiT(Joint Diffusion Transformer)框架实现了图像 → 动态视频 + 声音的高质量联合生成。
2025年,英伟达创始人兼CEO黄仁勋提出的“AI工厂”,正在中国半导体行业落地生根——不同于传统工厂将原材料转化为产品,AI工厂是将数据和算力转化为智能服务,帮助企业降本增效。
来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。