
小红书hi lab首次开源文本大模型,训练资源不到Qwen2.5 72B 的四分之一
小红书hi lab首次开源文本大模型,训练资源不到Qwen2.5 72B 的四分之一6 月 6 日,小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源了文本大模型 dots.llm1,采用 MIT 许可证。
6 月 6 日,小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源了文本大模型 dots.llm1,采用 MIT 许可证。
在文本推理领域,以GPT-o1、DeepSeek-R1为代表的 “慢思考” 模型凭借显式反思机制,在数学和科学任务上展现出远超 “快思考” 模型(如 GPT-4o)的优势。
AI顶流Claude升级了,程序员看了都沉默:不仅能写代码能力更强了,还能连续干活7小时不出大差错!AGI真要来了?这背后到底发生了什么?现在,还有机会加入AI行业吗?如今做哪些准备,才能在未来立足?
人形机器人、无人机、智能汽车这三个领域将成为空间智能的爆发点。对于具身智能(Embodied Intelligence),真实的物理环境就是最好的老师
QuestMobile 在 5 月发布的中国市场报告中指出,今年 3 月 AI 原生 APP 活跃用户数突破 2.7 亿,同比增长 536.8%,但也形成了截然不同的梯队,可以观察到明显的「赢者通吃」
大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略?
当地时间 6 月 4 日,Windsurf CEO Varun Mohan 发帖称,在提前不到五天的通知时间里,Anthropic 切断了其几乎所有 Claude 3.x 模型的直接访问权限(first-party capacity),包括 Claude 3.5 Sonnet、3.7 Sonnet 和 3.7 Sonnet Thinking。
最近,华为在MoE训练系统方面,给出了MoE训练算子和内存优化新方案:三大核心算子全面提速,系统吞吐再提20%,Selective R/S实现内存节省70%。
想训练属于自己的高性能推理模型,却被同步强化学习(RL)框架的低效率和高门槛劝退?AReaL 全面升级,更快,更强,更好用!
GPT-5,将于7月发布?刚刚,这个消息已经传疯了!跟奥特曼、OpenAI来往密集的几位人士,已经在留言区纷纷爆料了。而奥特曼本人确认,o3 pro也快来了。