360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill
360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill2025 年 3 月 4 日,360 智脑开源了 Light-R1-32B 模型,以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成,从没有长思维链的 Qwen2.5-32B-Instruct 出发,仅使用 7 万条数学数据训练,得到 Light-R1-32B
2025 年 3 月 4 日,360 智脑开源了 Light-R1-32B 模型,以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成,从没有长思维链的 Qwen2.5-32B-Instruct 出发,仅使用 7 万条数学数据训练,得到 Light-R1-32B
端侧AI的火热,从1月的CES燃烧到正在进行的MWC,热度丝毫未减。
国家网络安全通报中心昨天扔了个"炸弹":大模型工具Ollama有安全漏洞! 相信不少人用ollama来跑DeepSeek、Llama等模型,确实很方便。可通报里说,它默认开放的11434端口跟没锁的大门似的,谁都能进。今天就和你就说一下 这到底是怎么回事?顺便手把手教你几招,保住你的算力和隐私。
ChatGPT新Bug引热议:无法画出“有0头大象的房间”。
前两天,在下面这篇文章里,已经给大家介绍过通过一句话提示词生成app原型图,再截图让Cursor完成app开发的方法了。
自从上周Claude 3.7 Sonnet发布,我的 X 就被这玩意刷屏了好几天。
一夜之间,RTX 5070被网友们喷成“史上最差的70系列”了。
与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。
在知名AI排行榜LM Arena中,曾全班垫底的GPT-4.5竟一度拿下第一?甚至在数学、编程等领域表现优异,这反常的表现让网友们一度质疑:大模型竞技场莫非被LLM操纵了?不过网友们在实测后却惊讶发现,GPT-4.5的确情商爆表,不用推理就能理解人类的深层意图!
北京时间3月4日晚上22点,OpenAI宣布推出首个由 15 家领先研究机构组成的联盟,名为NextGenAI,而 OpenAI 承诺提供 5000 万美元(约合人民币3.6亿元)的研究补助金、计算资金和 API 访问权限,以支持学生、教育工作者和研究人员推进知识前沿。