微软开放3.1T token高质量数据!通用/代码/数学/问答,全领域超越开源
微软开放3.1T token高质量数据!通用/代码/数学/问答,全领域超越开源RedStone是一个高效构建大规模指定领域数据的处理管道,通过优化数据处理流程,从Common Crawl中提取了RedStone-Web、RedStone-Code、RedStone-Math和RedStone-QA等数据集,在多项任务中超越了现有开源数据集,显著提升了模型性能。
搜索
RedStone是一个高效构建大规模指定领域数据的处理管道,通过优化数据处理流程,从Common Crawl中提取了RedStone-Web、RedStone-Code、RedStone-Math和RedStone-QA等数据集,在多项任务中超越了现有开源数据集,显著提升了模型性能。
强化学习训练数据越多,模型推理能力就越强?新研究提出LIM方法,揭示提升推理能力的关键在于优化数据质量,而不是数据规模。该方法在小模型上优势尽显。从此,强化学习Scaling Law可能要被改写了!
带点特斯拉、SpaceX 基因,工程能力很强。
就在刚刚,奥特曼发了个推特,轻描淡写透露了个大消息: For our next open source project……
不过半月,Ilya神秘初创SSI又被曝出将完成超10亿美金新一轮融资,估值超300亿。成立8个月时间,官网至今也只有一页文字。
随着 Roblox 和 Minecraft 等游戏平台在年轻儿童中越来越受欢迎,以及 YouTube 等平台占据了他们每天大量的屏幕时间,教育科技公司在吸引他们的注意力方面面临挑战。
刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)!一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。
近两年来,AI Coding赛道迎来井喷式发展,GitHub Copilot、Cursor等产品收入增长迅猛,科技巨头和风险投资纷纷加码,新一代AI Coding产品在提升开发效率、减少错误和确保代码质量方面表现出色,正在深刻改变软件开发生态。
用扩散模型替代自回归,大模型的逆诅咒有解了!
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型!新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。