
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。
近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。
一个简单的笑脸😀可能远不止这么简单?最近,AI大神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘密?如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是,这种「数据隐藏术」甚至能对AI模型进行「提示注入」!
超级碗再次证明了自己是美国最优秀的职业体育赛事。 作为转播商的福克斯,公布了美国时间2月9日举行的超级碗转播相关记录。福克斯引用收视率调查企业尼尔森,和负责流媒体转播的Tubi,以及NFL官方网站的数据计算,此次超级碗平均有1.26亿人观看。
还在用枯燥的数学题和编程题测试AI?落伍啦!现在,打游戏就能测出AI的真实力。GameArena团队打造的Roblox新游《AI空间逃脱》,让你在紧张刺激的密室逃脱中,顺便就把AI模型的推理能力给评估了。这不仅比传统测试方法更有趣,还能生成宝贵的游戏数据,帮助开发者更全面地了解AI的强项与短板。
人类通过课堂学习知识,并在实践中不断应用与创新。那么,多模态大模型(LMMs)能通过观看视频实现「课堂学习」吗?新加坡南洋理工大学S-Lab团队推出了Video-MMMU——全球首个评测视频知识获取能力的数据集,为AI迈向更高效的知识获取与应用开辟了新路径。
基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!这些有关AI在各经济领域应用情况的问题,报告用实实在在的统计数据全回答了。
DeepSeek 在海内外搅起的惊涛巨浪,余波仍在汹涌。当中国大模型撕开硅谷的防线之后,在预设中总是落后半拍的中国 AI 军团,这次竟完成了一次反向技术输出,引发了全球范围内复现 DeepSeek 的热潮。
近期,AI文档智能领域领跑者北京庖丁科技有限公司(以下简称“庖丁科技”)宣布完成最新一轮融资。本轮融资由国内办公软件和服务提供商金山办公与创业投资机构顺为资本联合领投。这笔资金将主要用于文档智能技术研发、市场拓展以及核心人才引进,进一步推动非结构化数据智能处理技术的创新与落地。
Similarweb 数据显示,在网站端,过去28天,视频编辑类产品Zeemo和Vizard的日平均访问量均超CapCut,在功能上,Zeemo和CapCut相似度更高,而在商业化范围的广度方面,Vizard的专业性更强。
上海拥有全国1/3的人工智能重点企业、41%的智能芯片产能和日均处理的20PB级城市数据,却在2025年伊始遭遇了尴尬的叩问: 一家总部杭州的初创公司DeepSeek横空出世,其开源大模型的开发者调用量在一周内突破微软亚洲研究院十年累积量,直接促成全球170个国家开发者建立起47万个衍生模型