
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
朋友,你相信光吗? 在你正式做出回答之前,AI玩具领域已经用行动告诉我们:有人依然相信。 全球首款迪迦奥特曼AI玩具正式发售,国产的。
Jet-Nemotron是英伟达最新推出的小模型系列(2B/4B),由全华人团队打造。其核心创新在于提出后神经架构搜索(PostNAS)与新型线性注意力模块JetBlock,实现了从预训练Transformer出发的高效架构优化。
百度最新视频生成模型蒸汽机2.0(MuseSteamer 2.0),好像真的有点东西。
英伟达直接把服务器级别的算力塞进了机器人体内。 全新的机器人计算平台Jetson Thor正式发售,基于最新的Blackwell GPU架构,AI算力直接飙升到2070 TFLOPS,比上一代Jetson Orin提高至整整7.5倍,同时能效提高至3.5倍。
智东西8月25日消息,今日,前特斯拉AI总监、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)放出了AI辅助编程的私藏独家秘籍。
搞科研的小伙伴应该都遇到过两个难题: 一个是啃论文的时候要复现代码的过程中,往往会遇到各种出乎意料的 bug 。 另一个就是开发环境常用 Linux ,但有些软件却只有 Windows 版本。
近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。
A股站上3800点,券商AI投顾收费高,专家提醒勿迷信。 22日,A股全天震荡走高,沪指时隔10年站上3800点。股市行情向好之际,不少投资者将AI视为“投资理财顾问”。不少券商、投顾公司、第三方金融数据软件也纷纷推出了AI投顾、AI选股等功能。
面对AI淘汰焦虑,大量职场人出于生存焦虑主动自费购买AI工具,无数职场人正「自费上班」,从而开启一场「自我拯救」运动。这种现象催生出区别于传统To B和To C的全新赛道「To P」——To Professional。