硅谷团队抄袭清华系大模型?面壁智能李大海独家回应:套壳现象难规避
硅谷团队抄袭清华系大模型?面壁智能李大海独家回应:套壳现象难规避抄袭框架和预训练数据的情况,是更狭义的套壳。
抄袭框架和预训练数据的情况,是更狭义的套壳。
面壁智能回应:“深表遗憾”,这也是一种“受到国际团队认可的方式”。
杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸Gemini Pro、GPT-4V。而且,其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。
两周前,OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。
MiniCPM 系列的最新多模态版本 MiniCPM-V 2.0。该模型基于 MiniCPM 2.4B 和 SigLip-400M 构建,共拥有 2.8B 参数。MiniCPM-V 2.0 具有领先的光学字符识别(OCR)和多模态理解能力
大语言模型的效率,正在被这家「清华系」创业公司发展到新高度。
识读距今2300多年战国时期的上古竹简,AI正在立功。 而且在这背后的“大功臣”,竟是只有2B大小的多模态大模型!
一年多来,大模型技术的进步日新月异,模型能力的上限不断抬高。但从产业变革的角度看,大模型的落地或许刚刚处于开端阶段。如何才能发挥出大模型的巨大潜力,并推动生产力更快更好地变革,仍然是一个充满探索空间的课题。
时隔七十多天,面壁在发布了MiniCPM-2B后又带来四个特性鲜明的模型,同时它还官宣了数亿元的新融资。
如果你看过《Her》这部电影,一定难以忘怀片中那位叫“萨曼莎”的 AI 伴侣,为TA 体贴入微的关心着迷,留恋时时刻刻的懂你的喜悦。而在智能营销场景中,面壁智能正以 Agent 技术赋能一个同样名叫“萨曼莎”的 AI 智能助手。