ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
冲出“包围圈”,阶跃星辰登顶国内多模态理解大模型榜首
5756点击    2024-10-18 10:21


说起阶跃星辰,可以说是 AI 六小强中最低调的一个,但最近这家公司在 AI 圈里频频“闹出动静”。


前几天,中文大模型基准测评机构 SuperCLUE 发布了 10 月中文多模态理解测评基准榜,阶跃星辰 Step-1V 在榜单中位列国内多模态大模型技术实力榜首,逼近 OpenAI 的 ChatGPT-4o-lastest,并超越腾讯、阿里云、百度等国内头部厂商。



SuperCLUE 的多模态理解测评基准榜对大模型的八大能力进行了细分评测,Step-1V 在数理逻辑分析、通用场景、常识问答、中文元素理解和推理、粗颗粒度视觉认知几个维度上都表现出了明显的优势,其中细颗粒度视觉认知能力超过了包括 ChatGPT-4o 在内所有国内外参评模型。



“细粒度视觉认知-文本理解” 测试案例:



提示词:「请问图片中的产品保质期是几天?」

Step-1V-8K 答案:图片中的产品保质期是 3 天。

评分:【5 分】


另外,OpenCompass 最新的多模态模型测试榜单显示,阶跃星辰 Step-1.5V 的得分超过 GPT-4o,成为唯一进入前 10 名的国内创业公司,给中国大模型六小强争了口气。



不仅是多模态理解模型,阶跃星辰 Step 系列全家桶中,语言模型也在大杀四方。


在司南 OpenCompass 9 月发布的榜单中,阶跃星辰万亿参数语言大模型 Step-2 ,在国内大模型创业公司发布的同类模型中表现最优。



阶跃星辰的技术实力强劲且全面,旗下 Step 系列通用大模型矩阵,目前覆盖了从千亿参数到万亿参数,从语言到多模态,从理解到生成的全面能力,是名副其实的全家桶。


另外,这家神秘的公司一直保持着高频的输出速度,基本每 100 天就有一次大动静。今年 3 月份,阶跃星辰正式亮相时就一口气发布了三款大模型产品:综合性能超过 GPT-3.5 的千亿参数大模型 Step-1,千亿参数的多模态模型 Step-1V 和国内首款万亿参数模型语言大模型 Step-2 的预览版。这三款产品让阶跃星辰在上半年的“百模大战”中亮相即炸场。今年 7 月的 WAIC 2024 世界人工智能大会上,阶跃星辰又发布了三款 Step 系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。


现在看来,除了抢占基座大模型的技术领先优势,阶跃星辰开始加速将模型能力往应用层渗透。在上个月召开的云栖大会上,阶跃星辰创始人、CEO 姜大昕透露阶跃星辰旗下智能助手“跃问”全面升级。这款 C 端产品目前已经接入了 Step-2 万亿参数大模型和 Step1.5V 多模态模型。基于这两款模型的能力,跃问还推出了多模态搜索问答功能“拍照问”,用户可以通过图像交互“即拍即问”,解决文字和语音交互中难以准确描述的需求。


除了自研应用,阶跃的 Step 系列模型正在获得越来越多开发者的选用,网红 AI 应用胃之书、国内首款 C 端 AI 电商应用物圆、AI 科研大模型专业社区 ReadPaper、AI心理陪伴应用林间聊愈室、面向胰腺癌肿瘤患者的智能 RAG 平台小胰宝等等都不约而同的选择阶跃星辰的大模型。葬花达人鲁智深在即刻上评论到,阶跃星辰的 API 参数和行为,是目前最遵从 OpenAI 标准的。


前天晚上,小编在群里刷到一款低调上线的小程序,叫歌词爆改机。我已经玩到停不下来了。选择歌曲后输入简单的指令,就可以生成各种模型爆改的歌词和歌曲封面配图。


仔细一看,产品页面上标注了“Powered by 阶跃星辰”,了解后发现,原来这款产品歌词文本和图片生成的功能背后都是阶跃星辰提供的技术支持。


孤勇者版被股市套牢的勇者、可不可以版乙方的无奈、爱如火版早八如火……各种热点、网梗,AI 都信手拈来。我已经玩到停不下来了,感兴趣的读者可以试试,祝我们每天都可以轻松摸鱼。


文章来自于“夕小瑶科技说”,作者“夕小瑶科技说”。




关键词: AI , 阶跃星辰 , Step-1V , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0