ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
傅盛揭穿OpenAI「阳谋」,引130万人围观!百亿参数模型帮老板打王者,一张3060就能跑
8000点击    2024-01-22 10:41


就在刚刚,OpenAI的最大秘密,被傅盛在130万人面前揭穿!百亿参数,竟能在企业级应用中媲美千亿级大模型;一张3060,就能帮老板打到「王者」!


当全世界都在为GPT Store上线而兴奋时,谁又看到了OpenAI的「阳谋」?


当你把合同、财务、业务数据等公司机密都传给ChatGPT时,或许并未意识到:每一次使用ChatGPT,都是在帮OpenAI提升模型「智商」。


正如GPT Store的发布,让众多初创公司一夜暴毙。而他们始终也没有搞明白,为什么自己300万美元的公司,最后变成了一张500美元的OpenAI API代金券。



去参加开发者大会的每个人都会得到一张OpenAI给的API代金券


现在,Altman不说的秘密,终于被揭开了——


企业应用,百亿参数就够了


很长一段时间,千亿参数大模型都被认为是商业化应用的最佳方案。


但直接基于API使用,会有数据泄露给例如OpenAI这些模型供应商的风险。那最好的办法就是私有化部署。然而面对如此规模的模型,光授权费就要数千万。


对此,老板们纷纷表示,我就是想解决个客服问题而已,就没有便宜的方案吗?


就在今天,性价比更高的方案来了——猎户星空正式官宣了一款千亿级效果的百亿大模型。



测试显示,在百亿参数+应用打磨的加持下,模型对于专业场景问题的回答已经超越了GPT-4。而且,只要千元显卡即可运行!



话不多说,先上跑分。


可以看到,Orion-14B在众多20B规模的模型中,遥遥领先。


不仅在MMLU、C-Eval、CMMLU、GAOKAO、BBH等主流测试集上拿下SOTA。



而且,在OpenCompass综合测评的中文数据集上,总分位列700亿参数以下基座模型第一。



此外,Orion-14B还具备极强的多语言能力——在日语、韩语开源模型评测中也拿下了全球第一,堪称是「出海之光」。



日文为JNLI等8项评测集平均得分;韩文为COPA等4项评测集平均得分;中文英文为OpenCompass对应语言评测集平均得分


在目前业内公认最权威的大模型长文本准确度测试方法「大海捞针」中,Orion-14B直接拿下了200K token全绿的成绩。


甚至,最高还可以支持320K的超长上下文,相当于一次性看完小半本《三体》(45万汉字)。



顺带一提,此前有报道指出,有不少大模型为了在榜单中「刷新SOTA」,竟然直接拿基准测试里面的「真题」和「答案」来训练。


对此,猎户星空表示,自己大模型的成绩绝对真实,完全没有刷过题。



模型开源一手实测:幻觉消失了


目前,Orion-14B已经全面开源,并且可以直接在线上体验。



GitHub:https://github.com/OrionStarAI/Orion


Hugging Face:https://huggingface.co/OrionStarAI


ModelScope:https://modelscope.cn/studios/OrionStarAI/Orion-14B-App-Demo/summary


技术报告:https://github.com/OrionStarAI/Orion/blob/master/doc/Orion14B_v3.pdf


比如,告诉它插入表格数据的基本信息,然后输出SQL语句。


Orion-14B按要求用SQL编程语言完成了任务。



你还可以上传文档给到Orion-14B,然后模型可以基于文档内容给出回应。


这样,企业私有领域的数据,就可以在下游应用中把模型作用发挥到极致。


举个栗子,上传一些关于交通法的文档片段,当用户询问哪些情况不能超车,Orion-14B就会根据已有的内容准确回答,不会瞎猜出现幻觉。



Orion-14B还可以根据输入一段话内容,将其变成QA对。


比如室内装饰构造虚拟仿真教学软件的产品的5点价值,以及应用领域和适用对象。


一大段内容输入后,模型就能将其拆分、理解,得到不同的QA对话。



此外,当你输入一封邮件的内容,Orion-14B模型还可以抽取数据,发件人、邮箱、联系方式,都可以清晰地分列出来。



微调「全家桶」媲美千亿模型,入门级显卡可跑


可以看到,在AI大潮下,只有在私有化数据加持下的大模型,才能给企业持久的竞争力。


而为企业应用而生的猎户星空大模型,凭借着「全家桶」级的微调能力,可以在专业场景里实现媲美千亿级模型的效果。


具体来说,猎户星空大模型涵盖了七大应用微调方向:


通用对话微调、插件微调、RAG微调、长Token微调、知识抽取微调、问答对生成微调、日韩文微调。


其中,基础对话能力微调模型(Orion-14B-Chat)专注于提升对话能力,尤其在理解历史消息和角色扮演方面显示出更高的准确性。


这一版本能够捕捉对话上下文中的细微变化,并根据不同角色和场景做出相应的反应,从而提供更加自然、连贯的对话体验。



除此之外,猎户星空还在两个大模型应用的主流方向上深入打磨——检索增强生成(RAG)和Agent。


两大重点:RAG和Agent


尽管当前大模型的能力令人印象深刻,但并非无懈可击。它们或因训练数据时效,token长度等限制,可能会输出误导性信息,进而产生「幻觉」。


有时,LLM也会因缺乏专业领域知识,在处理特定领域的问题时,力不能及。尤其是对于企业内部的信息,让LLM自由发挥就更加容易出错。


但有了私有知识的加持,它的回答就精准多了。


RAG的诞生,就是为了补足这一块短板。



来源:https://arxiv.org/pdf/2312.10997.pdf


目前流行的大模型应用开发框架Llama-Index、LangChain等,都包含了RAG的部分。但是框架数量虽然多,在实际部署时却一言难尽,工程搭建繁琐,效果不理想,企业可能搞了半年都上不了线。


相比之下, 猎户星空的RAG能力微调模型(Orion-14B-RAG),则通过针对知识边界控制、问答对生成、幻觉控制、结构化数据提取等能力进行专项微调,使其成为了最适合开发RAG应用的微调模型。


基于此,企业便能够快速整合自身知识库,构建定制化应用。



除了RAG,拓宽大模型应用的另一条重要路径,便是Agent。


OpenAI应用人工智能研究主管Lilian Weng去年的一篇博客,曾掀起Agent讨论热潮。基于大模型构建的Agent,拥有强大的语言理解和处理能力,可以自动化完成各种任务。


除了耳熟能详的AutoGPT、BabyAGI等,还有OpenAI官宣的「定制GPTs」,都属于Agent的范围。



举个栗子,HuggingGPT利用ChatGPT作为控制器,连接HuggingFace社区中的各种AI模型,来完成多模态复杂任务。


一夜爆火的MetaGPT,能扮演各种角色,在内部监督代码生成,提高代码质量。


更有网友用MetaGPT智能体框架,仅在10分钟就做出小游戏Flappy Bird,让低成本的软件开发成为现实。



而猎户星空的插件能力微调模型(Orion-14B-Plugin),则通过增强模型根据用户问题调用最适配工具的能力,并将插件的结果与模型的处理相结合,来解决更复杂的问题。


具体来说,研究团队针对意图识别、函数调用、缺槽反问、单轮抽参、多轮抽参等能力进行专项微调,使其成为了最适合构建Agent应用的微调模型。



由此,也让猎户星空大模型在Agent应用所需的五种能力上,几乎追平了GPT-4——


意图识别成功率90.3%;首轮抽参成功率100%;多轮抽参成功率90.19%;缺槽反问成功率91.07%;插件调用成功率91.37%。


相比之下,一般的百亿参数大模型表现不超过70%。



千元即可商用:RTX 3060都能跑


此外,为满足小企业需求,猎户星空大模型还推出了几乎无损的INT4量化版本(损失<1%)。


通过AWQ Q4量化技术,研究团队不仅让模型大小直降了70%,而且还使推理速度也提升了30%。



换句话说就是,只需一张消费级显卡,如NVIDIA RTX 3060,就能实现每秒最高31 tokens(约50个汉字)的输出。


而在私有化部署方面,也可以轻松地将服务器和企业数据控制在内网之中,甚至还提供全套开源免费可商用资源和社区技术支持。


独家推出企业使用AI的三个段位


在大会上,傅盛抛出这样一个观点:企业使用AI,有三个段位。


青铜段位,是用AI做文案、做图。黄金段位,是数字员工。但AIGC其实最重要的,还是王者段位。


在此段位,全过程都由AI参与。王者段位的企业,应该选择用私有大模型+强应用套件,来实现数字员工和辅助决策。



不过,虽然现在大模型百花齐放,但猎户星空却在实践中发现,企业需要的不是「大模型」,而是能够结合业务流并解决自身痛点的大模型应用。


曾经,傅盛和朱啸虎的这场辩论,引发了全网关注。


当时傅盛表示,做好应用,依然是创业者最好的机会。



现在,猎户星空来交卷了!


会上,傅盛重磅发布了AI辅助决策交钥匙解决方案「聚言」,可以为企业提供全链条的定制化AI大模型咨询和解决方案服务。



可以预见,在以上所有这些能力的共同加持下,一个崭新的时代即将来临——每个企业都会有私有化大模型。


「数字老板」是个啥?


值得一提的是,相比于别人做的「数字员工」,猎户星空竟然选择了做「数字老板」!


不过,这其中的原因很简单,猎户星空在自己应用AI时,发现了不少业内秘密——


大模型在企业中无法即插即用,而只靠员工自主探索,也很难实现企业AI应用上的增效,必须针对整个流程,进行AI重构。


而有了「数字老板」之后,老就们就可以全面掌握经营细节。人力资产、云资产、数字资产,全天候细节无遗漏。


人力助手:一口气看完2000份周报,发掘潜力员工


前一阵曝出英伟达的员工每人都要向CEO老黄提交周报,老黄是怎么看完的呢?当然是用AI。


猎户星空的这位「数字老板」,就能做到这点。


比如,只需问一句,人力助手就能把公司收到的近2000份周报汇总起来,并提炼出主要的业务进展和潜在的风险。



之后,还可以继续询问某项具体风险的应对方案。而AI便会完全依据周报的内容,给出回答。



此外,AI还可以根据周报分析团队的实际效率,并给出优化建议。



更厉害的是,当AI完全掌握了公司的私有数据时,还能帮你预测出员工的潜力!


比如,海外销售业务最有可能成为销冠的三个人是谁。


AI就会根据海外销售业务的特点,创建出一个得分系统,然后根据数据分析给出结果,并同时附上非常直观的图表。



如此一来,不仅能像英伟达的黄老板一样,每天处理数百封邮件,跟进数十个项目,还能减少决策失误,提高效率。


云资产助手:成本直降30%,立省85万刀


对于另一项开销大头「云」来说,技术人员通常都希望服务器越多越好,而老板们虽然搞不懂,但依然需要为越来越贵的云成本买单。


为此,猎户星空推出了云资产助手——一个利用不同领域云治理专家经验训练的专业领域大模型。


具体来说,AI会通过深挖云数据的底层逻辑,对客户的云上资源和成本账单数据进行多维度分析,从而进一步剖析运营成本痛点。



然后,再基于此自动生成切实可行的解决方案,并附上高质量的成本优化报告。



而且,当老板对某个图表或概念产生疑问时,只需和AI多聊两句,就可以获得答案。



聚言创意助手:N个专家,直接为你出谋划策


如今,老板的智囊团成本越来越高,内部有共同的认知盲区,而外部的智囊团,又成本太高、周期太长。


这样的后果就是,每次讨论决策的时间越来越长。


为此,猎户星空推出了一个由多个Agent组成的「智囊团」——聚言创意助手,可以让各个领域的专家直接为你出谋策划。


比如,去年爆火的旅游城市景德镇、淄博,再到哈尔滨,你能想象到,AI参与这次谋划会如何?


只需要在聚言创意助手中,勾选你想要给出旅游战略规划的角色,输入话题,它们便会从不同角度提供方案。



专家为你出谋划策,这个过程仅需要20-30分钟。



有了聚言助手,未来各种营销策略、市场报告等等,无需费力找专家,就能获得更高质高效、全面省钱的方案。



所有的创新,都由Think Different引发


做出自己的千亿大模型,就一定能取得商业上的成功吗?如果技术没有和产品、应用形成闭环,再多技术投入都不能形成壁垒。


现在主流的模式,是砸钱预训练千亿级模型,微调,然后寻找应用场景。而猎户星空却独辟蹊径,在已知应用场景后,再微调,然后寻找合适的模型。



七年磨一剑


大模型下半场开年之局,猎户星空大模型登场着实给了所有人亿点点震撼。


作为一家All in AI的创业公司,如今在大模型时代大放异彩,背后离不开团队在这一领域持续7年的深耕。



2016年,猎户星空成立初始便投入了巨资、博士团阵容,打造AI全链条技术。


值得一提的是,这家公司拥有来自Meta、Yahoo、百度等全球顶级大厂上百名顶级算法科学家的顶级团队。


与此同时,团队在技术栈上,对从DNN、Attention、Bert到LLM、ASR/TTS/NLP的演进也非常熟悉。


猎户星空的机器人还登上冬奥会,出海全球获得了认可,拥有全球20亿用户应用打磨经验。


而在7年AI磨刀的过程中,有了扎实的数据积累,包含百亿级真实用户query数据,数十亿级token数据。


重磅预告:MoE已经在训了!


目前,猎户星空已经在已有模型的基础上,调试和训练MoE架构的专家混合模型了。


据称,在这「N个臭皮匠」的加持下,智能水平可以全方位媲美千亿参数模型。



2024年,大模型应用怎么走?


傅盛预测,到2024年,千亿大模型中过半都会凋零,而百亿大模型会百花盛开。


超越OpenAI的机会,将来自大模型应用公司。


让我们拭目以待。


参考资料:

https://github.com/OrionStarAI/Orion

https://modelscope.cn/studios/OrionStarAI/Orion-14B-App-Demo/summary

https://huggingface.co/OrionStarAI


文章来自于微信公众号 “新智元


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

6
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales