ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
9568点击    2024-04-23 14:25

Llama 3发布刚几天,微软就出手截胡了?



刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。



其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B


为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。



微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。



这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。



在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。



除了mini杯之外,小杯中杯也一并发布:


Phi-3-small7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。


Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。


(大杯他们目前不打算做)


作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。



那么,Phi-3系列到底有什么独特之处呢?


根据技术报告中披露,其核心秘诀就在于数据


去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。


反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。


也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need



Phi-3也延续了这一思路,这次他们更是下了血本:


  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)


  • 大幅强化了数据的”教育水平”过滤


  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能


  • 独特的指令微调和RLHF训练,大幅提升对话和安全性


举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据


这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。



不过小模型毕竟是小模型,也不可避免存在一些弱点。


微软透露,模型本身参数中没能力存储太多事实和知识,这一点也可以从TriviaQA测试分数低看出来。


缓解办法就是联网接入搜索引擎增强。



总之,微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去,未来还打算继续增强小模型的多语言能力、安全性等指标。


对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。



本文来自微信公众号“量子位”


关键词: chatGPT , 大模型 , openai , GPT-3.5 , Phi-3
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner