DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:
再加上春节期间的三大运营商全面接入DeepSeek等消息,它的影响力已不仅限于AI和互联网,正在往产业更深层进发。
总之,对于用户和开发者来说不用再看“服务器繁忙”的脸色,可以多换几个地方再试了。
随着官方服务器不堪重负,以及DeepSeek-V3 API优惠结束恢复原价,各大云服务商也抓住机会卷了起来。
腾讯云率先上线支持联网搜索的DeepSeek,结合自家旗下搜狗搜索提供搜索增强API。
同时支持集成私域知识库,一键整合RAG。
商汤和阿里直接卷起了价格。
商汤大装置平台上3个月内可限时免费使用1000万tokens,同时支持128K最大上下文长度限制。
阿里云为新用户提供100万免费tokens,同时蒸馏版模型价格也比较低。
与此同时,各类芯片正在输出速度上展开激烈竞争。
通用GPU方面,AMD员工透露MI300X上的DeepSeek-R1满血版速度比刚发布时已经快了3倍,并发布官方Docker Image镜像。
在英伟达与CUDA生态之外,提供AMD与ROCm的另一种选择。
三大新型AI推理芯片Groq、Cerebras、Sambanova已经把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。
快到你都看不清发生了什么,推理思维链完成了、代码写完了,一眨眼直接运行了。
△groq芯片运行DeepSeek-R1-Distill Llama-70B
还有一条有意思的消息,ai.com域名现在已定向到DeepSeek官网。
甚至有传言称是DeepSeek重金拿下了该域名。
不过一直关注大模型的朋友可能还记得,这个域名曾先后定位到ChatGPT和xAI。
大概率是域名所有人个人行为~
国家超算互联网平台
https://www.scnet.cn/
腾讯云DeepSeek专题
https://cloud.tencent.com/developer/special/deepseek
阿里云DeepSeek解决方案
https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms
商汤大装置
https://www.sensecore.cn
参考链接:
[1]https://x.com/AnushElangovan/status/1888006978959741390
[2]https://x.com/Dev__Digest/status/1887337604267332022
文章来自微信公众号 “ 量子位 ”,作者 梦晨
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI