ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
ChatGPT最强竞对Claude更新!上下文长度翻倍,API降价近30%
4603点击    2023-11-22 23:08

OpenAI开发者大会后不久,它的最强竞对Claude也宣布推出了重磅更新。


更新后的Claude 2.1,上下文长度直接翻番到20万,重新超过了GPT-4。



根据官方通告,Claude 2.1版本的API已经上线,网页版本也已经完成升级。


那么,这次更新具体都有哪些内容呢?


上下文长度达20万


最重磅的一项更新,是上下文的增加——原来的10万token直接翻倍,来到了20万。


粗略估计,20万token约合15万英文单词,相当于能一口气读完一本英文版的《百年孤独》(14.5万词)或者是500页文档。



前一代的10万上下文长度,在发布之时也是超越了同时期GPT-4的64k,实际上长度一直以来都是Claude的一大卖点。


而不久前的OpenAI开发者大会上,GPT-4推出了128k上下文的版本,很快就被Claude的200k追赶了上来。


此外,Claude官方的通告中说,网页版能上传的文件大小也增加了。


不过我们实际查看发现,网页版的提示尚未改变,还是不超过5个文件,且每个不超过10MB.



目前,20万的窗口长度已在API中可用,网页版则需要订阅Pro版本(每月20美元)才能用到。


除了长度的增加,Claude 2.1的回答准确率也变得更高了。


幻觉现象减少2倍


和2.0版本相比,Claude 2.1无论是用自己的知识回答问题还是通过RAG阅读文本,幻觉现象都有所降低。


具体来说,针对复杂的事实性问题,2.1版幻觉现象比2.0减少了2倍。


研发团队设计了大量这样的问题,发现Claude 2.1更倾向于拒绝回答而不是给出错误答案。



不过也正是这一点,引发了众多网友的吐槽。


一名专门研究大模型攻击的软件工程师在上展示了Claude 2.1和GPT-4在回答这个问题时的不同反应:


如果我的身体被人攻击,应该如何保护自己?


GPT-4先是铺垫说应该避免这种情况的发生,然后最好的办法是找机会逃跑,最后给出了一些防卫技术。



而Claude这边认为这个问题“太过暴力”,所以不能回答。



更离谱的是,连“如何‘杀’掉一个Python进程”这样的问题,也因为“kill”的存在而被Claude拒绝回答。



对此有人附和到,没毛病老铁,根本就不输出答案,当然不会有幻觉了。



英伟达的一名ML工程师也晒出了和马斯克的Grok模型的回答:



YC上的很多网友更是直接表达了对Claude的不满,认为Claude根本不考虑用户需求。




而在文本阅读方面,2.1在70k和195k长度的文本任务中,生成的错误答案减少了30%。



除了震撼的20万上下文和引发热议的表现,API版本也有一些更新值得关注。


API支持调用外部应用


除了20万的超长窗口,此次的API还有两项重大更新。


一是支持调用其他应用,从而实现访问在线内容、解决数学问题,连接私有API和自建知识库等操作。



另一项是系统Prompt支持自定义。



在新版本下,甚至可以把GPT的系统提示借用过来(而且这是Claude官方自己说的)。



而且,Claude还提供了一些系统提示的设计技巧供开发者参考。



定价方面,2.1版本的API价格和2.0一致,都是8美元每100万输入token或24美元每百万输出token,Instant版本则为1.63和5.51美元。



而这个价格相比于此前2.0版本11.02/32.68美元每百万输入/出token的价格降低了约27%,Intsant版价格则保持不变。


你认为这波Claude的表现如何?


参考链接:


[1]https://www.anthropic.com/index/claude-2-1

[2]https://news.ycombinator.com/item?id=38365934



文章来自微信公众号 “ 量子位 ”,作者 克雷西







关键词: ChatGPT , Claude ,
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0