
暂时不敢用deepseek写作了
暂时不敢用deepseek写作了DeepSeek刚出来的时候,确实把我惊到了。严密的推理,天马行空的想象,近乎无限的知识面,让我已经开始收拾铺盖准备给AI老爷腾地方。但随着使用增加,我发现,它的文风太有辨识度了。
DeepSeek刚出来的时候,确实把我惊到了。严密的推理,天马行空的想象,近乎无限的知识面,让我已经开始收拾铺盖准备给AI老爷腾地方。但随着使用增加,我发现,它的文风太有辨识度了。
号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1,效果到底如何?
Hugging Face的Open R1重磅升级,7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。
乙巳新春,中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型,DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮,并不令人意外,但这款来自大厂体系外创业团队的开源大模型,经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果,则是非常耐人寻味了。
今天凌晨,亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。
每年开春的“新机潮”,今年出尽风头的是DeepSeek。
2024 年 9 月 22 日,三位年少有为怀揣创业理想的有志青年,来到了特工宇宙杭州线下办公室,一起交流 AI 搜索的技术和未来。
开源微调神器Unsloth带着黑科技又来了:短短两周后,再次优化DeepSeek-R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1/10!
一期长达5小时的播客,究竟谁在听?MIT人工智能研究员、知名播客主持人及科技传播者Lex Fridman的对谈节目《Lex Fridman Podcast》近期推出了有关DeepSeek的一期内容: 截至3月7日,这一期节目在YouTube上获得了178万播放量和2.5万like(点赞),对DeepSeek所代表的AI大模型革新的解读,获得了大量科技界、商界从业者的关注。
LeCun最新访谈,对DeepSeek一顿猛夸。 他表示,DeepSeek是一项很出色的成果,它的开源不只是成果创造者受益,全世界都能从中受益。