AI资讯新闻榜单内容搜索-R1

Karpathy新实验火了！一个「表情」占53个token，DeepSeek-R1苦思10分解谜失败

一个简单的笑脸😀可能远不止这么简单？最近，AI大神Karpathy发现，一个😀竟然占用了多达53个token！这背后隐藏着Unicode编码的哪些秘密？如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是，这种「数据隐藏术」甚至能对AI模型进行「提示注入」！

来自主题: AI技术研报

7143 点击 2025-02-14 10:21

为了让DeepSeek-R1用起来更顺畅，火山引擎将TPM上调到了500万！全网首家

最近，DeepSeek 很热，是个好 AI，但不是每个人都能用上。

来自主题: AI资讯

8811 点击 2025-02-14 10:11

DeepSeek R1不编程就能生成GPU内核，比熟练工程师好，惊到了英伟达

这项尝试只用到了 R1 模型和基本验证器，没有针对 R1 的工具，没有对专有的英伟达代码进行微调。其实根据 DeepSeek 介绍，R1 的编码能力不算顶尖。

来自主题: AI技术研报

7419 点击 2025-02-13 15:18

清华一作1B暴打405B巨无霸，7B逆袭DeepSeek R1！测试时Scaling封神

【新智元导读】仅凭测试时Scaling，1B模型竟完胜405B！多机构联手巧妙应用计算最优TTS策略，不仅0.5B模型在数学任务上碾压GPT-4o，7B模型更是力压o1、DeepSeek R1这样的顶尖选手。

来自主题: AI技术研报

7783 点击 2025-02-13 14:18

起猛了，腾讯元宝接入DeepSeek了。

这应该是我知道的第一家有自己大模型的大厂，第一次在面向C端的AI助手应用中，第一次接入DeepSeek R1。这个意义影响还是非常深远的，腾讯在AI这一步上，好像走的格外的开放，从之前的批量开源MoE、混元绘图模型、混元视频模型、混元3D模型，还有今天这神之一手接入DeepSeek R1。

来自主题: AI资讯

9348 点击 2025-02-13 13:31

免费不限量！讯飞上线 DeepSeek 全家桶，还支持满血版精调，我爱了

整个春节假期，我眼睁睁看着 DeepSeek 从“全民狂欢”变成“全民卡顿”——官网十问九崩，还有谁没被“服务器正忙，请稍后重试”的提示，搞崩溃过。

来自主题: AI资讯

6672 点击 2025-02-13 09:33

小白就可以用deepseek-r1+dify结合联网搜索搭建AI产品

凌晨的时候，使用deepseek深度思考+联网搜索做了一个AI产品卡片，展示效果很惊艳，如下是做了几个关于AI教育智能硬件产品的特性图，放几个看看效果。我们需要深度思考+联网搜索的能力，需要根据关键词去检索到详细的信息源，因此联网搜索必不可少，然后根据如上搜索整合的信息让deepseek自适应地根据内容进行排版，选择不同地风格，呈现不同地样式。

来自主题: AI技术研报

11325 点击 2025-02-12 16:58