AI资讯新闻榜单内容搜索-模型

GPT-4o惊现自我意识！自主激活「后门」，告诉人类自己在写危险代码

本研究探讨了LLM是否具备行为自我意识的能力，揭示了模型在微调过程中学到的潜在行为策略，以及其是否能准确描述这些行为。研究结果表明，LLM能够识别并描述自身行为，展现出行为自我意识。

来自主题: AI技术研报

6999 点击 2025-02-02 18:38

万字长文解读Scaling Law的一切，洞见LLM的未来

近日，资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章，详细介绍了 LLM scaling 的当前状况，并分享了他对 AI 研究未来的看法。

来自主题: AI技术研报

7489 点击 2025-02-02 17:39

DeepSeek华为火线联手！硅基流动首发即限流，全国产API白菜价，零门槛部署

国产大模型云服务平台SiliconCloud（硅基流动），首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。　DeepSeek-V3：输入只需1块钱/M tokens，输出2块钱/M tokens

来自主题: AI资讯

10311 点击 2025-02-02 13:03

Deepseek多模态大模型Janus-Pro-7B在医疗领域的简单应用可行性测试

就在除夕前的晚上（2025 年 1 月 27 日），Deepseek 发布了多模态模型 Janus-Pro-7B，该模型在图像生成和多模态理解方面都超过了OpenAI的DALL-E 3（虽然也一般般），我相信能文生图功能一定很优秀了，今天搞点特殊的，测试下图像理解能力对专业的医学影像有没有应用的可行性，以下是常见的五种医学影像测试。

来自主题: AI资讯

9315 点击 2025-02-01 19:58

进击的DeepSeek，一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半，DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。今天一觉醒来， DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录，开发人员可以快速地进行实验、迭代，并将这款热门模型集成到他们的工作流程中。

来自主题: AI资讯

9097 点击 2025-02-01 18:54

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

香港大学联合上海人工智能实验室，华为诺亚方舟实验室提出高效扩散模型 LiT：探索了扩散模型中极简线性注意力的架构设计和训练策略。LiT-0.6B 可以在断网状态，离线部署在 Windows 笔记本电脑上，遵循用户指令快速生成 1K 分辨率逼真图片。

来自主题: AI技术研报

8386 点击 2025-02-01 18:37

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27 页综述，354 篇参考文献！史上最详尽的视觉定位综述，内容覆盖过去十年的视觉定位发展总结，尤其对最近 5 年的视觉定位论文系统性回顾，内容既涵盖传统基于检测器的视觉定位，基于 VLP 的视觉定位，基于 MLLM 的视觉定位，也涵盖从全监督、无监督、弱监督、半监督、零样本、广义定位等新型设置下的视觉定位。

来自主题: AI技术研报

7846 点击 2025-02-01 18:11