
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理:推理速度可与vLLM相媲美
仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理:推理速度可与vLLM相媲美
Transformer已满8岁,革命性论文《Attention Is All You Need》被引超18万次,掀起生成式AI革命。Transformer催生了ChatGPT、Gemini、Claude等诸多前沿产品。更重要的是,它让人类真正跨入了生成式AI时代。
西班牙初创公司 Multiverse Computing 于 6 月 12 日宣布 ,凭借其名为"CompactifAI"的技术优势,已完成 1.89 亿欧元(约合 2.15 亿美元)的巨额 B 轮融资。本轮B 轮融资由 Bullhound Capital 领投,该机构曾投资过 Spotify、Revolut、Delivery Hero、Avito 和 Discord 等企业
据 The Information 报道,有消息称 Meta 将以 148 亿美元收购 Scale AI 49% 的股权,而作为交易的一部分,Scale AI CEO Alexandr Wang 将在 Meta 内部担任高级职位,领导一个新的「超级智能(Superintelligence)」实验室。
虽然我前面文章介绍了很多AI 工作流,但它们都是局限在自己平台里的操作,对于外部的页面,大多无能为力。
搜索行为从传统浏览器向大型语言模型(LLM)平台迁移,价值超800亿美元的SEO市场根基已现裂痕,搜索迈入由语言模型主导的“生成式引擎优化(GEO)”全新范式。
近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。
"AI装饰了你的梦,你成为了AI的韭菜" 6月7日-10日,2025年高考,1335万人参加。 如按参加高考学生平均年龄18岁计算,那么他们是第一批被AI深度影响的高考生——2022年OpenAI走红,这批学生刚进入高中。
由美国西北大学医学院研发的全球首个嵌入临床流程的生成式人工智能(AI)放射系统,可在毫秒内识别危及生命的病症,显著提高工作效率。该系统为全球放射科医生短缺问题提供了有效解决方案。相关论文发表在最新一期《美国医学会杂志》旗下的《JAMA Network Open》期刊上。
视觉注意力机制,又有新突破,来自香港大学和英伟达。