
杨植麟和梁文锋,论文撞车了
杨植麟和梁文锋,论文撞车了在马斯克发布了他用20万张卡训出的Grok3的同一天,两篇与马氏大力出奇迹“相反”路线的论文也发表在了技术社区。在这两篇论文的作者名目里,各自有一个大家熟悉的名字:梁文锋,杨植麟。
在马斯克发布了他用20万张卡训出的Grok3的同一天,两篇与马氏大力出奇迹“相反”路线的论文也发表在了技术社区。在这两篇论文的作者名目里,各自有一个大家熟悉的名字:梁文锋,杨植麟。
总是弹出“服务器繁忙,请稍后再试”提醒的DeepSeek,没有拦住网友对赛博玄学的渴望。
OpenAI刚刚发布SWE-Lancer编码基准测试,直接让AI模型挑战真实外包任务!这些任务总价值高达100万美元。有趣的是,测试结果显示,Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。
2月18日,被马斯克称为“地球上最聪明的人工智能”Grok 3推理模型亮相。发布会直播现场,他和带队工程师分坐两旁,将C位留给了两位主要负责模型研究的华人科学家。
又一个AI硬件夭折了!爆火的Ai Pin曾获奥特曼投资,号称要革iPhone的命,如今却被曝出退货量超出销量,Humane公司以1.16亿美元被惠普收购。
谷歌研究人员提出了一种创新的token拍卖模型,通过「竞拍」的方式,让智能体在文本生成过程中进行出价,确保最终输出能满足各方利益,实现最佳效果。这一机制优化了广告、内容创作等领域的协作。
Sam Altman 又当了一回谜语人。2 月 16 日,他宣布更新了我们的老朋友 GPT-4o,却没说细节。
AI是把双刃剑。
2025年,预期实现千万元级营收。
2月19日,界面新闻记者获悉,阿里AI To C业务近期开启大规模人员招聘,开放招聘岗位达到数百个,其中AI技术、产品研发岗位占比达到90%,所招聘人员将重点投入到文本、多模态大模型、AI Agent等前沿技术与应用的相关工作中。
DeepSeek热潮将在预训练、后训练(二次训练)和推理三大细分市场都带来巨大改变。
近日,深圳市福田区上线福田区政务大模型2.0,率先推出基于DeepSeek开发的AI数智员工,首批70名已“上岗”,引发广泛关注。
英伟达CEO黄仁勋近日在接受采访时放出重磅预言——「每个人都应该立刻拥有一个AI导师!」这位执掌万亿级芯片帝国的科技巨擘,为何对AI教育如此推崇?AI导师如何重塑我们的学习方式?未来工作格局又将如何演变?让我们一起揭开AI导师时代的面纱!
DeepSeek新注意力机制论文一出,再次引爆讨论热度。
很多人在学生时代都有一个音乐梦想,这个乐队梦通常最后苦于凑不齐吉他手、鼓手、贝斯手、键盘手等等乐手而做罢。
全网首发!DeepSeek V3/R1满血版低成本监督微调秘籍来了,让高达6710亿参数AI巨兽释放最强性能。
过去一年,3D 生成技术迎来爆发式增长。在大场景生成领域,涌现出一批 “静态大场景生成” 工作,如 SemCity [1]、PDD [2]、XCube [3] 等。这些研究推动了 AI 利用扩散模型的强大学习能力来解构和创造物理世界的趋势。
“凡我无法创造的,我就无法真正理解。” -- 费曼
正所谓庙小妖风大,美帝妖魔多。
“这机器人绝对是AI或CG合成的!”“这也太假了。”在一片质疑声之下,宇树科技CEO王兴兴在小红书上发了段自家机器人的最新视频:这段视频是宇树G1机器人的实拍,最大特点就是在机器人后边放了块大镜子。
离开OpenAI后,他们俩把ChatGPT后训练方法做成了PPT,还公开了~
「医生,你开的这些检查都没有必要,属于『过度检查』。」「谁说没有必要?」「DeepSeek 说的。」最近,有位家属在社交平台上发文表示,孩子在医院接受的部分检查被 DeepSeek 判断为「可能非必要」,于是这位家属认为接诊的医生是在「开过度的检查」,让人「花冤枉钱」。
从春节至今,DeepSeek的热度还在走高。
OpenAI前CTO Murati离职后,终于官宣新动向!她创立的「思考机器实验室」汇聚了OpenAI、谷歌DeepMind等顶尖AI人才,包括OpenAI联合创始人Schulman、前安全副总Lilian Weng等。
AI智能便携硬件+1。
推进AI良率管理。
公考机构得跟AI抢生源了
有AI,中止交易!
再次证明,AI行业里大力出奇迹。
Transformer 架构在过去几年中通过注意力机制在多个领域(如计算机视觉、自然语言处理和长序列任务)中取得了非凡的成就。然而,其核心组件「自注意力机制」 的计算复杂度随输入 token 数量呈二次方增长,导致资源消耗巨大,难以扩展到更长的序列或更大的模型。