用DeepSeek徒手造一个能对话的AI简历,助你当场拿下Offer。
用DeepSeek徒手造一个能对话的AI简历,助你当场拿下Offer。故事是这样的。
故事是这样的。
随着大语言模型 (LLM) 的出现,扩展 Transformer 架构已被视为彻底改变现有 AI 格局并在众多不同任务中取得最佳性能的有利途径。因此,无论是在工业界还是学术界,探索如何扩展 Transformer 模型日益成为一种趋势。
AI时代的护城河究竟在哪里?这个问题一直是这波AI浪潮中被大家广泛讨论的一个点。两年前,我没有找到这个问题的答案,所以在探索了半年AI创业后(可以看我23年的总结文章),我选择了做Advisor,接触更多的产品和创始人,试图从中找到这个问题的答案。
在过去的一周,这一方向的进展尤其丰富。有人发现,几篇关于「让 LLM(或智能体)学会自我训练」的论文在 arXiv 上集中出现,其中甚至包括受「哥德尔机」构想启发而提出的「达尔文哥德尔机」。或许,AI 模型的自我进化能力正在加速提升。
MiniMax即将发布代号M+的文本推理模型,其表现将影响公司未来竞争力。面对DeepSeek R1的冲击,MiniMax采取国内C端不接入、海外接入的策略,并推出类Manus产品MiniMax Agent。公司通过品牌拆分(海螺AI更名)、纯API商业模式拓展市场,语音模型商业化效果显著,但未进入“基模五强”名单。新推理模型或成其保持行业地位的关键。
特工宇宙独家获悉,北京某知名大厂最近在海外上线了一款 AI 驱动的数字人视频创作产品,Keevx。特工宇宙独家获悉,北京某知名大厂最近在海外上线了一款 AI 驱动的数字人视频创作产品,Keevx。
原生1bit大模型BitNet b1.58 2B4T再升级!微软公布BitNet v2,性能几乎0损失,而占用内存和计算成本显著降低。
推理模型常常表现出类似自我反思的行为,但问题是——这些行为是否真的能有效探索新策略呢?
嗨大家好!假期愉快! 5月29日,黑森林实验室发布了 FLUX.1 Kontext,目标是通过一个统一的框架处理多种图像任务,解决现有模型在多轮编辑中的一些关键痛点。
近年来,大语言模型(LLMs)的能力突飞猛进,但随之而来的隐私风险也逐渐浮出水面。
几天前,没有预热,没有发布会,DeepSeek 低调上传了 DeepSeek R1(0528)的更新。
不久前,GPT-4o 的最新图像风格化与编辑能力横空出世,用吉卜力等风格生成的效果令人惊艳,也让我们清晰看到了开源社区与商业 API 在图像风格化一致性上的巨大差距。
你有没有想过,企业财务管理这个看似传统的领域,正在经历一场彻底的技术革命?
「尽管经过 SFT 的模型可能看起来在进行推理,但它们的行为更接近于模式模仿 —— 一种缺乏泛化推理能力的伪推理形式。」
Chris Pedregal是Granola的联合创始人兼首席执行官。Granola是一款由AI驱动的智能会议记录工具,正在重新定义知识工作者的工作方式,帮助用户更高效地记录、组织和调用对话中的关键信息。本文是Invest Like the Best主持人Patrick O'Shaughnessy与Chris Pedregal的访谈实录,访谈播客于2025年2月播出。
如何让CLIP模型更关注细粒度特征学习,避免“近视”?360人工智能研究团队提出了FG-CLIP,可以明显缓解CLIP的“视觉近视”问题。让模型能更关注于正确的细节描述,而不是更全局但是错误的描述。
AI编程工具正引发技术革命,Cursor等产品通过自然语言交互颠覆传统编程模式,显著提升开发效率。全球创业公司竞逐AI Coding赛道,但技术成熟度、商业化路径仍面临挑战。中国企业在安全定制、垂直领域探索机会,行业期待通过代码平权重构开发生态,推动AGI实现进程。
曾撼动Transformer统治地位的Mamba作者之一Tri Dao,刚刚带来新作——提出两种专为推理“量身定制”的注意力机制。
据彭博社消息,双方正就预装Perplexity 应用及助手到三星新款设备,以及将该初创企业的搜索功能整合至三星网页浏览器进行谈判;两家公司还探讨了将 Perplexity 技术融入三星 Bixby 虚拟助手的方案。
数据枯竭正成为AI发展的新瓶颈!CMU团队提出革命性方案SRT:让LLM实现无需人类标注的自我进化!SRT初期就能迭代提升数学与推理能力,甚至性能逼近传统强化学习的效果,揭示了其颠覆性潜力。
北大校友官宣推出号称“最强通用Agent” Fairies(中译仙女),能执行Deep research、代码生成、发邮件等1000个操作。关键是无需邀请码,Mac和Windows用户只需下载APP就能立即上手试玩。(⊙ˍ⊙)
据撰写这份报告的 AI 编程助手厂商 Replit 员工 Matt Palmer 称,他和一位同事扫描了 Lovable 网站上 1645 款由其开发的 Web 应用程序。经过审查核实,其中 170 款应用程序允许任何人访问网站的用户信息,包括姓名、电子邮件地址、财务信息以及 AI 服务的 API 密钥。
近日,利用昆虫嗅觉受体制造生物传感器的生物制造企业Scentian Bio宣布,与全球最大猕猴桃营销商新西兰巨头佳沛(Zespri)达成合作。Scentian Bio的核心技术是一套基于昆虫嗅觉受体(iOR)的生物传感器,可以检测食品、植物或人体中的挥发性有机化合物 (VOC)。
深度|对话英伟达CEO黄仁勋:不进入中国就等于错过了90%的市场机会;英伟达即将进入高达50万亿美元的产业领域
近段时间,已经出现了不少基于扩散模型的语言模型,而现在,基于扩散模型的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。今天我们介绍的这个名叫 LaViDa,继承了扩散语言模型高速且可控的优点,并在实验中取得了相当不错的表现。
昨天发现Mary Meeker又重新开始发布她每年一次的《互联网趋势报告》,只不过这次开始叫《人工智能趋势报告》了,整份报告有 340 页,非常详细的分析了AI领域的现状。
Claude团队来搞开源了——推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。该工具的核心在于生成归因图(attribution graphs),其作用类似于大脑的神经网络示意图,通过可视化模型内部超节点及其连接关系,呈现LLM处理信息的路径。
人类数学家与AlphaEvolve携手,一周内两次刷新18年未破的数学纪录!展现AI与人类协作的惊人潜力。AI如侦察兵广度扫描,人类专家深度优化,双引擎驱动下,科学前沿正在加速推进!
来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述,旨在在大模型时代背景下,重新审视并系统化理解智能体的记忆构建与演化路径。
研究者针对 few-shot 图像编辑提出一个新的自回归模型结构 ——InstaManip,并创新性地提出分组自注意力机制(group self-attention),在此任务上取得了优异的效果。