
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源当人工智能已经能下围棋、写代码,如何让机器理解并证明数学定理,仍是横亘在科研界的重大难题。
当人工智能已经能下围棋、写代码,如何让机器理解并证明数学定理,仍是横亘在科研界的重大难题。
由Acrew Capital领投,Alix用AI实现遗产结算自动化,可处理文件、填表、沟通等繁琐环节。不过其发展仍面临挑战,隐私安全顾虑及法规适配难题有待突破。 Acrew Capital合伙人劳伦・科洛德尼(Lauren Kolodny)一直坚信,技术拥有让普通人平等获取金融服务的力量。
多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。
TechCrunch消息,AI代码审查初创公司Greptile正洽谈3000万美元A轮融资,估值1.8亿美元。
AlphaFold夺诺奖引争议!2016年,一位博士生在NeurIPS提出的研究,或许正是AlphaFold的「原型」。如今,导师Daniel Cremers发声,质问为何DeepMind忽略这项研究、不加以引用?
最近,一条魔性视频在X(推特)上火了。效果be like:创意很抽象,但不得不说视频效果很惊艳。丝滑的动作、流利的口条以及整体的合成效果……有3D大片那种感觉了。如此效果,基于一个AI创意引擎实现——Creati。
本文主要介绍 xML 团队的论文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。
今天,我们正式发布MiniMax Agent全栈开发功能。这可能是全球首个 在复杂全栈网站应用上高交付率 的Agent。它支持Supabase后端托管、Stripe支付功能、cron job定时任务、长链接维持等能力,可开发需要API、实时数据、下单支付、LLM调用、定时任务、登录注册等功能的各类应用。
每当我们讨论AI对就业的影响时,大多数都是专家拍脑袋的预测。但微软研究院的这篇论文不一样,他们分析了20万个真实的Microsoft bing Copilot用户对话,每一个数据点背后都是一个真实的人,一个真实的工作场景,首次用硬数据告诉我们:AI到底在改变什么工作?哪些工作活动和职业正在被生成式AI(Generative AI)最大程度地影响?
在大模型狂飙的时代,AI 创业被裹挟进一种“技术正统性”的焦虑:要不要训练模型?有没有算力资源?底层自研是不是护城河?但 Yiran,一位本科学钢琴、靠一段自动发邮件脚本开启创业旅程的 00 后女性创业者,选择了另一种路径——她不训练模型,不押技术论文,而是把 AI 做成一个真正能“成事”的销售助理。