大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一
大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一大模型推理,无疑是当下最受热议的科技话题之一。
大模型推理,无疑是当下最受热议的科技话题之一。
日记应用 Rosebud 已获得 600 万美元种子轮融资,该应用致力于通过 AI 技术完善其作为自我反思与个人成长导师的功能。
Hi,我是银海。 你身边的AI产品经理,陪你解决每一个真实问题。
大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略?
金融与会计服务初创企业 Simetrik 获得由高盛领投的 3000 万美元新融资。此次融资是对该公司2024 年 2 月披露的 B 轮融资的追加。当时该公司已从由高盛资产管理的,成长型股票团队领投的投资者处筹集了 5500 万美元。
清华与蚂蚁联合开源AReaL-boba²,实现全异步强化学习训练系统,有效解耦模型生成与训练流程,GPU利用率大幅提升。14B模型在多个代码基准测试中达到SOTA,性能接近235B模型。异步RL训练上大分!
OpenAI 的一次大收购,正在刺激整个 AI Coding 工具市场的神经。
World Labs 是由著名 AI 专家、斯坦福大学教授李飞飞于 2024 年创办的初创公司,致力于开发具备“空间智能”的下一代 AI 系统。
大家好,这两个月我完成了一款产品——Videa。虽然过去一年,我做了很多东西,但是部分是套壳,部分是把别人的想法做出来,真正我一直想做的,其实是一款借助AI创作短视频的产品。现在,我把它做出来了。
随着大型语言模型(LLM)技术的不断发展,Chain-of-Thought(CoT) 等推理增强方法被提出,以期提升模型在数学题解、逻辑问答等复杂任务中的表现,并通过引导模型逐步思考,有效提高了模型准确率。
这个系列主要是自己想多看一些海外做的比较成功的AI产品,尝试拆解一下他们的冷启动,SEO,增长策略,当然还有产品层面,看看能不能从他们身上学到一些东西,尤其是对于独立开发者以及中小团队来说有没有借鉴的地方。
1、深度研究实际场景 2、深度研究是什么,它用了什么能力? 3、在深度研究上,AI 为啥比人强这么多? 4、哪些问题,值得用深度研究方式来做? 5、怎样用好深度研究,保持结果的稳定性? 6、各类深度研究产品的特点以及使用技巧?
Cursor 1.0正式发布,此次更新推出了多项重磅功能,无论你是开发者还是数据科学家,Cursor 1.0都将让你的工作更高效、更智能
人工智能搜索引擎初创公司 You.com 正积极进军企业级软件领域。据知情人士透露,该公司正与媒体巨头 Cox 企业集团洽谈融资事宜,此轮融资使成立五年的 You.com 估值达到 14 亿美元
夸克,最近有点火。
大模型公司挖墙脚哪家强,Anthropic才是最大赢家?不仅顶尖AI人才的留存率达到80%,而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。
本研究由广州趣丸科技团队完成,团队长期致力于 AI 驱动的虚拟人生成与交互技术,相关成果已应用于游戏、影视及社交场景
OpenAI 发论文的频率是越来越低了,如果你看到了一份来自 OpenAI 的新 PDF 文件,那多半也是新模型的系统卡或相关增补文件或基准测试,很少有新的研究论文。
新一期的“蒂尔奖学金”名单公布,彼得·蒂尔,可能是硅谷最具传奇色彩的投资人之一。 他曾是支持特朗普的硅谷少数派,也曾作为早期合伙人与马斯克在PayPal一起打天下。他对科技趋势有着惊人的敏锐感
今天凌晨1点,OpenAI开始技术直播对ChatGPT进行了重大更新,包括向macOS用户推出ChatGPT会议记录模式,可以转录任何会议、头脑风暴或语音笔记,并快速提取要点然后转化为新的内容。
Manus疯狂更新,视频生成也来了!
最近618开始了,又到了一年一度换设备的日子。
数据公司收购热潮在周一持续升温,云数据平台Snowflake 宣布收购Postgres 数据库合作伙伴Crunchy Data。知情人士透露此次交易估值约为 2.5 亿美元。
年初的时候我做了一个AI编程工具的导航网站,打算流量上来后就可以接谷歌广告赚美金:
刚刚,OpenAI 正式对外推出了 AI 编码神器 Codex,其目前向 ChatGPT Plus 用户开放。据悉,Codex 在限定时段内提供宽松的使用额度,但在需求高峰期间,可能会对 Plus 用户设置速率限制,以确保其能广泛可用。
数学家出手反击AI!对AlphaEvolve在“集合和差问题”上的成果进一步改进。
Agent 能力边界正在快速演进,未来随着更强的规划和推理能力的不断提升,Agent 们将参与到社会经济运作中。在这一趋势下,将可能诞生类似 Visa 或 Stripe 级别的商业基础设施的机会。
智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。
你有没有想过,为什么ChatGPT能够如此流畅地回答你的问题
无监督的熵最小化(EM)方法仅需一条未标注数据和约10步优化,就能显著提升大模型在推理任务上的表现,甚至超越依赖大量数据和复杂奖励机制的强化学习(RL)。EM通过优化模型的预测分布,增强其对正确答案的置信度,为大模型后训练提供了一种更高效简洁的新思路。