沃顿商学院已发布4篇「Prompt」报告|重磅
沃顿商学院已发布4篇「Prompt」报告|重磅宾夕法尼亚大学沃顿商学院(The Wharton School)今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型(如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等),在极高难度的博士级基准测试(GPQA Diamond)上进行了数万次的严谨测试。
宾夕法尼亚大学沃顿商学院(The Wharton School)今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型(如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等),在极高难度的博士级基准测试(GPQA Diamond)上进行了数万次的严谨测试。
据 ZP 获悉,AI for Science 领域的技术先锋企业「深度原理 Deep Principle」完成超亿元人民币A轮融资。本轮由戈壁创投管理的阿里巴巴创业者基金大湾区基金(简称AEF大湾区基金)与蚂蚁集团共同领投,现有股东联想创投、Taihill Venture 超额加注,BV百度风投继续加注,多家机构参与。
“我们希望推动一个开源的体系,从科学研究到工业研发,再到人类命运共同体。”
《Science》的一篇新文章指出,大模型存在一个先天难解的软肋:幻觉难以根除。AI厂商让大模型在不确定性情况下说「我不知道」,虽然有助于减少模型幻觉,但可能因此影响用户留存与活跃度,动摇商业根本。
当地时间 10 月 31 日,由于涌入预印本平台 arXiv 的计算机科学(CS,Compute Science)的由 AI 生成或 AI 辅助生成的综述论文和立场论文数量变得难以管理,arXiv 更新了关于综述论文和立场论文的审核规则,要求这两类论文必须被期刊或会议接收并完成同行评审之后才能提交到 arXiv 的 CS 类别。
互联网让知识触手可及,却也让真知难以抵达。
今年三月,Liam Fedus 在推特上宣布离开 OpenAI。这条推文的影响力超出了所有人的预期——硅谷的风投们几乎是立刻行动起来,争相联系这位 ChatGPT 最初小团队的核心成员、曾领导 OpenAI 关键的后训练部门的研究者,他的离职甚至一度引发了一场“反向竞标”。
真正的科研利器诞生了!Claude生命科学版出世,搭载最强Claude Sonnet 4.5,实验基准碾压人类。不论是统计代码编写,还是文献总结,AI数小时搞定数月课题。
OpenAI新研究团队,刚刚曝光了——OpenAI for Science,致力于构建加速数学和物理领域新发现的人工智能系统。
近日,微软和多家公司、高校、研究机构组成的联合团队在生物科学领域发现了一个重大的“零日漏洞”。他们利用开源的人工智能蛋白质设计工具,基于 72 种已知危险蛋白,模拟生成了 7 万多种原始有害蛋白质的变体,并将它们放入 4 种现有的生物安全筛查系统中。