
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和9.1%。
Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和9.1%。
当地时间5月22日,据外媒报道,总部位于美国加州旧金山的可穿戴设备初创公司Humane正考虑接受收购。彭博社援引消息人士称,该公司的定价在7.5亿至10亿美元之间,出售过程正处于早期阶段。
大模型公司洗牌期开始了。 突然之间,几家明星初创纷纷传出消息,寻求收购。都是大家熟悉的名字、过往战绩也都不错:Adept,估值超10亿美元,由Transformer作者创立;Humane,估值7.5-10亿美元,打造出爆火AI新硬件AI Pin;Stability AI,Stable Diffusion打造者,最早一批AI独角兽。
当地时间 5 月 22 日,据外媒报道,总部位于美国加州旧金山的可穿戴设备初创公司 Humane 正考虑接受收购。彭博社援引消息人士称,该公司的定价在 7.5 亿至 10 亿美元之间,出售过程正处于早期阶段。
「Rabbit R1,它本质上是安卓系统上面做了个 Launcher 程序,破解后在手机上就能运行。」
智东西4月19日消息,Meta推出迄今为止能力最强的开源大模型Llama 3系列,发布8B和70B两个版本。 Llama 3在一众榜单中取得开源SOTA(当前最优效果)。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。
从媒体评测的轰炸式差评来看,Ai Pin 在某种意义上算是「失败」了。
Humane AI Pin 的背后理念很简单:这是一台没有屏幕的手机。它不会要求用户去打开各种应用或者在键盘上进行操作,而是通过一个 AI 助手和一个称作 CosmOS 的操作系统,将所有复杂功能简化。
去年 11 月,一家名不见经传的公司 Humane 发布了一款全新概念的产品——AI Pin,并在此后数次成为科技圈讨论的热点。包括魅族在年初宣布停止传统「智能手机」项目 All in AI 的时候,还专门提到了这款新一代 AI 独立终端的开山之作。
就在刚刚,马斯克Grok大模型宣布重大升级。