
英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大
英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天,英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下,在 10 个对话 QA 数据集上的平均得分略胜于 GPT-4。
昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天,英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下,在 10 个对话 QA 数据集上的平均得分略胜于 GPT-4。
自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。
在科研领域,AI 似乎将成为一支不可忽视的力量,去年年末,AI 甚至开始和真人平起平坐,荣获 Nature 大奖。
靠着AI创建的网站,就能月入过万?而且……自从网站建好后就再也没碰过?
据彭博社消息,奥特曼再次为一家人工智能芯片企业筹集数十亿美元。目的是利用这笔资金开发一个“工厂网络”(network of factories),用于制造,该网络将延伸到全球,并涉及与未透露名字的“顶级芯片制造商”合作。
要说今年“科技春晚”CES上最吸引眼球的是什么,智能车当属其一。
创业8次、数场黑客松、技术迭代的兴奋与失落,就是这一年。
GPT Store敲响了大模型的App Store时刻
对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。
1月17日,新一代大语言模型书⽣·浦语2.0(InternLM2)正式发布并开源。2种参数规格、3种模型版本,共计6个模型,全部免费可商用。