 
专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法
专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法如今,大型语言模型(LLM)已经成为了我们生活中的好帮手
 
如今,大型语言模型(LLM)已经成为了我们生活中的好帮手
 
GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。
 
作为 Meta 的前 CTO,Quora CEO Adam D'Angelo 目前还是 OpenAI 的董事会成员,在 Quora 之外推出的 Poe,成为当下接入大模型最多的 Chatbot 平台:GPT-4、Claude3、Mistral 等模型都有,用户也可以在上面搭建自己的 Chatbot 机器人,如果有别的用户使用,还可以产生收益。
 
【新智元导读】大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。
 
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗?
 
3 月 22 日,AI 音乐生成软件 Suno 发布 V3 版本,支持生成 2min 长度、广播质量级别的音乐,更多样化的风格,对 promp 理解更深,以及幻觉更少。
 
AGI竞赛,正在大科技公司之间紧锣密鼓地展开,作为万亿显卡帝国掌舵人的老黄自然也不会缺席。在最近举办的GTC 2024上,老黄发表了自己对于AGI以及幻觉问题的看法。
 
2022年底起,从AI生成文字、代码,到AI生成图片、声音,甚至是视频,AIGC(人工智能生成内容)蓬勃发展。我们一面憧憬着AI大幅提高效率,“因材施教”的个性化教育能得到普及,一面又担忧着AI产生的幻觉及物理性错误,会误导“活到老,学到老”的我们。
 
大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。
 
谷歌和威斯康星麦迪逊大学的研究人员推出了一个让LLM给自己输出打分的选择性预测系统,通过软提示微调和自评估学习,取得了比10倍规模大的模型还要好的成绩,为开发下一代可靠的LLM提供了一个非常好的方向。