
GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024
GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程?
大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程?
苹果前脚刚用Apple Intelligence“重新定义”了AI,后脚就被马斯克杠上了。
OpenAI在5月14日推出了新一代人工智能模型GPT-4o,支持文本、音频和图像的任意组合输入,并能够生成文本、音频和图像的任意组合输出。仅仅一天后,谷歌就在新一届I/O开发者大会上发布、更新了十多款产品,包括AI助手Project Astra、文生图模型Imagen3、对标Sora的文生视频模型Veo,以及备受瞩目的大模型Gemini 1.5 Pro的升级版。
一鼓作气,再而衰三而竭。曾经的科技圈春晚辉煌不再——一年一度的苹果WWDC如期而至,市场反应惨淡。
还有史诗级更新:iPhone 加通话录音,iPad 加计算器。
近些年,语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成为越来越常用的工具。
AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。
在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。
最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。
最近,WSJ的一篇文章深度披露了Sam Altman十几年来建立的庞大投资帝国,让我们终于理解了他为什么可以不要OpenAI的股权。但文章同时指出,奥特曼的个人投资和OpenAI的业务存在各种复杂的利益关系。