
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度。
多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度。
OpenAI宣布将原本仅限付费用户使用的“Canvas功能”对所有用户开放,包括免费用户。
Sora 终于来了! 只要是 ChatGPT Plus/Pro 用户,直接就能用上。 至于效果 ...... 看完官方放出的 demo,网友大呼:不太行 !
随着 ChatGPT 掀起的 AI 浪潮进入第三年,人工智能体(AI Agent)作为大语言模型(LLM)落地应用的关键载体,正受到学术界和产业界的持续关注。
2022 年 11 月,OpenAI 发布 ChatGPT 3.5,带领人类走向 AGI (Artificial General Intelligence 通用人工智能)人机交互新世纪。AGI 让自然人机交互成为现实,“语言”这一简单、自然的交互方式也影响到了 GUI(图形用户界面)。
今天是 OpenAI 十二天连更的第四天,OpenAI 准备革新的是生产力。是的,就是 OpenAI 在 10 月份宣布的「ChatGPT 写作和编程新方式」,Canvas。现在,用户可以与 ChatGPT 一起完成写作和编码项目,不再局限于简单的聊天了。
Allen Institute for AI(AI2)发布了Tülu 3系列模型,一套开源的最先进的语言模型,性能与GPT-4o-mini等闭源模型相媲美。Tülu 3包括数据、代码、训练配方和评估框架,旨在推动开源模型后训练技术的发展。
家人们!OpenAI o1 满血版(o1 Pro)大家用上了吗!
OpenAI发布会直播第3天,继第1天完全版o1和200美元月费ChatGPT Pro会员,以及第2天的强化微调工具后,OpenAI终于填上9个月前的期货大坑,正式发布了观众敲碗已久的全新视频生成模型——Sora Turbo。
自从去年ChatGPT4出现以来,以大语言模型为主的AI和星舰一样,在中文网络上愈发被一些群体当成美国对中国的某种决战兵器而极尽吹捧。比如最近风头正盛的某“经济学家”一直在各种场合鼓吹AI将带领美国实现产业升级。