中科大等意外发现:大模型不看图也能正确回答视觉问题!
中科大等意外发现:大模型不看图也能正确回答视觉问题!大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。
大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。
AI 生成工具的偏见何时休?
AI人才争夺战拉响!谷歌四大高管挖走了OpenAI前开发者关系负责人Logan Kilpatrick。他将AI Studio产品,并为Gemini API提供支持。网友纷纷看好谷歌。
2024会成AI应用多赛道混战爆发的年份吗
3月24日,一加发布了他们新的性价比旗舰,一加ACE 3V。看起来这似乎并不算一场很重磅的发布会,但它却是第一批拥抱AI的中端智能手机,有着挺重要的象征意义。
谷歌就此成为了第一家因为训练数据而被罚款的人工智能公司。
Kimi的难题是商业模式,大厂的难题是获客。
上下文长度真的能形成护城河吗?
2022年底,OpenAI(美国人工智能研究公司)发布的大模型ChatGPT(对话生成式预训练大模型)引发了广泛关注。在“大模型+大数据+大算力”的加持下,ChatGPT能够通过自然语言交互完成多种任务,具备了多场景、多用 途、跨学科的任务处理能力。
苹果公司被提起反垄断诉讼,市值蒸发1100亿美元。