ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
新晋“黑马”Reka Core:拳打 GPT,脚踢 Claude,多模态实力到底有多强?|AI 鲜测
9445点击    2024-04-26 13:15

最近,一家名为 Reka 的初创公司发布了一款多模态语言模型——Reka Core,这是他们自2022 年成立以来第三款模型。



Reka 的核心团队基本全部来自 Google和 Deepmind。全公司一共也就 20 来个人,能在几个月的时间内用不足万块 GPU 炼出一个能跟 GPT-4 和 Claude 3 Opus 比肩的模型。听起来有点吓人,但在 2024 年,这种情况似乎意料之外却有情理之中。

废话不多说,我们直接来看 Reka 是不是真的有跑分一样强。



看图说话:Reka Core 眼中的世界是什么样?


Reka Core 在图像识别方面同样表现出色,无论是新闻解读、机票价格查询还是医学影像分析,它都能给出清晰、准确的答案。比如:




基本意思解读到位,但对于中文的理解仅限于字面意思,对于生活中的“梗”似乎看不懂。因为是中文梗图,所以直接用“需要翻译具体内容”,然后打个马虎眼儿就过去了。


再比如上传一张今天的新闻解读



Reka Core 不仅把图中的新闻信息一一罗列了出来,还读出了图片底部的用户提示,还不赖!


再来看看实际生活中的日常问题


快到五一了,让 Reka Core 帮忙看看“五一假期”北京直飞上海的机票价格如何



非常简洁直观地地给出了答案,一点儿也不啰嗦!


再来一张 Reka Core 自己的故障图



很清晰地指出了专业术语,还根据我的中文提问直接识别输出英文,对于国人真的太友好了!


再看看更专业的医学影像分析,我上传里一张眼底扫描报告:从专业角度分析这张图



它回答:



从回答来看,Reka Core 不仅准确识别和分析出眼部情况,而且还说出这张报告可以辅助医生对患者的情况进行评估诊断,有一说一挺专业的!


最后是地点识别:




非常清晰明了,不仅识别出来是广州,还分析出了拍摄视角!真是个读图小能手!


多语言能力测试:《小王子》翻译战!


我们用《小王子》的经典名句和《流浪地球》的感人台词,对其进行了一次全面的测试,不得不说,Reka Core 在翻译上不仅达到了“信、达、雅”的翻译水准,而且还能兼顾各地风俗习惯进行随时调整。


先来把经典名著《小王子》的金句原文丢给 Reka Core,挑战语种:德语、法语、西班牙语、中文阿拉伯语


原文(英文):It is only with the heart that one can see rightly; what is essential is invisible to the eyes.



现在我们来用 ChatGPT 这位老伙伴进行一次快速而幽默的点评快闪:


  1. 德语译文:Man kann nur mit dem Herzen richtig sehen; das Wesentiale ist für die Augen unsichtbar.


点评:德语版本忠实地传达了原文的意境,尤其是通过强调“Herzen”(心)和“unsichtbar”(不可见)的使用,使得整个句子的情感色彩和哲理性得以保持。但这翻译严肃得就像德国人讲笑话,你得等到最后才能懂!


  1. 法语译文:On ne voit bien qu'avec le cœur, l'essentiel est invisible pour les yeux.


点评:法语译文的表达更加诗性,用“On ne voit bien qu'avec le cœur”这样的表达方式加强了感性的诉求,非常符合法语的文艺特性,对原意的把握相当精准。


  1. 西班牙语译文:Solo se puede ver bien con el corazón; lo esencial es invisible a los ojos.


点评:西班牙语版本与原文保持高度一致,语言简洁而富有力度,"Solo se puede" 和 "invisible a los ojos" 的用词选择,很好地展现了原文的哲学深度


  1. 中文译文:只有用心才能看得清楚;最重要的事物是眼睛看不见的。


点评:中文译文在语义上成功传达了原文的核心,但“看得清楚”稍显直白,可能略损文学美感。不过整体上,这种译法对于中文读者的理解和感受是友好的。


  1. 阿拉伯语译文:“لا يمكن رؤية الأشياء بشكل صحيح إلا بالقلب؛ فالأساسيات غير مرئية للعين.”


点评:阿拉伯语版本在翻译上表现得非常精确,特别是“الأساسيات غير مرئية للعين”(基本是不可见的),既保留了原句的哲学思考,也很好地适应了阿拉伯语的表达习惯。


AI 大脑速测:知识问答十连问!


到知识问答环节,Reka Core 的表现同样出色,无论是历史、科技还是日常生活的常识,它都能迅速给出准确的答案。不仅展现了其广泛的知识储备,也体现了其快速反应的能力。


咱先来个五连问,测测 Reka Core 对广泛领域知识的快速反应和准确性如何。



整体速度还是不错的!基本给出问题马上就出答案了。


咱挨个看看具体回答效果如何:


首先是第一问,Reka Core 的回答一针见血,直接纠正了一个常见的误区,盖茨和乔布斯其实是各自带队打擂台的对手,而不是联手开店的伙伴,看来忽悠不倒它!第一问:



在第二问问到电影信息时,Reka Core 的回答简单直接,一击命中那句经典的“我是钢铁侠”。同时还把背景信息也搞定了,真是机智如托尼,让你秒懂这句话为啥这么有范儿!



第三问:当问到历史 Rake Core 也不在话下,它的回答非常直接、有效,一网打尽了第一次世界大战中的主要领导者们。



第四问:Reka Core 对于金融领域的提问更是信手拈来,它的解释既详尽又易懂,让你即使不是加密货币高手,也能明白比特币怎么保证你的钱包安全无虞。



第五问:物理题,Reka Core 把爱因斯坦的质能等价公式拆解得清清楚楚,一点儿不含糊。



再来一道英文题目:


提问:How does social media influence people's mental health?



这英文水平真不错啊!


测到这儿了,这里怎么能少得了咱们中文的“弱智吧”呢?


  • 提问:高考满分才750,怎么才能考985?



Reka 的回答中规中矩,但想要从弱智吧“出院”还差不少呢。


  • 提问:用数据线传输电脑和手机文件,同时两头拔掉,文件可以保存在数据线中吗?



对于弱智吧的提问,Reka Core 并没有接梗,而是有理有据告诉我们数据线不是U盘,拔掉线文件就断片了,这不是“存储传奇”,你的文件并不会神奇地在数据线里搭帐篷过夜。


  • 提问:恐怖分子的组成是什么?


回答到这里竟然卡住了,难道是服务器也撑不住了?



在我连续问了11个问题后,它的上下文长度到了最大限度,只好重新另开一个窗口提问啦。



最终新窗口 Reka Core 把恐怖分子进行了层层分析,揭示出不只是线路和定时器,还有看不见的信念和心理复杂性等等。


  • 提问:把加特林从冰箱拿出来算冷兵器吗?



Reka Core 的回答就像给加特林机枪穿上羽绒服,放冰箱里也冻不成冷兵器,冰箱里只能冻冰棍,别闹了!


综合实战:Reka Core 变身智能学习助手


这部分我们用 Reka Core 开发一个“智能学习助手”应用,检验其在解决综合性技术问题中的推理、计算和编程能力。主要分为以下四个部分:


  • 背景:开发一个“智能学习助手”应用


  • 数学推理:针对不同学习阶段,推荐有挑战性的数学问题



  • 逻辑运算:设计“逻辑训练”小游戏



  • 编程任务:设计 TodoList 模块



这段代码结构清晰,功能齐全,对于一个简单的 Python 应用来说是一个不错的开始,但在实际生产环境中还有改进的空间。


在这个测试任务中,由于不断多轮对话,Reka Core 再次出现了上下文窗口限制。(网友喊话:这块儿急需加强啊!)


在综合实力上,Reka Core 数学、逻辑、编程等多维度能力样样精通,除了回答条理清晰,能给出很具体和详细的方案之外,但同时在细节内容上有待优化。说实话,Reka Core 这样的能力是远远超乎我意料之外!


读视频:AI 替我刷抖音


除了以上的能力以外,Reka Core 也支持上传视频,并跟他进行对话。



视频一:互联网大坑


我问它:视频中提到的互联网大坑是什么?



它开始一本正经的胡说八道!眼睛都不带眨的!


行业深钻:探探 Reka Core 专业有多深?


看到 Reka 的报告里提到说有进行专业领域的训练,检验 Reka Core 在处理数字内容和金融服务问题的深度和准确性。


先看看跨领域的“数字内容”,问它关于版权法的内容:解释版权法如何影响数字音乐的分发。



Reka Core 在解释版权法影响数字音乐分发的答案中深度和准确性都不错,涵盖了创作者权益保护、分发平台责任、授权许可和技术保护措施等关键点。但是你如果想听一些关于版权法在实际操作中如何执行的故事,或者版权法细节对音乐产业具体商业模式的影响,这个回答可能就显得有点高屋建瓴了。


最后到金融圈儿让Reka 来做一次“股票分析师” ,来一道股票分析题:



再三提示下,根据网络相关资料给到啦一些相应的结论,具体如下:



最后


整个使用下来,Reka Core 图片识别能力确实很强,对中文也相对友好,跟 GPT-4 和 Claude 3 Oups 确实差不多。


在视频解析方面,他能描述视频的画面,但无法完全读懂视频内容,开始胡言乱语。你能看懂两个视频讲了什么?


Reka Core 再次证明一个只有十几二十个人的团队,可能创造出超过超级大公司的价值。


像国外的 Reka,国内的月之暗面、阶跃星辰这样的公司越来越多的浮出水面,2024 这个 AI 元年的味儿越来越重了。


本文来自微信公众号“硅星人"GenAI",作者 椒盐玉兔