# 热门搜索 #
搜索
新晋“黑马”Reka Core:拳打 GPT,脚踢 Claude,多模态实力到底有多强?|AI 鲜测
9311点击    2024-04-26 13:15

最近,一家名为 Reka 的初创公司发布了一款多模态语言模型——Reka Core,这是他们自2022 年成立以来第三款模型。



Reka 的核心团队基本全部来自 Google和 Deepmind。全公司一共也就 20 来个人,能在几个月的时间内用不足万块 GPU 炼出一个能跟 GPT-4 和 Claude 3 Opus 比肩的模型。听起来有点吓人,但在 2024 年,这种情况似乎意料之外却有情理之中。

废话不多说,我们直接来看 Reka 是不是真的有跑分一样强。



看图说话:Reka Core 眼中的世界是什么样?


Reka Core 在图像识别方面同样表现出色,无论是新闻解读、机票价格查询还是医学影像分析,它都能给出清晰、准确的答案。比如:




基本意思解读到位,但对于中文的理解仅限于字面意思,对于生活中的“梗”似乎看不懂。因为是中文梗图,所以直接用“需要翻译具体内容”,然后打个马虎眼儿就过去了。


再比如上传一张今天的新闻解读



Reka Core 不仅把图中的新闻信息一一罗列了出来,还读出了图片底部的用户提示,还不赖!


再来看看实际生活中的日常问题


快到五一了,让 Reka Core 帮忙看看“五一假期”北京直飞上海的机票价格如何



非常简洁直观地地给出了答案,一点儿也不啰嗦!


再来一张 Reka Core 自己的故障图



很清晰地指出了专业术语,还根据我的中文提问直接识别输出英文,对于国人真的太友好了!


再看看更专业的医学影像分析,我上传里一张眼底扫描报告:从专业角度分析这张图



它回答:



从回答来看,Reka Core 不仅准确识别和分析出眼部情况,而且还说出这张报告可以辅助医生对患者的情况进行评估诊断,有一说一挺专业的!


最后是地点识别:




非常清晰明了,不仅识别出来是广州,还分析出了拍摄视角!真是个读图小能手!


多语言能力测试:《小王子》翻译战!


我们用《小王子》的经典名句和《流浪地球》的感人台词,对其进行了一次全面的测试,不得不说,Reka Core 在翻译上不仅达到了“信、达、雅”的翻译水准,而且还能兼顾各地风俗习惯进行随时调整。


先来把经典名著《小王子》的金句原文丢给 Reka Core,挑战语种:德语、法语、西班牙语、中文阿拉伯语


原文(英文):It is only with the heart that one can see rightly; what is essential is invisible to the eyes.



现在我们来用 ChatGPT 这位老伙伴进行一次快速而幽默的点评快闪:


  1. 德语译文:Man kann nur mit dem Herzen richtig sehen; das Wesentiale ist für die Augen unsichtbar.


点评:德语版本忠实地传达了原文的意境,尤其是通过强调“Herzen”(心)和“unsichtbar”(不可见)的使用,使得整个句子的情感色彩和哲理性得以保持。但这翻译严肃得就像德国人讲笑话,你得等到最后才能懂!


  1. 法语译文:On ne voit bien qu'avec le cœur, l'essentiel est invisible pour les yeux.


点评:法语译文的表达更加诗性,用“On ne voit bien qu'avec le cœur”这样的表达方式加强了感性的诉求,非常符合法语的文艺特性,对原意的把握相当精准。


  1. 西班牙语译文:Solo se puede ver bien con el corazón; lo esencial es invisible a los ojos.


点评:西班牙语版本与原文保持高度一致,语言简洁而富有力度,"Solo se puede" 和 "invisible a los ojos" 的用词选择,很好地展现了原文的哲学深度


  1. 中文译文:只有用心才能看得清楚;最重要的事物是眼睛看不见的。


点评:中文译文在语义上成功传达了原文的核心,但“看得清楚”稍显直白,可能略损文学美感。不过整体上,这种译法对于中文读者的理解和感受是友好的。


  1. 阿拉伯语译文:“لا يمكن رؤية الأشياء بشكل صحيح إلا بالقلب؛ فالأساسيات غير مرئية للعين.”


点评:阿拉伯语版本在翻译上表现得非常精确,特别是“الأساسيات غير مرئية للعين”(基本是不可见的),既保留了原句的哲学思考,也很好地适应了阿拉伯语的表达习惯。


AI 大脑速测:知识问答十连问!


到知识问答环节,Reka Core 的表现同样出色,无论是历史、科技还是日常生活的常识,它都能迅速给出准确的答案。不仅展现了其广泛的知识储备,也体现了其快速反应的能力。


咱先来个五连问,测测 Reka Core 对广泛领域知识的快速反应和准确性如何。



整体速度还是不错的!基本给出问题马上就出答案了。


咱挨个看看具体回答效果如何:


首先是第一问,Reka Core 的回答一针见血,直接纠正了一个常见的误区,盖茨和乔布斯其实是各自带队打擂台的对手,而不是联手开店的伙伴,看来忽悠不倒它!第一问:



在第二问问到电影信息时,Reka Core 的回答简单直接,一击命中那句经典的“我是钢铁侠”。同时还把背景信息也搞定了,真是机智如托尼,让你秒懂这句话为啥这么有范儿!



第三问:当问到历史 Rake Core 也不在话下,它的回答非常直接、有效,一网打尽了第一次世界大战中的主要领导者们。



第四问:Reka Core 对于金融领域的提问更是信手拈来,它的解释既详尽又易懂,让你即使不是加密货币高手,也能明白比特币怎么保证你的钱包安全无虞。



第五问:物理题,Reka Core 把爱因斯坦的质能等价公式拆解得清清楚楚,一点儿不含糊。



再来一道英文题目:


提问:How does social media influence people's mental health?



这英文水平真不错啊!


测到这儿了,这里怎么能少得了咱们中文的“弱智吧”呢?


  • 提问:高考满分才750,怎么才能考985?



Reka 的回答中规中矩,但想要从弱智吧“出院”还差不少呢。


  • 提问:用数据线传输电脑和手机文件,同时两头拔掉,文件可以保存在数据线中吗?



对于弱智吧的提问,Reka Core 并没有接梗,而是有理有据告诉我们数据线不是U盘,拔掉线文件就断片了,这不是“存储传奇”,你的文件并不会神奇地在数据线里搭帐篷过夜。


  • 提问:恐怖分子的组成是什么?


回答到这里竟然卡住了,难道是服务器也撑不住了?



在我连续问了11个问题后,它的上下文长度到了最大限度,只好重新另开一个窗口提问啦。



最终新窗口 Reka Core 把恐怖分子进行了层层分析,揭示出不只是线路和定时器,还有看不见的信念和心理复杂性等等。


  • 提问:把加特林从冰箱拿出来算冷兵器吗?



Reka Core 的回答就像给加特林机枪穿上羽绒服,放冰箱里也冻不成冷兵器,冰箱里只能冻冰棍,别闹了!


综合实战:Reka Core 变身智能学习助手


这部分我们用 Reka Core 开发一个“智能学习助手”应用,检验其在解决综合性技术问题中的推理、计算和编程能力。主要分为以下四个部分:


  • 背景:开发一个“智能学习助手”应用


  • 数学推理:针对不同学习阶段,推荐有挑战性的数学问题



  • 逻辑运算:设计“逻辑训练”小游戏



  • 编程任务:设计 TodoList 模块



这段代码结构清晰,功能齐全,对于一个简单的 Python 应用来说是一个不错的开始,但在实际生产环境中还有改进的空间。


在这个测试任务中,由于不断多轮对话,Reka Core 再次出现了上下文窗口限制。(网友喊话:这块儿急需加强啊!)


在综合实力上,Reka Core 数学、逻辑、编程等多维度能力样样精通,除了回答条理清晰,能给出很具体和详细的方案之外,但同时在细节内容上有待优化。说实话,Reka Core 这样的能力是远远超乎我意料之外!


读视频:AI 替我刷抖音


除了以上的能力以外,Reka Core 也支持上传视频,并跟他进行对话。



视频一:互联网大坑


我问它:视频中提到的互联网大坑是什么?



它开始一本正经的胡说八道!眼睛都不带眨的!


行业深钻:探探 Reka Core 专业有多深?


看到 Reka 的报告里提到说有进行专业领域的训练,检验 Reka Core 在处理数字内容和金融服务问题的深度和准确性。


先看看跨领域的“数字内容”,问它关于版权法的内容:解释版权法如何影响数字音乐的分发。



Reka Core 在解释版权法影响数字音乐分发的答案中深度和准确性都不错,涵盖了创作者权益保护、分发平台责任、授权许可和技术保护措施等关键点。但是你如果想听一些关于版权法在实际操作中如何执行的故事,或者版权法细节对音乐产业具体商业模式的影响,这个回答可能就显得有点高屋建瓴了。


最后到金融圈儿让Reka 来做一次“股票分析师” ,来一道股票分析题:



再三提示下,根据网络相关资料给到啦一些相应的结论,具体如下:



最后


整个使用下来,Reka Core 图片识别能力确实很强,对中文也相对友好,跟 GPT-4 和 Claude 3 Oups 确实差不多。


在视频解析方面,他能描述视频的画面,但无法完全读懂视频内容,开始胡言乱语。你能看懂两个视频讲了什么?


Reka Core 再次证明一个只有十几二十个人的团队,可能创造出超过超级大公司的价值。


像国外的 Reka,国内的月之暗面、阶跃星辰这样的公司越来越多的浮出水面,2024 这个 AI 元年的味儿越来越重了。


本文来自微信公众号“硅星人"GenAI",作者 椒盐玉兔