最近,一家名为 Reka 的初创公司发布了一款多模态语言模型——Reka Core,这是他们自2022 年成立以来第三款模型。
Reka 的核心团队基本全部来自 Google和 Deepmind。全公司一共也就 20 来个人,能在几个月的时间内用不足万块 GPU 炼出一个能跟 GPT-4 和 Claude 3 Opus 比肩的模型。听起来有点吓人,但在 2024 年,这种情况似乎意料之外却有情理之中。
废话不多说,我们直接来看 Reka 是不是真的有跑分一样强。
Reka Core 在图像识别方面同样表现出色,无论是新闻解读、机票价格查询还是医学影像分析,它都能给出清晰、准确的答案。比如:
基本意思解读到位,但对于中文的理解仅限于字面意思,对于生活中的“梗”似乎看不懂。因为是中文梗图,所以直接用“需要翻译具体内容”,然后打个马虎眼儿就过去了。
再比如上传一张今天的新闻解读:
Reka Core 不仅把图中的新闻信息一一罗列了出来,还读出了图片底部的用户提示,还不赖!
再来看看实际生活中的日常问题,
快到五一了,让 Reka Core 帮忙看看“五一假期”北京直飞上海的机票价格如何:
非常简洁直观地地给出了答案,一点儿也不啰嗦!
再来一张 Reka Core 自己的故障图:
很清晰地指出了专业术语,还根据我的中文提问直接识别输出英文,对于国人真的太友好了!
再看看更专业的医学影像分析,我上传里一张眼底扫描报告:从专业角度分析这张图
它回答:
从回答来看,Reka Core 不仅准确识别和分析出眼部情况,而且还说出这张报告可以辅助医生对患者的情况进行评估诊断,有一说一挺专业的!
最后是地点识别:
非常清晰明了,不仅识别出来是广州,还分析出了拍摄视角!真是个读图小能手!
我们用《小王子》的经典名句和《流浪地球》的感人台词,对其进行了一次全面的测试,不得不说,Reka Core 在翻译上不仅达到了“信、达、雅”的翻译水准,而且还能兼顾各地风俗习惯进行随时调整。
先来把经典名著《小王子》的金句原文丢给 Reka Core,挑战语种:德语、法语、西班牙语、中文和阿拉伯语。
原文(英文):It is only with the heart that one can see rightly; what is essential is invisible to the eyes.
现在我们来用 ChatGPT 这位老伙伴进行一次快速而幽默的点评快闪:
点评:德语版本忠实地传达了原文的意境,尤其是通过强调“Herzen”(心)和“unsichtbar”(不可见)的使用,使得整个句子的情感色彩和哲理性得以保持。但这翻译严肃得就像德国人讲笑话,你得等到最后才能懂!
点评:法语译文的表达更加诗性,用“On ne voit bien qu'avec le cœur”这样的表达方式加强了感性的诉求,非常符合法语的文艺特性,对原意的把握相当精准。
点评:西班牙语版本与原文保持高度一致,语言简洁而富有力度,"Solo se puede" 和 "invisible a los ojos" 的用词选择,很好地展现了原文的哲学深度。
点评:中文译文在语义上成功传达了原文的核心,但“看得清楚”稍显直白,可能略损文学美感。不过整体上,这种译法对于中文读者的理解和感受是友好的。
点评:阿拉伯语版本在翻译上表现得非常精确,特别是“الأساسيات غير مرئية للعين”(基本是不可见的),既保留了原句的哲学思考,也很好地适应了阿拉伯语的表达习惯。
到知识问答环节,Reka Core 的表现同样出色,无论是历史、科技还是日常生活的常识,它都能迅速给出准确的答案。不仅展现了其广泛的知识储备,也体现了其快速反应的能力。
整体速度还是不错的!基本给出问题马上就出答案了。
咱挨个看看具体回答效果如何:
首先是第一问,Reka Core 的回答一针见血,直接纠正了一个常见的误区,盖茨和乔布斯其实是各自带队打擂台的对手,而不是联手开店的伙伴,看来忽悠不倒它!第一问:
在第二问问到电影信息时,Reka Core 的回答简单直接,一击命中那句经典的“我是钢铁侠”。同时还把背景信息也搞定了,真是机智如托尼,让你秒懂这句话为啥这么有范儿!
第三问:当问到历史 Rake Core 也不在话下,它的回答非常直接、有效,一网打尽了第一次世界大战中的主要领导者们。
第四问:Reka Core 对于金融领域的提问更是信手拈来,它的解释既详尽又易懂,让你即使不是加密货币高手,也能明白比特币怎么保证你的钱包安全无虞。
第五问:物理题,Reka Core 把爱因斯坦的质能等价公式拆解得清清楚楚,一点儿不含糊。
提问:How does social media influence people's mental health?
这英文水平真不错啊!
Reka 的回答中规中矩,但想要从弱智吧“出院”还差不少呢。
对于弱智吧的提问,Reka Core 并没有接梗,而是有理有据告诉我们数据线不是U盘,拔掉线文件就断片了,这不是“存储传奇”,你的文件并不会神奇地在数据线里搭帐篷过夜。
回答到这里竟然卡住了,难道是服务器也撑不住了?
在我连续问了11个问题后,它的上下文长度到了最大限度,只好重新另开一个窗口提问啦。
最终新窗口 Reka Core 把恐怖分子进行了层层分析,揭示出不只是线路和定时器,还有看不见的信念和心理复杂性等等。
Reka Core 的回答就像给加特林机枪穿上羽绒服,放冰箱里也冻不成冷兵器,冰箱里只能冻冰棍,别闹了!
这部分我们用 Reka Core 开发一个“智能学习助手”应用,检验其在解决综合性技术问题中的推理、计算和编程能力。主要分为以下四个部分:
这段代码结构清晰,功能齐全,对于一个简单的 Python 应用来说是一个不错的开始,但在实际生产环境中还有改进的空间。
在这个测试任务中,由于不断多轮对话,Reka Core 再次出现了上下文窗口限制。(网友喊话:这块儿急需加强啊!)
在综合实力上,Reka Core 数学、逻辑、编程等多维度能力样样精通,除了回答条理清晰,能给出很具体和详细的方案之外,但同时在细节内容上有待优化。说实话,Reka Core 这样的能力是远远超乎我意料之外!
除了以上的能力以外,Reka Core 也支持上传视频,并跟他进行对话。
视频一:互联网大坑
我问它:视频中提到的互联网大坑是什么?
它开始一本正经的胡说八道!眼睛都不带眨的!
看到 Reka 的报告里提到说有进行专业领域的训练,检验 Reka Core 在处理数字内容和金融服务问题的深度和准确性。
先看看跨领域的“数字内容”,问它关于版权法的内容:解释版权法如何影响数字音乐的分发。
Reka Core 在解释版权法影响数字音乐分发的答案中深度和准确性都不错,涵盖了创作者权益保护、分发平台责任、授权许可和技术保护措施等关键点。但是你如果想听一些关于版权法在实际操作中如何执行的故事,或者版权法细节对音乐产业具体商业模式的影响,这个回答可能就显得有点高屋建瓴了。
最后到金融圈儿让Reka 来做一次“股票分析师” ,来一道股票分析题:
再三提示下,根据网络相关资料给到啦一些相应的结论,具体如下:
整个使用下来,Reka Core 图片识别能力确实很强,对中文也相对友好,跟 GPT-4 和 Claude 3 Oups 确实差不多。
在视频解析方面,他能描述视频的画面,但无法完全读懂视频内容,开始胡言乱语。你能看懂两个视频讲了什么?
Reka Core 再次证明一个只有十几二十个人的团队,可能创造出超过超级大公司的价值。
像国外的 Reka,国内的月之暗面、阶跃星辰这样的公司越来越多的浮出水面,2024 这个 AI 元年的味儿越来越重了。
本文来自微信公众号“硅星人"GenAI",作者 椒盐玉兔