AI资讯新闻榜单内容搜索-模型评测

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 模型评测
大模型是色盲吗?

大模型是色盲吗?

大模型是色盲吗?

先说结论: 多数模型,是色盲

来自主题: AI资讯
4601 点击    2025-01-17 11:33
全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

2024年快要结束了,世界大模型究竟孰强孰弱?刚刚,智源研究院发布了下半年大模型综合评测结果,涵盖了开源闭源100+模型,横跨文本、语音、图像和视频等多个领域。

来自主题: AI资讯
6229 点击    2024-12-20 15:12
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

如果给LLM做MBTI,会得到什么结果?UC伯克利的最新研究就发现,不同模型真的有自己独特的性格

来自主题: AI技术研报
5920 点击    2024-11-26 13:59
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。

来自主题: AI技术研报
9970 点击    2024-08-21 14:28
大模型常用评测基准汇总

大模型常用评测基准汇总

大模型常用评测基准汇总

基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯
9614 点击    2024-07-23 19:24
全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了

全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了

全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了

最近,公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问,让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风,简直让人一秒穿越回童年。

来自主题: AI资讯
6260 点击    2024-07-04 16:10
国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

2024年5月17日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。

来自主题: AI资讯
9533 点击    2024-05-17 17:25
大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

关于Llama 3,又有测试结果新鲜出炉—— 大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。

来自主题: AI资讯
8175 点击    2024-04-23 14:20