AI资讯新闻榜单内容搜索-模型评测

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 模型评测
司南首期多模态模型闭源榜单发布!48个模型同台竞技,谁将脱颖而出?

司南首期多模态模型闭源榜单发布!48个模型同台竞技,谁将脱颖而出?

司南首期多模态模型闭源榜单发布!48个模型同台竞技,谁将脱颖而出?

基于闭源评测基准,近期司南针对国内外主流多模态大模型进行了全面评测,现公布司南首期多模态模型闭源评测榜单。首期榜单共包含 48 个多模态模型,其中包含:3 个国内 API 模型:GLM-4v-Plus-20250111 (智谱),Step-1o (阶跃),BailingMM-Pro-0120 (蚂蚁)

来自主题: AI技术研报
7804 点击    2025-03-06 19:45
大模型是色盲吗?

大模型是色盲吗?

大模型是色盲吗?

先说结论: 多数模型,是色盲

来自主题: AI资讯
4836 点击    2025-01-17 11:33
全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

2024年快要结束了,世界大模型究竟孰强孰弱?刚刚,智源研究院发布了下半年大模型综合评测结果,涵盖了开源闭源100+模型,横跨文本、语音、图像和视频等多个领域。

来自主题: AI资讯
6413 点击    2024-12-20 15:12
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

如果给LLM做MBTI,会得到什么结果?UC伯克利的最新研究就发现,不同模型真的有自己独特的性格

来自主题: AI技术研报
6077 点击    2024-11-26 13:59
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。

来自主题: AI技术研报
10147 点击    2024-08-21 14:28
大模型常用评测基准汇总

大模型常用评测基准汇总

大模型常用评测基准汇总

基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯
10154 点击    2024-07-23 19:24
全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了

全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了

全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了

最近,公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问,让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风,简直让人一秒穿越回童年。

来自主题: AI资讯
6419 点击    2024-07-04 16:10