AI资讯新闻榜单内容搜索-N2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: N2
全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符

全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符

全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符

大模型领域,开源与闭源之争一直是技术和产业界关注的焦点。阿里云通义千问最新发布的Qwen2系列模型,为这场争论提供了最新的答案。

来自主题: AI资讯
7984 点击    2024-06-07 14:50
阿里Qwen2正式开源,性能全方位包围Llama-3

阿里Qwen2正式开源,性能全方位包围Llama-3

阿里Qwen2正式开源,性能全方位包围Llama-3

Qwen 系列会是众多大学实验室新的默认基础模型吗? 斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。

来自主题: AI资讯
9285 点击    2024-06-07 14:31
Unsloth x Qwen2,提速47.32%,节省39.13%显存,最少仅需8.43GB显存

Unsloth x Qwen2,提速47.32%,节省39.13%显存,最少仅需8.43GB显存

Unsloth x Qwen2,提速47.32%,节省39.13%显存,最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B,提速44.35%,节省42.58%显存,最少仅需7.75GB显存」中,我们介绍了Unsloth,这是一个大模型训练加速和显存高效的训练框架,我们已将其整合到Firefly训练框架中,并且对Llama3-8B的训练进行了测试,Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报
3187 点击    2024-05-08 12:21
CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

来自香港科技大学,清华大学的研究者提出了「GenN2N」,一个统一的生成式 NeRF-to-NeRF 转换框架,适用于各种 NeRF 转换任务,例如文字驱动的 NeRF 编辑、着色、超分辨率、修复等,性能均表现极其出色!

来自主题: AI技术研报
7397 点击    2024-04-19 17:17
6款通用大模型在保险行业的能力PK测评报告 |ZionAI实验室大模型测评

6款通用大模型在保险行业的能力PK测评报告 |ZionAI实验室大模型测评

6款通用大模型在保险行业的能力PK测评报告 |ZionAI实验室大模型测评

参照SuperCLUE(中文通用大模型综合性测评基准)框架专门定制了1000道题目集,一一测试了ChatGPT4、 智谱chatGLM-4、Baichuan2-Turbo、百度ERNIE-Bot 4.0、Yi-34B-chat、llama 2等模型在保险业务上的表现。

来自主题: AI资讯
7363 点击    2024-03-07 10:34
Hugging Face剧透:阿里通义千问下一代Qwen2来了?

Hugging Face剧透:阿里通义千问下一代Qwen2来了?

Hugging Face剧透:阿里通义千问下一代Qwen2来了?

作为全球最顶级的机器学习工具库,Hugging Face上最近悄悄出现了一个新的transformers模型——Qwen2。没错,正是阿里通义千问Qwen模型的第二代。不过通义团队的算法同学在社交媒体上对此继续保持神秘。

来自主题: AI资讯
5164 点击    2024-01-25 11:12
大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」

大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」

大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」

从 ChatGPT 最初发布算起,虽然大模型的热潮已经持续了一年多,但大部分时间依然停留在学术前沿和技术创新层面,深入具体场景实现产业价值的案例并不多见。

来自主题: AI资讯
10491 点击    2023-12-20 18:16
百川智能推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude2

百川智能推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude2

百川智能推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude2

百川智能发布Baichuan2-192K大模型,上下文窗口长度高达192K,是目前全球最长的上下文窗口。Baichuan2-192K能够一次处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的4.4倍,更是GPT-4(支持32K上下文窗口,实测约 2.5万字)的14倍。

来自主题: AI资讯
10090 点击    2023-10-30 17:21
王小川旗下大模型获得阿里,腾讯亿元融资

王小川旗下大模型获得阿里,腾讯亿元融资

王小川旗下大模型获得阿里,腾讯亿元融资

10月17日,王小川旗下百川智能官宣已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米、深创投等科技巨头及多家顶级投资机构参投。

来自主题: AI资讯
8418 点击    2023-10-17 15:59