AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
5998 点击    2024-04-10 19:11
即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

上个月,彭博社消息称苹果正在与 Google 进行谈判,希望将 Gemini 集成的 iPhone 当中,为 iPhone 的软件提供 AI 相关的新功能。把新系统的核心功能“外包”给第三方,这种做法非常不苹果。

来自主题: AI资讯
7072 点击    2024-04-09 16:47
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。

来自主题: AI技术研报
6617 点击    2024-04-09 15:57
AI大模型搜索之战开启,胜出黑马竟是ta?

AI大模型搜索之战开启,胜出黑马竟是ta?

AI大模型搜索之战开启,胜出黑马竟是ta?

距离AI「杀死」搜索引擎,到底还差几步?

来自主题: AI技术研报
6790 点击    2024-04-09 14:52
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度提高了500%!

来自主题: AI技术研报
6147 点击    2024-04-07 17:49
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

Gecko 是一种通用的文本嵌入模型,可用于训练包括文档检索、语义相似度和分类等各种任务。文本嵌入模型在自然语言处理中扮演着重要角色,为各种文本相关任务提供了强大的语义表示和计算能力。

来自主题: AI技术研报
7491 点击    2024-04-07 17:45
李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

「这是自 Karpathy 和我 2015 年启动这门课程以来的第 9 个年头,这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。

来自主题: AI资讯
6520 点击    2024-04-05 15:04