AI资讯新闻榜单内容搜索-LLama

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLama
小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

我们都知道,大语言模型(LLM)能够以一种无需模型微调的方式从少量示例中学习,这种方式被称为「上下文学习」(In-context Learning)。这种上下文学习现象目前只能在大模型上观察到。比如 GPT-4、Llama 等大模型在非常多的领域中都表现出了杰出的性能,但还是有很多场景受限于资源或者实时性要求较高,无法使用大模型。

来自主题: AI技术研报
3774 点击    2023-11-27 12:49
这一代AI追随者的窘境

这一代AI追随者的窘境

这一代AI追随者的窘境

前不久,原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。 很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修改个tensor(张量)”。

来自主题: AI资讯
7314 点击    2023-11-26 20:58
李开复的零一大模型套壳Llama2算抄袭吗?

李开复的零一大模型套壳Llama2算抄袭吗?

李开复的零一大模型套壳Llama2算抄袭吗?

本文讨论了李开复投资的零一万物公司被指使用Facebook母公司META的Llama大模型的开源代码却未标明来源的问题。作者指出,此举涉嫌侵犯署名权,即抄袭。文章还探讨了零一万物公司和第三方开发者可能面临的法律风险。

来自主题: AI资讯
5090 点击    2023-11-25 22:20
LLaMA 2端到端推理打通!来自中国团队

LLaMA 2端到端推理打通!来自中国团队

LLaMA 2端到端推理打通!来自中国团队

Buddy Compiler 端到端 LLaMA2-7B 推理示例已经合并到 buddy-mlir仓库[1]主线。我们在 Buddy Compiler 的前端部分实现了面向 TorchDynamo 的第三方编译器,从而结合了 MLIR 和 PyTorch 的编译生态。

来自主题: AI技术研报
5123 点击    2023-11-23 20:33
李开复回应 Yi 大模型套壳 LLaMA 争议:受益于开源也贡献开源

李开复回应 Yi 大模型套壳 LLaMA 争议:受益于开源也贡献开源

李开复回应 Yi 大模型套壳 LLaMA 争议:受益于开源也贡献开源

针对近日零一万物被质疑完全使用 LLaMA 架构,只对两个张量(Tensor)名称做修改,李开复在朋友圈进行了回应。

来自主题: AI资讯
4907 点击    2023-11-17 10:42
一文盘点2023人工智能进展,不止大模型而已

一文盘点2023人工智能进展,不止大模型而已

一文盘点2023人工智能进展,不止大模型而已

RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开源界“出圈”;大模型透明度越来越低,透明度最高的是Llama 2,但得分也仅有54;

来自主题: AI资讯
5223 点击    2023-11-16 23:35
ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。

来自主题: AI资讯
5020 点击    2023-11-16 13:18
大模型架构创新已死?

大模型架构创新已死?

大模型架构创新已死?

一场围绕大模型自研和创新的讨论,这两天在技术圈里炸了锅。起初,前阿里技术VP贾扬清,盆友圈爆料吐槽:有大厂新模型就是LLaMA架构,但为了表示不同,通过改变开源代码名字、替换几个变量名……

来自主题: AI资讯
3751 点击    2023-11-15 16:28
老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭

老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭

老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭

刚刚,英伟达发布了目前世界最强的AI芯片H200,性能较H100提升了60%到90%,还能和H100兼容。算力荒下,大科技公司们又要开始疯狂囤货了。

来自主题: AI资讯
8287 点击    2023-11-14 09:23
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)

让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)

让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)

最近微软一项研究让Llama 2选择性失忆了,把哈利波特忘得一干二净。 现在问模型“哈利波特是谁?”,它的回答是这样婶儿的:

来自主题: AI技术研报
3835 点击    2023-11-11 10:28