AI资讯新闻榜单内容搜索-Phi

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

7700 点击 2024-04-29 20:31

苹果加入开源大战，官宣端侧小模型OpenELM！参数2.7亿到30亿一台M2 Mac可跑

从Llama 3到Phi-3，蹭着开源热乎劲儿，苹果也来搞事情了。

来自主题: AI技术研报

5916 点击 2024-04-25 20:01

微软发布Phi-3，性能超Llama-3，可手机端运行

Llama-3 刚发布没多久，竞争对手就来了，而且是可以在手机上运行的小体量模型。

来自主题: AI资讯

8409 点击 2024-04-24 10:41

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了

Llama 3发布刚几天，微软就出手截胡了？

来自主题: AI资讯

10107 点击 2024-04-23 14:25

ICLR 2024 | 连续学习不怕丢西瓜捡芝麻，神经形态方法保护旧知识

以脉冲神经网络（SNN）为代表的脑启发神经形态计算（neuromorphic computing）由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元，神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物特性，能够在不同于冯诺依曼架构的神经形态芯片上以低功耗实现神经网络计算。

来自主题: AI技术研报

3049 点击 2024-03-19 10:27