AI资讯新闻榜单内容搜索-2

LLM生成延迟降低50%！DeepSpeed团队发布FastGen：动态SplitFuse技术，提升2.3倍有效吞吐量

DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。

来自主题: AI资讯

6385 点击 2023-12-02 11:54

通义千问开源全家桶正式上线！业界最强72B模型直接超越开源标杆Llama 2-70B，还有1.8B模型、音频大模型全部开源，阿里云这次真的把家底都掏出来了。

来自主题: AI资讯

9056 点击 2023-12-02 11:32

让大模型洗钱、制造炸弹、合成冰毒？GPT-4、 Claude 2纷纷沦陷了。让大模型成功越狱，还是有机可乘。

来自主题: AI资讯

4110 点击 2023-12-01 15:52

目前，通义千问开源全家桶已经有了 18 亿、70 亿、140 亿、720 亿参数量的 4 款基础开源模型，以及跨语言、图像、语音等多种模态的多款开源模型。

来自主题: AI资讯

5953 点击 2023-12-01 14:46

谷歌DeepMind全新提示技术「Step-Back Prompting」，让LLM性能拉满！

来自主题: AI资讯

4556 点击 2023-12-01 11:01

开源大模型这个圈子，真是卷到不行——国内最新纪录来了，直奔千亿量级，达到1026亿。千亿参数、全面开源、无需授权可商用，GitHub均可全面下载使用，就问你激动不激动！

来自主题: AI资讯

8590 点击 2023-11-30 19:21

只需不到9行代码，就能在CPU上实现出色的LLM推理性能。英特尔® Extension for Transformer创新工具包中的LLM Runtime为诸多模型显著降低时延，且首个token和下一个token的推理速度分别提升多达40倍和2.68倍，还能满足更多场景应用需求。

来自主题: AI技术研报

4907 点击 2023-11-30 19:10

GPTs太火了。OpenAI的首届开发者大会之后，短短半个月时间，已经出现2万个GPTs，平均每天冒出来1300个。这个热度，跟ChatGPT刚发布时有得一拼。

来自主题: AI资讯

4470 点击 2023-11-30 14:28

开局即巅峰的WPS后在雷军等骨干的共同努力下，磨砺20年以金山办公之名终于成功在A股上市，算是IT界少有的国产之光。但近年来有关WPS窃取用户隐私的声音却不绝于耳，不仅有冲上热搜的“WPS被曝会删除用户本地文件”话题，还有近期“用户文档或将被当做WPS AI训练材料”的争议。

来自主题: AI资讯

4107 点击 2023-11-30 11:25