AI TNT— 让一部分先用AI实现商业化

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

Transformer大模型工作原理究竟是什么样的？一位软件工程师打开了大模型的矩阵世界。黑客帝国中，「矩阵模拟」的世界或许真的存在。

来自主题: AI资讯

7049 点击 2023-12-04 18:48

只需不到9行代码，就能在CPU上实现出色的LLM推理性能。英特尔® Extension for Transformer创新工具包中的LLM Runtime为诸多模型显著降低时延，且首个token和下一个token的推理速度分别提升多达40倍和2.68倍，还能满足更多场景应用需求。

来自主题: AI技术研报

3368 点击 2023-11-30 19:10

简化版Transformer来了，网友：年度论文

Transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 Transformer 架构的一种简单方法是将多个相同的 Transformer 「块」（block）依次堆叠起来，但每个「块」都比较复杂，由许多不同的组件组成，需要以特定的排列组合才能实现良好的性能。

来自主题: AI技术研报

6632 点击 2023-11-28 14:44

Hinton和LeCun再交锋，激辩LLM能否引发智能奇点！LeCun：人类理解能力碾压GPT-4

大模型能否理解自己所说，Hinton和LeCun再次吵起来了。LeCun新论文证明，GPT-4回答问题准确率仅为15%，自回归模型不及人类。AI大佬的激战再次掀起。Hinton在线直接点名LeCun，说他对AI接管风险的看法对人类的影响微乎其微。这意味着，他把自己的意见看得很重，而把许多其他同样有资格的专家的意见看得很轻

来自主题: AI技术研报

6628 点击 2023-11-26 19:30

马斯克让盗梦空间成真？初创公司用Transformer诱导清醒梦，Neuralink技术操控梦境效果惊人

这个名为「先知」的初创公司，希望开发出一种可穿戴设备，让你体验在清醒梦中醒来的感觉……《盗梦空间》要成真了？

来自主题: AI资讯

5379 点击 2023-11-20 09:26

谷歌大模型研究陷重大争议：训练数据之外完全无法泛化？网友：AGI奇点推迟了

针对Transformer，谷歌DeepMind一项新的发现引起了不小争议：它的泛化能力，无法扩展到训练数据以外的内容。

来自主题: AI技术研报

6383 点击 2023-11-11 17:50

卷积网络又行了？DeepMind推翻Transformer最强传说，LeCun怒赞

DeepMind最新研究发现，只要模型设计上没有缺陷，决定模型性能的核心可能是训练计算量和数据。在相同计算量下，卷积神经网络模型和视觉Transformers模型的性能居然能旗鼓相当！

来自主题: AI技术研报

5705 点击 2023-10-29 10:24

Transformer一作来卷多模态！学术图表也能看懂，100毫秒极速响应｜免费试玩

最近多模态大模型是真热闹啊。这不，Transformer一作携团队也带来了新作，一个规模为80亿参数的多模态大模型Fuyu-8B

来自主题: AI技术研报

4275 点击 2023-10-19 22:09

Transformer论文作者如何与非典型华人创业者联合打造20亿美元的AI独角兽？

Cohere近期获得了2.7亿美元的C轮融资，累计融资额超过4.3亿美元，估值超过21亿美元。它的投资者名单中包括Salesforce、NVIDIA、Oracle这样的企业巨头，Tiger Global和Index Ventures等顶级投资机构，以及Geoffrey Hinton（深度学习三巨头，图灵奖获得者）、李飞飞等知名AI大牛。它的合作者还包括Amazon、麦肯锡等。

来自主题: AI资讯

4627 点击 2023-09-22 09:41