AI技术研报-这里有最前沿的人工智能技术解读

苹果智能背后模型公布：3B模型优于Gemma-7B，服务器模型媲美GPT-3.5-Turbo

在刚刚结束的全球开发者大会上，苹果宣布了 Apple intelligence，这是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新个性化智能系统。

来自主题: AI技术研报

5732 点击 2024-06-13 10:01

手机流畅运行470亿大模型：上交大发布LLM手机推理框架PowerInfer-2，提速29倍

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。

来自主题: AI技术研报

7179 点击 2024-06-12 15:33

全华人团队推出多模态大模型新基准，GPT-4o准确率仅为65.5%，所有模型最易犯感知错误

GPT-4o再次掀起多模态大模型的浪潮。

来自主题: AI技术研报

8970 点击 2024-06-12 15:17

GPT-4o更容易越狱？北航&南洋理工上万次测试给出详细分析

GPT-4o，比上一代更容易被越狱攻击了？

来自主题: AI技术研报

10192 点击 2024-06-12 15:11

捣鼓了一年的LLM,我们学到了啥——Part II

一个常被许多领导者引用、但很可能是被杜撰出来的名言是：“外行谈战略和战术，内行谈运营。”战术视角看到的是一个个独特的难题，而运营视角看到的是组织中需要需要改变的不协调的模式。战略视角看到的是机会，运营视角则看的是挑战。

来自主题: AI技术研报

9580 点击 2024-06-12 15:05

捣鼓了一年的LLM应用,我们学到了啥——Part I

之前分享了我们在运营LLM应用时磨练出来的战术(tactics)【指之前的Part I 和Part II两篇文章】。战术是具体的：是为实现目标而采取的具体行动。我们还分享了对运营（Operations）的看法：为了执行战术，达到目标，而制定的更高层次的流程。

来自主题: AI技术研报

9288 点击 2024-06-11 20:02

拿下SOTA！最强中文Embedding模型对标OpenAI，技术路线公开

国产大模型「日日新 5.0」已经在权威主流评测中鲨疯了。变强的背后原因竟是，来自商汤自研中文Embedding模型——Piccolo2。这是首个对标OpenAI向量长度的模型。

来自主题: AI技术研报

10719 点击 2024-06-11 16:16

GPT-4搞不定的图推理，港科大7B模型搞定｜KDD2024

大模型执行图推理任务，我们是希望大模型仅仅给出结果，还是在给出准确答案的同时，输出详细的推理过程？

来自主题: AI技术研报

9575 点击 2024-06-11 16:09

全面超越Transformer！清华蚂蚁推出纯MLP架构，长短程时序预测大幅提升

Transformer很强，Transformer很好，但Transformer在处理时序数据时存在一定的局限性。

来自主题: AI技术研报

9827 点击 2024-06-11 16:05

视觉语言模型导论：这篇论文能成为你进军VLM的第一步

近些年，语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型（LLM）有能力解决多种不同的任务，它们也正在成为越来越常用的工具。

来自主题: AI技术研报

9413 点击 2024-06-11 10:08

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报

9926 点击 2024-06-11 10:06

CVPR 2024｜让图像扩散模型生成高质量360度场景，只需要一个语言模型

360 度场景生成是计算机视觉的重要任务，主流方法主要可分为两类，一类利用图像扩散模型分别生成 360 度场景的多个视角。由于图像扩散模型缺乏场景全局结构的先验知识，这类方法无法有效生成多样的 360 度视角，导致场景内主要的目标被多次重复生成，如图 1 的床和雕塑。

来自主题: AI技术研报

9720 点击 2024-06-11 10:02

i人小助手：Meta推出多模态对话图，帮你轻松识别社交状态

近年来兴起的第一人称视角视频研究为理解人类社交行为提供了无法取代的直观视角，然而，绝大多数的既往工作都侧重于分析与摄像机佩戴者相关的行为，并未关注处于社交场景中其他社交对象的状态。

来自主题: AI技术研报

8845 点击 2024-06-10 15:02

偏微分方程有了基础模型：样本需求数量级减少，14项任务表现最佳

偏微分方程（PDEs）被称为物理学的语言，因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。

来自主题: AI技术研报

9010 点击 2024-06-10 14:59

两句话，让LLM逻辑推理瞬间崩溃！最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

在基准测试上频频屠榜的大模型们，竟然被一道简单的逻辑推理题打得全军覆没？最近，研究机构LAION的几位作者共同发表了一篇文章，以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题，揭示了LLM基准测试的盲区。

来自主题: AI技术研报

10045 点击 2024-06-10 14:23

GPT-4欺骗人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强欺骗值越高

最近，德国研究科学家发表的PANS论文揭示了一个令人担忧的现象：LLM已经涌现出「欺骗能力」，它们可以理解并诱导欺骗策。而且，相比前几年的LLM，更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。

来自主题: AI技术研报

9019 点击 2024-06-09 18:23

可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

近期，由清华大学自然语言处理实验室联合面壁智能推出的全新开源多模态大模型 MiniCPM-Llama3-V 2.5 引起了广泛关注

来自主题: AI技术研报

10338 点击 2024-06-09 17:56

从LLM中完全消除矩阵乘法，效果出奇得好，10亿参数跑在FPGA上接近大脑功耗

让语言模型「轻装上阵」。

来自主题: AI技术研报

9966 点击 2024-06-09 17:26

港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！作者亲自解读在此

极限量化，把每个参数占用空间压缩到1.1bit！

来自主题: AI技术研报

9841 点击 2024-06-09 17:22

最强开源大模型一夜易主

阿里云发布最强开源大模型Qwen2，干翻Llama 3，比闭源模型还强。

来自主题: AI技术研报

9975 点击 2024-06-09 11:06

Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神

24点游戏、几何图形、一步将死问题，这些推理密集型任务，难倒了一片大模型，怎么破？北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法，用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下，竟多次超越Llama3-70B！

来自主题: AI技术研报

9779 点击 2024-06-08 20:15

To Believe or Not to Believe？DeepMind新研究一眼看穿LLM幻觉

DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文，探讨了LLM的不确定性量化问题，通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini，结果表明，与基线方法相比，该方法能有效检测幻觉。

来自主题: AI技术研报

9841 点击 2024-06-08 19:59