AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: LLM
抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门,成为了Hacker News等许多科技媒体的头版头条。

来自主题: AI技术研报
2875 点击    2024-05-11 13:06
原作者带队,LSTM真杀回来了!

原作者带队,LSTM真杀回来了!

原作者带队,LSTM真杀回来了!

20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所存在的局限性使其风光不再。

来自主题: AI资讯
7024 点击    2024-05-10 10:19
创业:大模型RAG系统三个月的开发心得和思考

创业:大模型RAG系统三个月的开发心得和思考

创业:大模型RAG系统三个月的开发心得和思考

自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,这中间有一个春节,前后的总时间大概是三个月左右,在这三个月期间,基本是昼夜兼程啊,到今天3月底结束,产品目前看是有了一个基础的雏形。

来自主题: AI技术研报
8149 点击    2024-05-08 12:26
LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向

LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向

LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向

机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划……

来自主题: AI技术研报
1717 点击    2024-05-05 19:45
ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

近年来,大型语言模型(LLM)在数学应用题和数学定理证明等任务中取得了长足的进步。数学推理需要严格的、形式化的多步推理过程,因此是 LLMs 推理能力进步的关键里程碑, 但仍然面临着重要的挑战。

来自主题: AI技术研报
5767 点击    2024-05-04 20:04
LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报
7426 点击    2024-04-29 20:31
吴恩达:多智能体协作是新关键,软件开发等任务将更高效

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。

来自主题: AI技术研报
10091 点击    2024-04-28 12:35
吴恩达:多智能体协作是新关键,软件开发等任务将更高效

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。

来自主题: AI资讯
4983 点击    2024-04-26 17:21