AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

复旦大学AI³徐盈辉研究员：Agent的可视化创作界面 ——Agent Insights

复旦大学AI³徐盈辉研究员：Agent的可视化创作界面 ——Agent Insights

复旦大学AI³徐盈辉研究员：Agent的可视化创作界面 ——Agent Insights

传统 LLM-based AI Agent 运维平台在复杂应用开发方面存在一定局限，复旦大学人工智能创新与产业研究院（AI³）徐盈辉研究员与 AI2Apps 团队打造的 AI2Apps 可视化集成开发环境集成了工程级的开发工具，覆盖 AI Agent 完整开发周期，具有完全开放的扩展性，并自带浏览器沙盒环境，借鉴 Figma 的理念

来自主题: AI技术研报

8485 点击 2024-05-10 17:25

原作者带队，LSTM真杀回来了！

原作者带队，LSTM真杀回来了！

原作者带队，LSTM真杀回来了！

20 世纪 90 年代，长短时记忆（LSTM）方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来，LSTM 经受住了时间的考验，并为众多深度学习的成功案例做出了贡献。然而，以可并行自注意力为核心 Transformer 横空出世之后，LSTM 自身所存在的局限性使其风光不再。

来自主题: AI资讯

9439 点击 2024-05-10 10:19

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。

来自主题: AI技术研报

10285 点击 2024-05-09 15:48

创业：大模型RAG系统三个月的开发心得和思考

创业：大模型RAG系统三个月的开发心得和思考

创业：大模型RAG系统三个月的开发心得和思考

自从和员外上家公司离职后，我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中，这中间有一个春节，前后的总时间大概是三个月左右，在这三个月期间，基本是昼夜兼程啊，到今天3月底结束，产品目前看是有了一个基础的雏形。

来自主题: AI技术研报

9843 点击 2024-05-08 12:26

LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

机器如何能像人类和动物一样高效地学习？机器如何学习世界运作方式并获得常识？机器如何学习推理和规划……

来自主题: AI技术研报

4399 点击 2024-05-05 19:45

ICLR 2024 Spotlight | 无惧中间步骤，MUSTARD可生成高质量数学推理数据

ICLR 2024 Spotlight | 无惧中间步骤，MUSTARD可生成高质量数学推理数据

ICLR 2024 Spotlight | 无惧中间步骤，MUSTARD可生成高质量数学推理数据

近年来，大型语言模型（LLM）在数学应用题和数学定理证明等任务中取得了长足的进步。数学推理需要严格的、形式化的多步推理过程，因此是 LLMs 推理能力进步的关键里程碑，但仍然面临着重要的挑战。

来自主题: AI技术研报

7555 点击 2024-05-04 20:04

「用 AI 训 AI」这事靠谱吗？

「用 AI 训 AI」这事靠谱吗？

「用 AI 训 AI」这事靠谱吗？

在大语言模型领域，微调是改进模型的重要步骤。伴随开源模型数量日益增多，针对LLM的微调方法同样在推陈出新。

来自主题: AI技术研报

10548 点击 2024-05-01 19:31

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

9587 点击 2024-04-29 20:31

吴恩达：多智能体协作是新关键，软件开发等任务将更高效

吴恩达：多智能体协作是新关键，软件开发等任务将更高效

吴恩达：多智能体协作是新关键，软件开发等任务将更高效

前不久，斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力，这也引起了众多讨论。其中，吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明，将目光局限于大模型不一定可取，智能体或许会比其所用的基础模型更加优秀。

来自主题: AI技术研报

12651 点击 2024-04-28 12:35

吴恩达：多智能体协作是新关键，软件开发等任务将更高效

吴恩达：多智能体协作是新关键，软件开发等任务将更高效

吴恩达：多智能体协作是新关键，软件开发等任务将更高效

前不久，斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力，这也引起了众多讨论。其中，吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明，将目光局限于大模型不一定可取，智能体或许会比其所用的基础模型更加优秀。

来自主题: AI资讯

7372 点击 2024-04-26 17:21

上一页当前第121页,共153页下一页