AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
对话肖特特:从伯克利到PromptAI创业,发明创造下一代视觉智能

对话肖特特:从伯克利到PromptAI创业,发明创造下一代视觉智能

对话肖特特:从伯克利到PromptAI创业,发明创造下一代视觉智能

通用语言模型率先起跑,但通用视觉模型似乎迟到了一步。究其原因,语言中蕴含大量序列信息,能做更深入的推理;而视觉模型的输入内容更加多元、复杂,输出的任务要求多种多样,需要对物体在时间、空间上的连续性有完善的感知,传统的学习方法数据量大、经济属性上也不理性...... 还没有一套统一的算法来解决计算机对空间信息的理解。

来自主题: AI资讯
8962 点击    2024-12-16 10:48
AI时代写Prompt应该用APPL:为Prompt工程打造的编程语言,来自清华姚班的博士

AI时代写Prompt应该用APPL:为Prompt工程打造的编程语言,来自清华姚班的博士

AI时代写Prompt应该用APPL:为Prompt工程打造的编程语言,来自清华姚班的博士

在人工智能快速发展的今天,大语言模型(LLM)已经成为改变世界的重要力量。然而,如何高效地编写、管理和维护提示词(Prompt)仍然是一个巨大的挑战。

来自主题: AI技术研报
7921 点击    2024-12-16 09:39
多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

大语言模型(LLMs)通过更多的推理展现出了更强的能力和可靠性,从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报
6027 点击    2024-12-13 14:40
AI翻译漫画:一家AI初创公司如何帮日本漫画走向全球

AI翻译漫画:一家AI初创公司如何帮日本漫画走向全球

AI翻译漫画:一家AI初创公司如何帮日本漫画走向全球

一家日本初创公司Orange正在使用Anthropic公司的旗舰大语言模型Claude帮助将漫画翻译成英文,使该公司能够在短短几天内为西方受众推出一部新作,而不是人工团队需要两到三个月的时间。

来自主题: AI资讯
7871 点击    2024-12-12 21:26
Sora终于来了,但多模态AI呼唤实用主义

Sora终于来了,但多模态AI呼唤实用主义

Sora终于来了,但多模态AI呼唤实用主义

随着ChatGPT等大语言模型的问世,人工智能进入了一个全新的时代。在这股浪潮中,多模态AI技术成为业界竞相追逐的目标,OpenAI的Sora更是将这股热情推向高潮。

来自主题: AI资讯
7563 点击    2024-12-12 14:27
数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

目前大语言模型(Large Language Models, LLMs)的推理能力备受关注。从思维链(Chain of Thought,CoT)技术提出,到以 o1 为代表的长思考模型发布,大模型正在展现出接近人类甚至领域专家的水平,其中数学推理是一个典型任务。

来自主题: AI技术研报
7872 点击    2024-12-12 10:06
TypedThinker框架,多维度推理Prompt让LLM推理更精准,卡梅隆和Qwen团队最新

TypedThinker框架,多维度推理Prompt让LLM推理更精准,卡梅隆和Qwen团队最新

TypedThinker框架,多维度推理Prompt让LLM推理更精准,卡梅隆和Qwen团队最新

大语言模型(LLMs)在推理任务上展现出了令人瞩目的能力,但其推理思维方式的单一性一直是制约性能提升的关键瓶颈。目前的研究主要关注如何通过思维链(Chain-of-Thought)等方法来提升推理的质量,却忽视了一个重要维度——推理类型的多样性。

来自主题: AI技术研报
8183 点击    2024-12-11 10:16
NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习

NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习

NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习

随着 ChatGPT 掀起的 AI 浪潮进入第三年,人工智能体(AI Agent)作为大语言模型(LLM)落地应用的关键载体,正受到学术界和产业界的持续关注。

来自主题: AI技术研报
7319 点击    2024-12-11 09:48
73页,开源「后训练」全流程!AI2发布高质量Tülu 3系列模型,拉平闭源差距,比肩GPT-4o mini

73页,开源「后训练」全流程!AI2发布高质量Tülu 3系列模型,拉平闭源差距,比肩GPT-4o mini

73页,开源「后训练」全流程!AI2发布高质量Tülu 3系列模型,拉平闭源差距,比肩GPT-4o mini

Allen Institute for AI(AI2)发布了Tülu 3系列模型,一套开源的最先进的语言模型,性能与GPT-4o-mini等闭源模型相媲美。Tülu 3包括数据、代码、训练配方和评估框架,旨在推动开源模型后训练技术的发展。

来自主题: AI技术研报
7504 点击    2024-12-10 16:23