纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画不用图像,只用文本就能训练出视觉概念表征?用写代码的方式读懂画面,形状、物体、场景都能懂!
不用图像,只用文本就能训练出视觉概念表征?用写代码的方式读懂画面,形状、物体、场景都能懂!
随着大型语言模型(LLM)技术日渐成熟,提示工程(Prompt Engineering)变得越来越重要。一些研究机构发布了 LLM 提示工程指南,包括微软、OpenAI 等等。
如果语言模型是巫师,代码预训练就是魔杖!
融合多个异构大语言模型,中山大学、腾讯 AI Lab 推出 FuseLLM
大语言模型和其他新的AI方法的出现将如何重塑你的行业,领导者应该如何做好准备?我们的讨论重点是AI对美国医疗保健行业的影响,但我们的广泛观点适用于每一个与数字革命新阶段搏斗的复杂生态系统。
距离上次推出的 v0.4.0 大版本的三周后,我们又再次迎来了重大的更新 — v0.5.0!在这个最新版本中,我们隆重推出了 AI Agent 能力。
去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整技术论文,还提供了新的版本。
本报告旨在通过全面、客观地评估当前流行的大模型,为大语言模型技术的具体实践和未来探索提供方向。
瑞士信息与通信科技公司Lakera成立于2021年,该公司为生成式AI应用程序开发的安全工具拥有专有的威胁情报数据库,可防御对大型语言模型(LLM)的各类攻击并对AI应用程序进行压力测试检测漏洞,为AI应用程序提供企业级的安全保护。
自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。