AITNT-让一部分人先用AI实现商业化

杀疯了！谷歌卷视频到语音，逼真音效让AI视频告别无声！

AI圈这遍地开花的大好局面，让吃瓜群众们甚是惊喜。

来自主题: AI技术研报

9783 点击 2024-06-19 23:44

单镜头16秒720p高清视频一键生成，开源版Sora又有新惊喜了

潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展，支持无缝产出任意风格的高质量短片，令人惊喜的是，他们选择再给开源社区带来亿点点震撼，继续全部开源。

来自主题: AI技术研报

10810 点击 2024-06-19 23:38

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

10912 点击 2024-06-19 23:30

字节打造大模型TTS：不仅能高保真合成，而且支持调整编辑

通过高保真合成语音与真人语音无异。

来自主题: AI技术研报

10257 点击 2024-06-19 23:24

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM。MarkLLM 提供了统⼀的⼤模型⽔印算法实现框架、直观的⽔印算法机制可视化⽅案以及系统性的评估模块，旨在⽀持研究⼈员⽅便地实验、理解和评估最新的⽔印技术进展。通过 MarkLLM，作者期望在给研究者提供便利的同时加深公众对⼤模型⽔印技术的认知，推动该领域的共识形成，进⽽促进相关研究的发展和推⼴应⽤。

来自主题: AI技术研报

9916 点击 2024-06-19 23:19

吴恩达团队新作：多模态多样本上下文学习，无需微调快速适应新任务

本研究评估了先进多模态基础模型在 10 个数据集上的多样本上下文学习，揭示了持续的性能提升。批量查询显著降低了每个示例的延迟和推理成本而不牺牲性能。这些发现表明：利用大量演示示例可以快速适应新任务和新领域，而无需传统的微调。

来自主题: AI技术研报

10589 点击 2024-06-19 23:13

ICLR 2024 Oral | 应对随时间变化的分布偏移，西安大略大学等提出学习时序轨迹方法

在现实世界的机器学习应用中，随时间变化的分布偏移是常见的问题。这种情况被构建为时变域泛化（EDG），目标是通过学习跨领域的潜在演变模式，并利用这些模式，使模型能够在时间变化系统中对未见目标域进行良好的泛化。然而，由于 EDG 数据集中时间戳的数量有限，现有方法在捕获演变动态和避免对稀疏时间戳的过拟合方面遇到了挑战，这限制了它们对新任务的泛化和适应性。

来自主题: AI技术研报

10857 点击 2024-06-19 23:11

Gemini视频推理遥遥领先GPT-4o，Jeff Dean连续转发三次，首个视频多模态基准Video-MME来了

OpenAI和谷歌接连两场发布会，把AI视频推理卷到新高度。但业界还缺少可以全面评估大模型视频推理能力的基准。终于，多模态大模型视频分析综合评估基准Video-MME，全面评估多模态大模型的综合视频理解能力，填补了这一领域的空白。

来自主题: AI技术研报

8221 点击 2024-06-17 23:41

8B模型奥数成绩比肩GPT-4！上海AI Lab出品

只要1/200的参数，就能让大模型拥有和GPT-4一样的数学能力？来自复旦和上海AI实验室的研究团队，刚刚研发出了具有超强数学能力的模型。它以Llama 3为基础，参数量只有8B，却在奥赛级别的题目上取得了比肩GPT-4的准确率。

来自主题: AI技术研报

11169 点击 2024-06-17 23:35

霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品｜GitHub揽星1k+

一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。

来自主题: AI技术研报

12457 点击 2024-06-17 23:26

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

一个“技术问题”，导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近100%。想必很多小伙伴已经感受过了这则铺天盖地的消息，所带来的亿点点震撼。

来自主题: AI资讯

11167 点击 2024-06-17 23:16

为什么你的iPhone，肯定用不上“苹果AI”？

一周前，苹果在WWDC上发布了自己的AI功能Apple Intelligence，包括直接集成OpenAI的ChatGPT，自那以来，股价上涨逾7%，重夺全球市值第一宝座。

来自主题: AI资讯

10373 点击 2024-06-17 23:11

AI，一场科技界“卖拐”

AI在科技界的发展类似于一场“卖拐”行为，需回归到现实场景中去感受新技术的实际应用。 • ???? 元宇宙、AI发布会等科技狂欢背后的思考模式和现实应用之间的落差 • ???? AI产品需要以角色为中心，寻找智能的价值密度，避免“似懂非懂”的迷信现象 • ???? AI发展需要结合自下而上的实践和自上而下的战略思考，重点在于角色重组和感受落地化

来自主题: AI资讯

10444 点击 2024-06-17 23:09