ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
本周(4.15-4.21)AI界发生了什么?
8518点击    2024-04-24 10:31

大佬言论

李彦宏:开源模型将会越来越落后


4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示,未来,自然语言将成为新的通用编程语言,每个人都可以成为一名开发者,用自己的创造力改变世界。李彦宏还指出,“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以,开源模型会越来越落后。”


扎克伯格:80亿的Llama 3还不够小,大模型需要提升训练质量


4月18日,Llama 3正式发布后,扎克伯格在知名主持人Dwarkesh Patel的播客中,谈及Meta AI的技术路线、未来规划和开源哲学。扎克伯格表示:Llama 3最小版本的80亿参数模型“还不够小”,无法满足大量使用场景。他更倾向于将模型蒸馏到5亿、10亿级别,看看能用来做什么。


李飞飞报告:中国大模型世界第二,但专利数、机器人全球第一


4月15日,由华裔女科学家、“人工智能教母”李飞飞联合领导的HAI研究所(Stanford HAI)近日发布了《2024 年人工智能指数报告》。报告中指出,2023 年,61 个著名的人工智能模型源自美国的机构,超过欧盟的 21 个和中国的 15 个。 然而,中国依然是美国最大的竞争对手,中国的机器人安装量居世界首位;同样,世界上大多数人工智能专利(61%)都来自中国。



另外,4月18日,李飞飞在拜登的国情咨文演讲中呼吁,希望拜登政府出资建设一个国家计算能力和数据集仓库。她指出,当前AI学术界明星人才正大量流失,大公司正在以高薪挖掘学术界人才资源。而研究大模型的高昂成本正在将研究人员排除在该领域之外,从而损害了学术界的独立研究。


大事件

Meta 开源新一代模型 Llama 3


当地时间4月18日,Meta 公司宣布最新开源推出新一代大型语言模型Llama 3,包含 8B 和 70B 两种参数规模。Llama 3在由24000块GPU组成的定制集群上,使用15万亿个token训练的,上下文长度实现8K,推理编码大幅提升,代码和权重全开源。Llama 3现可在网页版Meta AI免登录使用。


Stable Diffusion 3 API发布


4月17日,Stability AI正式发布Stable Diffusion 3 API,新的SD3在文字位置、提示词的遵循程度上大幅提升,超过DALL-E 3和Midjourney v6等行业领先模型。目前SD3技术还未完全开源,但Stability AI承诺,对于普通用户,SD3模型不会收费。


Reka Core登场,比肩GPT-4、Claude 3


4月16日,由前DeepMind、Google Brain和FAIR成员组成的AI初创公司Reka推出与GPT-4匹敌的多模态大模型Reka Core,具备理解图像、音频和视频的能力,支持32种语言,性能可与GPT-4和Claude 3 Opus匹敌。不过,Reka没有计划开源此模型。


AI界前线

OpenAI在东京开设亚洲首个办事处


4月15日,OpenAI宣布在日本东京设立亚洲首个办事处,承诺与政府、当地企业及研究机构合作,开发安全的AI工具满足本地需求。同时,OpenAI还宣布推出一款专为日本语言优化的GPT-4定制模型,其在翻译和总结日语文本方面表现出色,性能和速度都有显著提升,成本效率更高,速度提升至原来的三倍。


波士顿动力推出电动版Atlas机器人


当地时间4月17日,在宣布原液压版Atlas人形机器人退役的一天后,波士顿动力推出全电动版本的 Atlas机器人。电动Atlas动作的自由度和灵活性远超人类。它继承了液压版的三指设计,采用比其前身更加流线型的设计,有着更灵活的机械骨架,具有类似环形灯的头部,没有任何电缆外露。



英特尔推出全球最大神经拟态系统,比人脑快200倍


当地时间4月17日,美国芯片巨头英特尔(Intel)公司宣布,其已经建立了世界上最大的神经拟态系统Hala Point,拥有11.5 亿个神经元和1280亿个突触,速度最高可达人脑的200倍。该系统系统最初部署在桑迪亚国家实验室,采用英特尔Loihi 2处理器,旨在支持未来类脑AI的研究。


文心一言4.0工具版上新,还发了三大AI开发工具


4 月 16 日,在2024百度Create AI开发者大会上,百度正式宣布基础模型全面更新,并推出文心一言4.0工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder和模型定制工具ModelBuilder,以对应不同的开发场景。


贾佳亚团队Mini-Gemini全开源


香港中文大学终身教授贾佳亚团队提出多模态模型Mini-Gemini,提供从2B到34B的模型大小范围,融合ChatGPT+DALL·E 3,具备更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成。目前,Mini-Gemini从代码、模型到数据已全部开源,线上Demo也已发布。


联想官宣5款AI PC


4月18日,联想TechWorld 2024在上海开幕。联想发布了内嵌个性化AI智能体“联想小天”的AI PC系列产品。用户可基于自然语言与“小天”交互,“小天”在交互中也能不断完善。官方演示中,“小天”具备可实现通过自然语言找到照片、AI跨端生图等本地化AI能力。


融资动态

芯片初创公司 Rivos 融资 2.5 亿美元


4月17日消息,RISC-V芯片初创公司Rivos宣布在 A-3 轮融资中筹集了超过 2.5 亿美元,该笔资金将专项用于研发其首款针对生成式AI()和数据分析工作负载的加速器产品。Matrix Capital为本轮最大投资者管理层,英特尔资本、联发科(MTK)、Cambium Capital、CIDC、Capital TEN以及Hotung Venture Group等投资机构也积极参与了此次融资。


微软将向阿联酋AI公司G42投资15亿美元


4月16日,微软表示将向总部位于阿联酋的人工智能公司G42投资15亿美元,让这家美国科技巨头获得G42的少数股权和董事会席位。G42将在微软的云计算平台Azure上运行,为全球公共部门客户和大型企业提供先进的人工智能解决方案。


新玩意

Rewind宣布更名Limitless,推出可穿戴AI挂坠


4月17日,Rewind更名为Limitless,推出用于会议场景的可穿戴 AI 挂坠,具备提供实时笔记、会议转录和会议摘要等功能,预计将在8月发售,售价99美元。Limitless为用户配备“同意模式”,以确保隐私保护和加密云服务确保数据私密性,用户可控制数据解密。



前沿研究

Meta实现无限上下文长度的新算法


Meta联合南加州大学、CMU、UCSD的研究人员近期发布了论文,提出一种名为Megalodon的算法。这是一种新型神经网络架构,能够高效处理具有无限上下文长度的文本。Megalodon引入了多项创新组件,显著提高了模型的能力、稳定性,以及训练的性价比,并在多个基准测试中表现出优于Llama2的性能。


微软推出单图生数字人技术VASA-1


4月18日,微软发布VASA-1技术,能通过单张图片和音频生成逼真的数字人视频。VASA-1利用面部动态统一编码和Diffusion Transformer技术,实现精准的唇语同步和自然的表情动作,并支持实时生成。



文本来自“36氪”,作者 赵炜嘉



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales