上海打造AI医疗高地!总书记考察的“模速空间”,这些企业已入驻!
上海打造AI医疗高地!总书记考察的“模速空间”,这些企业已入驻!4月29日,习近平总书记在上海考察时,在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。
4月29日,习近平总书记在上海考察时,在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。
2025年4月29日凌晨,距离通义千问Qwen3正式发布还有5小时,X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新,等待第一时间测试和体验这款备受期待的中国大模型新作。
来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。
我又发现好东西了!前几天在 Artificial Analysis 上发现了一个新模型:17B 参数的国产模型 HiDream-I1排到第二名,和 GPT-4o 得分非常接近!
就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径!
由智谱和清华大学联合举办的“地狱级”黑客松 -《2024金融行业·大模型挑战赛》。该黑客松颇为艰困,完全复刻了金融行业二级市场的真实需求。而经过数月奋战,我,作为一名金融市场“门外汉”,在1300+名选手中“杀出一条血路”,最终获得了全国第七名以及10,000元的奖金。
宇曜科技Matter-seek:用AI重构材料科学研发新范式。在高端制造领域,新材料研发的滞后性正成为制约产业升级的隐形瓶颈——光刻胶、航空发动机高温合金等核心材料长期依赖进口,单一材料研发周期动辄十年起步,失败率居高不下。宇曜(北京)科技有限公司推出的Matter-seek人工智能新材料研发平台,正试图用“数据引擎+层级神经网络”的技术组合,打破这一僵局。
Meta首届LlamaCon开发者大会开幕,扎克伯格在期间接受采访,回应大模型相关的一切。包括Llama4在大模型竞技场表现不佳的问题:
可灵的下一步:优先保证模型效果、聚焦专业生产者做渗透。,快手在今日成立了可灵 AI 事业部。该事业部下设可灵 AI 产品部、运营部和技术部,负责可灵、可图等系列大模型业务,快手高级副总裁盖坤担任可灵 AI 事业部负责人,继续兼任社区科学线负责人。
就在刚刚,DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。