混元3D世界模型1.0 lite版本发布,消费级显卡就能跑
混元3D世界模型1.0 lite版本发布,消费级显卡就能跑只需要一句话或一张图片,就能生成360度全景3D世界。
只需要一句话或一张图片,就能生成360度全景3D世界。
AI现在可以帮你生成音乐,把自拍照变成文艺复兴风格的肖像画,甚至能帮你预订晚餐。但如果你让它处理发票对账、订单录入或者文件验证,它就开始抓瞎了,最后这些活还是得靠某个打开了15个浏览器标签页、有着超强耐心的员工来完成。
有趣,一款仅4B大小的开源模型Jan-v1,居然声称能平替Perplexity Pro。 并且完全免费,支持本地部署。
8 月 13 日,Google I/O Connect China 2025——Google 开发者大会在上海拉开帷幕。来自 Google 全球不同领域的专家,为中国出海开发者们带来 AI 驱动下的前沿技术、创新开发工具以及全球化平台的最新动态。
天啊,首届人形机器人运动会,现场乱成一锅粥了。 宇树机器人勇夺1500米长跑金牌,但撞人还逃逸了
一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。
前几天发现一个有意思的应用 Macaron,靠颜值就吸引了我,整个设计风格非常的阳光而且高级,尤其是里面的图标,很好看。
谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。
无需人工标注,吞下17亿张图片,Meta用自监督学习炼出「视觉全能王」!NASA已将它送上火星,医疗、卫星、自动驾驶领域集体沸腾。
首个开源多模态Deep Research Agent来了。整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具,通过全自动流程生成高质量推理轨迹,并用冷启动微调和强化学习优化决策,使模型在任务中能自主选择合适的工具组合和推理路径。