在笔记本上,部署 gpt-oss-120b 模型
在笔记本上,部署 gpt-oss-120b 模型今天 ,OpenAI 开源了俩模型:120B/20B 117B 的 gpt-oss-120b 对标 o4-min,按官方说法至少需要 80G 内存,推荐使用单卡 H100 GPU 而刚买的的游戏本,刚好满足gpt-oss-120b 的部署条件
今天 ,OpenAI 开源了俩模型:120B/20B 117B 的 gpt-oss-120b 对标 o4-min,按官方说法至少需要 80G 内存,推荐使用单卡 H100 GPU 而刚买的的游戏本,刚好满足gpt-oss-120b 的部署条件
三天不开源,Qwen团队手就痒。 昨天深夜再次放出两个端侧模型: Qwen3-4B-Instruct-2507:非推理模型,大幅提升通用能力 Qwen3-4B-Thinking-2507:高级推理模型,专为专家级任务设计
7月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev,最近终于有时间进行测评了。Flux.1 Krea Dev 是基于FLUX.1 dev 模型进行蒸馏的,参数规模12B,专注于提升图像的美学和真实感,避免了常见的 AI 生成痕迹(过度饱和或不自然高光等等),更倾向于追求自然细节、照片级真实感和多样性。
AMD公布第二财季财报,营收76.9亿美元,同比增长32%,超出预期,但盈利略低于预期。
没等来GPT-5,最先更新的是Gemini 2.5 Deep Think,不愧是你,卷王Gemini。
Agent形式又进化了,现在“有头有脸”,能自主帮你完成KPI!
声音理解能力新SOTA,小米全量开源了模型。 MiDashengLM-7B,基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B Thinker作为自回归解码器,通过创新的通用音频描述训练策略,实现了对语音、环境声音和音乐的统一理解。
在 2025 年第二季度财报中,Palantir 交出了一份几乎所有 SaaS 从业者都梦寐以求的成绩单:美国商业业务收入同比增长 93%、总收入突破 10 亿美元、调整后经营利润率 46%、自由现金流利润率 57%、Rule of 40 指数高达 94%。
老黄曾预言,每个像素都将由AI生成!刚刚,谷歌DeepMind放出的「通用世界模型」Genie 3,一句话即生720p实时模拟世界,1分钟视觉记忆一致性超高。刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。
MiniMax副总裁、战略投资负责人魏瀚曈已离职,据消息人士透露,魏瀚曈将入职一家投资机构。公开资料显示,魏瀚曈曾在平安、字节跳动、小红书等公司从事战略投资方面工作,2024年5月从小红书离职后,入职MiniMax,并出任战略投资负责人,对外用的是MiniMax副总裁的称谓。其个人实名认证的社交平台显示,在MiniMax最后离开的时间是今年7月。