
DeepSeek惊醒上海,输不起的人工智能之战
DeepSeek惊醒上海,输不起的人工智能之战上海拥有全国1/3的人工智能重点企业、41%的智能芯片产能和日均处理的20PB级城市数据,却在2025年伊始遭遇了尴尬的叩问: 一家总部杭州的初创公司DeepSeek横空出世,其开源大模型的开发者调用量在一周内突破微软亚洲研究院十年累积量,直接促成全球170个国家开发者建立起47万个衍生模型
上海拥有全国1/3的人工智能重点企业、41%的智能芯片产能和日均处理的20PB级城市数据,却在2025年伊始遭遇了尴尬的叩问: 一家总部杭州的初创公司DeepSeek横空出世,其开源大模型的开发者调用量在一周内突破微软亚洲研究院十年累积量,直接促成全球170个国家开发者建立起47万个衍生模型
传统的偏好对⻬⽅法,如基于⼈类反馈的强化学习(RLHF)和直接偏好优化(DPO),依赖于训练过程中的模型参数更新,但在⾯对不断变化的数据和需求时,缺乏⾜够的灵活性来适应这些变化。
近日,北京航空航天大学的研究团队基于 TinyLLaVA_Factory 的原项目,推出小尺寸简易视频理解框架 TinyLLaVA-Video,其模型,代码以及训练数据全部开源。在计算资源需求显著降低的前提下,训练出的整体参数量不超过 4B 的模型在多个视频理解 benchmark 上优于现有的 7B + 模型。
2月8日,共达地创新技术(深圳)有限公司(以下简称“共达地”)市场负责人李苏南在办公室向记者演示了他们自主研发的“神器”:只需规划好AI应用场景,上传视频、图片等原始数据并定义标注类别,机器便如同经验丰富的AI工程师,自动分析数据特点
就在刚刚,AIME 2025 I数学竞赛的大模型参赛结果出炉,o3-mini取得78%的最好成绩,DeepSeek R1拿到了65%,取得第四名。然而一位教授却发现,某些1.5B小模型竟也能拿到50%,莫非真的存在数据集污染?
Perplexity CEO Arvin Srinivas 在今天 CNBC 采访中谈到了 Perplexity 与 DeepSeek 的整合,以及作为美国初创公司如何确保用户数据安全、避免审查问题,并提出了其与 TikTok 合并的战略构想。
在竞争激烈的游戏行业,创新技术一直是重塑着行业格局的关键,而最近几年,AI无疑是风口上的香饽饽,全球范围内各种创业团队更是如雨后春笋般涌现
AI+机器人、AI+大数据、AI+基因技术......当AI与诸多新兴产业结合,常常激发出强大的创新能量,但若是AI+传统行业的中医,又会碰撞出怎样的火花呢?
今天,我想用一些数据,来盘点2024年各家银行的大模型项目招标结果。
DeepSeek会是国内首个挑战ChatGPT,重塑AI助手现有格局的产品吗?从产品数据来看,值得期待。在APP端,DeepSeek上线半个月,就在新增下载量上超越了ChatGPT,并将百万级的领先优势持续至今。截至2月5日,DeepSeek的全球下载量已接近4000万。