
AI人才到底有多贵
AI人才到底有多贵之前在《如何用AI解决信息大爆炸的难题》中我提过,根据我们自己的全球媒体和付费信源订阅列表,Y同学研发了适用于我们社区的知识库工作流,第一步先把常订阅的媒体进行自动化AI知识库构建。这样就把全球多信源的每日更新存在了我们的知识库里。
之前在《如何用AI解决信息大爆炸的难题》中我提过,根据我们自己的全球媒体和付费信源订阅列表,Y同学研发了适用于我们社区的知识库工作流,第一步先把常订阅的媒体进行自动化AI知识库构建。这样就把全球多信源的每日更新存在了我们的知识库里。
就在刚刚,OpenAI深夜紧急发布了最新推理模型,o3-mini系列。一共包含三个版本:low、medium和high。其中o3-mini和o3-mini-high已经上线:
智东西1月31日消息,据《华尔街日报》援引知情人士消息,OpenAI正在进行初步谈判,计划在一轮融资中筹集至多400亿美元(约合人民币2901亿元),估值将达到3000亿美元(约合人民币2.18万亿元),相较此前估值1570亿美元接近翻倍。
花名欧冶子,同济本科、北大硕士,08年毕业后进入建行总行从事应用架构和安全架构管理工作;16年加入百度,任主任架构师(T9),兼百度云技术部TC主席,是百度飞桨AI Studio第一任产品经理;18年加入贝壳找房,任高级总监,从零搭建贝壳找房的信息安全和业务风险治理体系;23年初创立欧冶科技,23年8月获得苹果资本天使轮融资,目前PreA轮融资进行中,由非凡资本服务。
现在,豆包大模型团队联合北京交通大学、中国科学技术大学提出了VideoWorld。
科技巨头Meta和微软相继公布了各自截至12月31日的最新季度财报。
当谷歌在 2018 年推出 BERT 模型时,恐怕没有料到这个 3.4 亿参数的模型会成为自然语言处理领域的奠基之作。
1月13日Mainframe公司发布了可以离线运行在苹果系统(Mac,iPad,iPhone)的本地大语言模型fullmoon: local intelligence
近日,在《金融时报》主编 Roula Khalaf 的最新采访中,谷歌 DeepMind 的 CEO、2024 年诺贝尔化学奖得主 Demis Hassabis 放出了一连串重磅消息
首个FP4精度的大模型训练框架来了,来自微软研究院!
2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。
"Deepseek R1不就是一个参数更大的语言模型吗?随便问问题就行了,还需要什么特殊技巧?"——当你说出这句话时,是否意识到自己正像《西游记》里高举紫金葫芦的妖怪,对着齐天大圣叫嚣:"我叫你的名字,你敢答应吗?"
他们急了!特朗普的AI沙皇和微软纷纷指控DeepSeek「偷窃」数据,DeepSeek不断遭受来自美国IP的不间断大规模攻击。Anthropic CEO更是发出檄文:再不加强对中国的芯片管制,就来不及了!
五角大楼的90天AI计划,正式启动了。美国印太司令部将在实验中,评估AI在现实军事场景中对抗我国等高科技对手的潜力。据悉,重点集中在海军应用上。
相比LLM和Agent领域日新月异、高度成熟的进展相比,数据收集方面的规范有明显滞后。由超过50名研究人员组成的「数据溯源计划」(DPI)旨在回答这样一个问题:AI训练所需的数据究竟来自何处?
这个春节,国产AI引发全球轰动,一家叫做DeepSeek的初创科技公司发布了一款推理模型,不仅能力不输OpenAI的o1,训练成本也远低于国外,各行各业更是跟风尝试。1月27日,DeepSeek超过ChatGPT,成为苹果商店美国区免费应用榜单第一,也登顶中国区免费榜,由于用户突然涌入太多,还出现了短暂宕机。
梁文锋带领着DeepSeek,还在继续搅动大模型行业。继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。
过去一个月,我用AI完成了所有文字工作。从视频脚本、公众号长文,再到整活,我主业和副业的所有工作,几乎全是用AI写的。
据参考消息援引美媒报道,美国海军基于“潜在安全和道德问题”,已要求人员避免以任何形式使用中国公司的DeepSeek模型。另据@玉渊潭天 消息,当地时间1月28日,美国多名官员回应DeepSeek对美国的影响,表示DeepSeek是“偷窃”,正对其影响开展国家安全调查。
时隔7年,阿里巴巴再次成为春晚上“最靓的仔”。据了解,阿里云主要为春晚提供两部分技术支持:一是阿里云云转播技术支持全球华人云上看春晚,二是阿里云通义大模型技术支持春晚节目创新,创造全新的视听效果。此前,阿里云已连续多年为央视总台提供护航服务,保障春晚稳定直播。
DeepSeek、迅雷、虎扑其实都在思考同一个问题:数字时代发展到当下,科技行业应该何去何从?龙年年底,科技界和体育界分别迎来两宗大事件——2025年1月20日,DeepSeek-R1开源人工智能模型发布;2025年1月27日,迅雷宣布作价5亿元人民币收购体育媒体及数据平台虎扑。
DeeSeek R1横空出世撼动了整个硅谷,这波AI恐惧仍在蔓延扩散。奥特曼、OpenAI首席研究官不得不发文承认DeeSeek的技术突破,预告未来会加快新模型的发布。与此同时,研究人员们也纷纷展开了对DeepSeek技术的深入分析。
世界首个不用编码AI工程师Heyboss横空出世!一句话创建超级应用,99%人也能当程序员。最近,初创Heyboss AI官宣了AI非编码工具Heyboss,专为代码小白量身打造。
基于一段文本提问时,人类和大模型会基于截然不同的思维模式给出问题。大模型喜欢那些需要详细解释才能回答的问题,而人类倾向于提出更直接、基于事实的问题。
「除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。
由港科广、中南、西湖大学、UIUC、新加坡国立大学、上海 AI Lab、宾夕法尼亚大学等团队联合发布的首篇聚焦医疗领域具身智能的综述论文《A Survey of Embodied AI in Healthcare: Techniques, Applications, and Opportunities》正式上线,中南大学刘艺灏为第一作者
硬件媒体Tom‘s Hardware带来开年最新热议:DeepSeek甚至绕过了CUDA,使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。
昨晚,杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。
RAG系统的搭建与优化是一项庞大且复杂的系统工程,通常需要兼顾测试制定、检索调优、模型调优等关键环节,繁琐的工作流程往往让人无从下手。
今天(1月28日)凌晨,国内火爆的AI大模型公司深度求索(DeepSeek)称遭受大规模恶意攻击。据悉,DeepSeek旗下AI(人工智能)服务在24小时内经历多次宕机。