成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。
就在今天,OpenAI紧跟着谷歌Gemini 2.0的发布,把ChatGPT Search给全面开放了。不需要注册登录,用法和传统搜索引擎一样。
DeepSeek会是国内首个挑战ChatGPT,重塑AI助手现有格局的产品吗?从产品数据来看,值得期待。在APP端,DeepSeek上线半个月,就在新增下载量上超越了ChatGPT,并将百万级的领先优势持续至今。截至2月5日,DeepSeek的全球下载量已接近4000万。
本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。
随着计算性能不断提升,技术融合趋势愈发显著,人工智能、机器人技术、储能技术、公共区块链和多组学测序这五个创新平台正重塑各个行业。在AI投资方面,木头姐明确表示她正在远离硬件和基础设施,加倍投资软件。
36氪获悉,「乐享科技」于近期完成天使轮融资本轮融资由IDG资本领投,Monolith、经纬创投、真格基金、红杉种子基金、绿洲资本跟投,融资总金额接近2亿元人民币,投后估值约为6亿元
2月5日,彭博社报道,韩国代理总统崔相穆周三表示,DeepSeek的最新人工智能模型有可能重塑产业格局,并预测说,“这是一个新的冲击”。韩国政府将尽快成立一个“国家人工智能委员会”,以使韩国成为全球三大人工智能领先国家之一。
2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。
瑞士金融科技公司Aisot Technologies(下文简称Aisot)成立于2019年,公司致力于开发AI资产管理软件。该软件完全由AI驱动,能够根据设定的投资偏好自动生成投资组合并实时优化管理,在降低投资风险的同时提升投资回报。
2024年春节,我其实已经尝试过用AI的介入,来完成一些原本长辈需要我才能完成、但实际上并没有什么难度的问题。例如帮助长辈学习如何用提示词(Prompt),使用类似“什么问题+细节描述+发生场景+附加需求”这样的结构来获得更准确的回复,或是发掘一些AI App中自带的例如一键P图等功能。