野蛮生长后,AI大模型还需要重复“造轮子”?
野蛮生长后,AI大模型还需要重复“造轮子”?我们塑造了工具,此后工具也塑造了我们。
搜索
我们塑造了工具,此后工具也塑造了我们。
一直以来,大模型的编程能力都备受关注,超强 AI 程序员 Devin 的问世更是将「AI 能否替代程序员」这一话题推上了风口浪尖。最近,Devin 也迎来了新对手 —— 初创公司 Cosine 推出的自主 AI 程序员 Genie。该公司表示,Genie 的表现轻松超越了 Devin,在第三方基准测试 SWE-bench 上的得分为 30%,而 Devin 的得分仅为 13.8%。
上海交通大学王德泉教授课题组在最新研究中提出了这样的一个问题。
苹果团队,又发布了新的开源成果——一套关于大模型工具调用能力的Benchmark。
在 GPT-4o 进 iPhone 之前,谷歌 Gemini 抢先了一步完成了手机版的落地。 周三凌晨,在人们期待 OpenAI 「草莓大模型」的时候,谷歌在 Made by Google 活动上正式发布了 Gemini Live,以及一系列 Pixel 硬件产品。
哎鸭,鸭鸭摔倒了!
翻车,大翻车。
最近,OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个月,以它为前身、代号为「草莓(Strawberry)」的项目又被曝光了。据推测,该项目能够提供高级推理能力。
价值不在于模型,价值在于创造模型的人。
全球首个AI流媒体音乐App,就这么水灵灵的来了。
AI应用,出海凶猛。
谁是万亿搜索赛道上的赢家?
AI在现实工作环境中如何影响了工作效率?微软发起一项最大规模的调查研究,AI工具在工作场景中最大提效30%。
昆仑万维发布AI音乐平台Melodio和Mureka。
知识管理工具,如何走向AI时代?
近日,来自佐治亚理工学院的研究人员开发了RTNet,首次表明其「思考方式」与人类非常相似。
天网离我们还有多远?现在,科学家们希望通过一个强大的超算网络,来加速发展人类级别的人工智能,预计在2025年前全面投入运行。
AI文生视频领域,几乎只剩Sora还是个期货了。
Strawberry 的所有炒作都结束了。
直接和间接变现,哪个更好?
争论并不能否定彼此的市场价值,两种市场需求会长期共存
技术在进步,人们在质疑
表情、手指、细节,堪比真人照片。
长文本处理能力对LLM的重要性是显而易见的。在2023年初,即便是当时最先进的GPT-3.5,其上下文长度也仅限于2k,然而今日,128k的上下文长度已经成为衡量模型技术先进性的重要标志之一。那你知道LLMs的长文本阅读能力如何评估吗?
我把这些论文的作者们——来自不同AI领域、几大研究派系的那些熠熠生辉的名字,作了详细的统计、分类。
6 月,Gamma 创始人 Grant Lee 官宣,Gamma 在过去一年新增了 2000 万个用户。他们在 5 月份刚完成一笔 1200 万美元的融资。
大家还记得 Stable Diffusion嘛,就是那个曾经和 DALL·E 、 Midjourney 齐名的图像生成 AI 。
对于Apple Intelligence,苹果的策略极有可能是先免费、再付费。
最近,AI公司跟用户之间的冲突与矛盾,变得越来越多越来越大了。
谷歌版Her落地了!AI硬件全家桶深夜发布,现场提了近百次AI。