OpenDevin出技术报告了,大模型Agent开发者必读
OpenDevin出技术报告了,大模型Agent开发者必读今年 3 月,「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是,Devin 并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。
今年 3 月,「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是,Devin 并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。
这么强的模型,谷歌给大家免费试用。
起猛了,GPT-4o被谷歌新模型超越了!
斯坦福大学心理学系研究科学家赵轩博士开发了一款人工智能心理疗愈 Agent——Sunnie,它具备多轮自然对话的能力,能够基于大语言模型推荐个性化活动。
我最近有一个很大的习惯转变:最早有问题是问百度,后来问小红书,现在我第一个想到的是先问下AI搜索。 当下AI搜索产品也有不少了,用了一圈下来,最后还是留下了三款能常驻我的使用序列里的产品。
今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。
谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。
Agent的记忆实现和调用是提高Agent智能水平的关键。
最近一段时间开源大模型市场非常热闹,先是苹果开源了70亿参数小模型DCLM,然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源,在多项基准测试中Llama 3.1超过了闭源SOTA模型。 不过开源派和闭源派之间的争论并没有停下来的迹象。
这两天,Apple Intelligence 的上线成为了最大的科技新闻之一。