GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」
GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」智能体在模拟人类合作行为的捐赠者游戏中表现出不同策略,其中Claude 3.5智能体展现出更有效的合作和惩罚搭便车行为的能力,而Gemini 1.5 Flash和GPT-4o则表现得更自私,结果揭示了不同LLM智能体在合作任务中的道德和行为差异,对未来人机协同社会具有重要意义。
智能体在模拟人类合作行为的捐赠者游戏中表现出不同策略,其中Claude 3.5智能体展现出更有效的合作和惩罚搭便车行为的能力,而Gemini 1.5 Flash和GPT-4o则表现得更自私,结果揭示了不同LLM智能体在合作任务中的道德和行为差异,对未来人机协同社会具有重要意义。
现在定义具身智能的L1-L5级没有意义,核心标准还是我们的机器人能解决哪些实际问题。 具身智能趋势大热,敢于给断言的人不多,高阳是一个。
近日,Steve Sokolowski公布了首个由OpenAI o1 pro指导的诉讼,包含工作流、提示词、法庭模拟等诸多细节。由于九成净资产已被骗走,Steve已无力支付80万美元的相关起诉费用。他选择使用AI指导案件,成功打破法律的闭环,已做好法院开庭的准备,并表示对结果非常乐观。
AI 需要的钱,可比造车要多多了。
复旦大学等机构的研究人员最新提出的AI内容检测器ImBD涵盖多任务检测(润色、扩写、改写、纯生成),支持英语、中文、西班牙语、葡萄牙语等多种主流语言;仅需500对样本、5分钟训练时间,就能实现超越商用检测器!
穿越重重迷雾,OpenAI模型参数终被揭开!一份来自微软华盛顿大学医疗论文,意外曝光了GPT-4、GPT-4o、o1系列模型参数。让所有人震惊不已的是,GPT-4o mini仅8B。
GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~ 名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。
OpenAI发布旗舰推理模型o3和o3-mini,成为他们2024年的收官之作,制造了一波小热潮。和往常一样,Twitter (x.com)依然是外网讨论的主阵地。
奥特曼说,Sora代表了视频生成大模型的GPT-1时刻。
奥特曼称他是爱因斯坦级别的天才;OpenAI总裁更是直言: 只要他想要的,我们都给。 Alec Radford大神离职OpenAI,现在牵出更多细节: 改变世界的GPT,竟然是在Jupyter notebook上诞生的。