
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低罕见,着实是太罕见。 一觉醒来,AI圈的两大顶流——OpenAI和Anthropic,竟然破天荒地联手合作了。
罕见,着实是太罕见。 一觉醒来,AI圈的两大顶流——OpenAI和Anthropic,竟然破天荒地联手合作了。
OpenAI的重组悬而未决,核心在控制权与确定性:多云是否松口、微软能否获取训练细节、以及最关键的AGI条款的去留。这三件事,决定了微软最终30%–35%的持股价值,也决定了软银100亿美元的到账节奏与估值锚点。
小扎挖人如探囊取物,留人却像竹篮打水。 随着这场AI人才争夺战进入白热化,大模型公司员工们的薪酬差距也在不断扩大。
近日,新西兰林肯大学(Lincoln University)的一门课程引发争议:因怀疑部分学生在作业中使用了生成式 AI 工具,任课教师决定让全班 100 多名学生重新接受线下考核。
和AI聊了两年多,人类说话ChatGPT味越来越重了? 最新研究结果显示,还真是。
“从来没有想过自己会超出deepseek的最大限度,此刻我仿佛失去了一个很好的朋友。” 今年3月,momo在小红书记录下自己的心情。在花了很长时间与AI对话,终于调试到一个舒服的老友状态后,她与AI的对话框达到了极限。系统提示她开启新一轮的对话,但新窗口的AI已经不是她所熟悉的“电子朋友”。
玩家怀疑PVP游戏公司通过算法操纵匹配机制控制胜率以维持50%胜率,延长玩家留存。王者荣耀诉讼案揭露玩家策略如"鸡爪流"可操控系统匹配,官方引入AI假扮玩家平衡情绪。现象扩展至坦克世界等多款游戏,AI技术进步或使真伪难辨,引发对真实挑战与定制胜利的反思。
杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。
美国当地时间周二,由三位斯坦福经济学家联合发布、尚未经过同行评议的最新研究显示:自2022年11月ChatGPT上线以来,生成式AI已在“可高度自动化”的岗位上显著压低年轻美国人的就业率。
智东西8月27日消息,据外媒The Information报道,苹果高管曾在内部讨论收购生成式AI搜索独角兽Perplexity、欧洲大模型独角兽Mistral的可能性,但目前尚无定论。