AI资讯新闻榜单内容搜索-EVI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: EVI
OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

OpenAI o1「作弊」修改系统,强行击败专业象棋AI!全程无需提示

在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。

来自主题: AI技术研报
8474 点击    2025-01-01 17:28
我用8道变态烧脑题,测出了o1的国内最强平替

我用8道变态烧脑题,测出了o1的国内最强平替

我用8道变态烧脑题,测出了o1的国内最强平替

我本来以为今年的模型考核就到这儿了,没想到老朋友智谱在 2024 年最后一天又整活儿了,突然就发布了 GLM 系列的类 o1 模型——GLM-Zero-Preview。

来自主题: AI资讯
8258 点击    2025-01-01 12:45
不到1年做出两款出圈AI小游戏,这个小团队就想做“一波流”?

不到1年做出两款出圈AI小游戏,这个小团队就想做“一波流”?

不到1年做出两款出圈AI小游戏,这个小团队就想做“一波流”?

AI初创团队狸谱,过去半年间,他们接连推出两款新奇的AI小游戏,在二次元圈和AI圈颇受关注。我们联系到狸谱产品增长负责人Levi,聊了聊AI赛道“一波流”产品的魅力,以及他们打造这些破圈小游戏背后的产品增长经验。

来自主题: AI资讯
8590 点击    2024-12-27 17:18
推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。

来自主题: AI资讯
8612 点击    2024-12-20 16:07
全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

Devin 是一种全新的 AI 编程,他和 Cursor 还有 Windsurf 的区别在于,Devin 不需要你来操作,你只需要告诉他要做什么。

来自主题: AI产品测评
10909 点击    2024-12-13 10:53
28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

全球首个AI程序员Devin正以其自主编码、快速学习的超凡能力,挑战传统程序开发的边界。它不仅让投资界为之疯狂,更让程序员们既期待又警惕。这是技术革命的黎明,还是就要被颠覆的工作landscape?

来自主题: AI资讯
7286 点击    2024-12-04 15:12