ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用ChatGPT写代码的最佳姿势。
搜索
6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用ChatGPT写代码的最佳姿势。
冲锋在AI辅助数学研究第一线的陶哲轩,近日又有「神总结」:ChatGPT提升的,是我们在编码、图表等次要任务上的能力;而真要搞好数学研究,基础不扎实的话,AI也是没用的。
GPT-4o的“AI视频通话”一鸽再鸽,但网友却是急不可耐想要体验。
支付宝医疗大模型亮相!
给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!
大模型之争,到了不只是拼技术的时刻。
估值 125 亿美元的设计工具 Figma 发布了备受瞩目的 AI 辅助设计功能,又在几天之后迅速禁用了它。直接原因是,有用户发推表示,它生成的 APP UI 明显「抄袭」了苹果。
2024 年,为何期待已久的 AGI 应用大爆发迟迟没有来临?
批评不仅能让人进步,也能让大模型的能力提升。
“这可能是本届WAIC上欢呼声最多的一场发布”
随着AGI这一生产力背后的生产力的进一步发展进化,我们也期待通过不断的努力和探索,推动AGI的技术突破和价值实现,为人类社会创造更多的福祉。
市值140亿美元的初创公司Scale AI正在招聘博士训练LLM,用人成本的升高让该公司的毛利率在2023年有所下降,但创始人Alexandr Wang预计今年营收将增加两倍,突破十亿美元。
现实中,机器人收据收集可以通过远程操控实现。来自UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身临其境操作机器人,即便相隔3000英里之外。
ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
7 月 4 日下午,由世界人工智能大会组委会办公室指导,世界人工智能大会组委会办公室主办,国家地方共建人形机器人创新中心、中国电子学会承办,机器之心、《机器人技术与应用》杂志协办的 2024 WAIC 世界人工智能大会人形机器人与具身智能发展论坛将于 7 月 4 日下午在上海世博展览馆举行。
今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。
大模型产业发展,需要可信中立的数据深加工平台,如何填补空白?
海明威的《太阳照常升起》中,迈克·坎贝尔说出了那个简短的名言:“逐渐地,然后突然地”( Gradually,and then suddenly)。
想象一下你在刷短视频,系统想要推荐你可能会喜欢的内容。
两分钟端到端从需求到应用,WAIC上这个国产开发神器火了!
什么?现在公务员处理政务,也都能用上模型了???
做最有挑战的事:把生成式 AI 送到每个人手上。
AI到底应该是什么样的
WPS AI如何重塑办公?
OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。
只要10k数据,就能让大模型的数学成绩增长5.6%。
AIGC时代,视频创作这事儿真的不一样了。
没等到GPT-4o,商汤先把《Her》给发布出来了!
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。