又是一年一次的WWDC,北京时间6月11日凌晨,WWDC24主题演讲正式开启。按照惯例,每年的WWDC上,苹果都会带来一众软硬件新品。
又是一年一次的WWDC,北京时间6月11日凌晨,WWDC24主题演讲正式开启。按照惯例,每年的WWDC上,苹果都会带来一众软硬件新品。
大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。
AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。
近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。
阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强。
开源大模型全球格局,一夜再变。
一夜之间,全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世,火速杀进开源LLM排行榜第一,美国最强开源模型Llama3-70B直接被碾压!全球开发者粉丝狂欢:果然没白等。
大模型领域,开源与闭源之争一直是技术和产业界关注的焦点。阿里云通义千问最新发布的Qwen2系列模型,为这场争论提供了最新的答案。
Qwen 系列会是众多大学实验室新的默认基础模型吗? 斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。
AI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波——