# 热门搜索 #
搜索
全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业
8959点击    2024-07-10 18:14

全球首个专为芯片设计专用的AI开源大模型诞生了!


今天,在Semicon West 2024大会上,Aitomatic发布了首个SemiKong半导体行业设计的新模型,将革新半导体工艺和制造技术。


SemiKong是由Aitomatic与FPT Software合作开发,在处理行业特定任务时,表现优于通用大模型,如GPT和 Llama 3。



https://www.semikong.ai/


这家公司表示,SemiKong有望在未来五年内,重塑价值5000亿美元的半导体行业。


LeCun大佬随即转发了这一开源芯片设计的AI模型。



新模型的代码权重已经放在的Hugging Face、GitHub上,供所有人下载。




地址:https://github.com/aitomatic/semikong?tab=readme-ov-file


Aitomatic的CEO Christopher Nguyen表示,公司选择开源的做法,在因竞争保密而臭名昭著的半导体行业,属于史无前例的一件大事!


在他们看来,在基础层共享研发成功的好处,远远超过保密带来的价值。同时,他们也希望看到在公司/工具/工艺/设备特定层以上的专有差异化和竞争。


最后,CEO感谢了为这种工业规模合作做出贡献的AI Alliance成员,并且着重感谢了Llama-3这样的开源基础模型,同时向LeCun等人表示致意。



Llama 3微调,8B参数


根据官网的介绍,SemiKong模型专门接受过半导体领域知识的训练。


它基于Llama 3 Instruct微调而来。从放出的代码权重,可以看出SemiKong有8B的参数。


SemiKong的训练过程主要分为3个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。


在行业相关的基准上,SemiKong优于许多通用LLM。而且,为那些打造适合自身的专有模型的芯片公司,提供了一个有价值的基座。



SemiKong在准确性、相关性和对半导体工艺的理解上,得到了显著的改进。


如今业内愈发公认,即使是小模型,在特定领域的应用中也能超越更大的通用模型。


显然,无论是在加速创新还降低成本方面,8B的SemiKong在整个半导体价值链中都潜力极大。


CEO Christopher Nguye在一份声明中表示,「SemiKong将重新定义半导体制造。由AI Alliance推动的这种开放创新模式,利用了集体智慧来应对行业特定的挑战。在Aitomatic,我们正使用SemiKong创建特定领域的AI智能体,以前所未有的效率解决复杂的制造问题」。



SemiKong的出现,可以逐渐降低半导体生产成本,未来几年内消费者可能会看到更强大的智能手机、笔记本电脑和智能家居设备以更低的价格上市。


下一个更强大的SemiKong版本计划在今年12月推出,首个针对工艺特定模型预计在9月发布。


半导体行业,进入新时代


SemiKong的诞生,背后离不开人工智能联盟的托举。


而CEO Christopher Nguyen本人,也是AI Alliance的领导者之一。


IBM 研究院AI开放创新负责人Anthony Annunziata强调:「AI联盟的开放协作模式,是实现这一突破的关键。SemiKong DRAFT v0.6的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。」


与之相关的业内人士,纷纷对SemiKong予以极高的赞许。


东京电子与人工智能联盟产品生命周期管理总监Atsushi Suzuki表示:「作为与人工智能联盟合作的行业专家,我相信SemiKong代表着人工智能在半导体制造领域的应用向前迈出了重要一步。」


东京电子公司的高级专家、半导体的早期提出者Daisuke Oku表示:「SemiKong是半导体开源人工智能一段激动人心旅程的开始。Aitomatic的创新方法,有潜力为我们的行业带来巨大飞跃。」


FPT Software首席人工智能官Phong Nguyen表示:「FPT Software很高兴能够成为其中的一部分,我们渴望探索该模型的潜在应用,特别是激发全球人工智能和半导体的融合。我们相信,我们的参与将巩固FPT Software作为全球半导体行业未来领跑者的地位。」


文章来源于“新智元”,作者“新智元


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner