最近,7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后,Mistral今天又发布了两个7B模型,分别是针对STEM学科的Mathstral,以及使用Mamaba架构的代码模型Codestral Mamba。
最近,7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后,Mistral今天又发布了两个7B模型,分别是针对STEM学科的Mathstral,以及使用Mamaba架构的代码模型Codestral Mamba。
根据《金融时报》的报道,法国AI初创公司Mistral AI在最新一轮融资中筹集了6亿欧元,这家刚成立一年的公司估值达到60亿欧元,半年内估值翻三倍,并获得了英伟达、微软、Salesforce等公司的支持。
开源代码大模型的王座,再次易主! 来自素有“欧洲OpenAI”之称的Mistral,用22B参数量表现超越了70B的Code Llama。
就在刚刚,法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言,而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前,已经开放API与IDE插件供用户使用。
近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。
腾讯科技讯 5月9日消息,据国外媒体报道,援引知情人士周四透露,法国人工智能初创公司Mistral AI将以60亿美元的估值,从包括General Catalyst和Lightspeed Venture Partners在内的投资者手中筹集约6亿美元资金。Mistral AI在本轮融资中的最新估值几乎是半年前估值的近三倍。
大模型又又又被曝出安全问题!
我们知道,Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 实验室推出的 Jamba 等开源大语言模型已经成为 OpenAI 的竞争对手。
对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。