您的位置:锦懂家 > 百态 > >正文

​“开源大模型新王者”:不是 Meta 的 Llama 2,来自这家欧洲公司

摘要“开源大模型新王者”:不是 Meta 的 Llama 2,来自这家欧洲公司 你见过比 Llama 2 参数小 10 倍、性能更好还支持开源的大语言模型吗? Mistral 7B 做到了。 根据媒体报道,Mistral 发布的 预...

“开源大模型新王者”:不是 Meta 的 Llama 2,来自这家欧洲公司

你见过比 Llama 2 参数小 10 倍、性能更好还支持开源的大语言模型吗?

Mistral 7B 做到了。

根据媒体报道,Mistral 发布的 " 预告模型 " 显示,在参数量为 Llama 2 70B 的十分之一的基础上,Mistral 7B 成功在 MT Bench 上击败了 Llama 2。

MT Bench 作为一个测试降准,由 80 个高质量的多轮对话问题组成,旨在测试多轮对话和指令遵循能力。

这意味着大语言模型(LLM)终于在参数尺寸和性能平衡的问题上找到了一个解决方案。据官方介绍,Mistral 7B 在所有标准英语和代码基准测试中的性能优于当前可用的高达 13B 参数的 LLM。

今年 9 月,刚刚成立 6 个月的法国 AI 公司 Mistral AI 正式发布 Mistral 7B;上周,作为唯一一家欧洲公司,Mistral AI 参加了 10 月在英国举办的人工智能工程师峰会,与 OpenAI、谷歌、Meta 等科技巨头同台。

" 技术先驱 "

专业度让 Mistral 成为 AI 投资界的新宠儿。

Mistral 的创始人 Arthur Mensch 在接受媒体采访时表示,尽管作为一家年轻的初创公司,但 Mistral 对标的是包括谷歌、OpenAI 在内的整个 AI 行业:

" 我们一直是这项技术的先驱。"

" 我们与所有人竞争。"

Mistral 官方这样形容 Mistral 7B 的成长速度:

" 两年内,它从 Gopher 到 Chinchilla,再到 Llama 2,以及 Mistral 7B。"

其中:Gopher 由 DeepMind 于 2021 年推出,280B 参数量;Chinchilla 由 DeepMind 由于 2022 年推出,70B 参数量;Llama 2 由 Meta 于 2023 年 7 月推出,34B 参数量。

目前,有消息称 a16z 考虑向 Mistral 投资 2.5 亿美元。据直接了解谈判情况的人士透露,包括 General Catalyst 和 Andreessen Horowitz 在内的硅谷重量级企业正在考虑出资 4 亿欧元,这可能会推升 Mistral 的估值达到 15-20 亿欧元

Lightspeed Venture Partners 的合伙人安托万 · 莫伊鲁德 ( Antoine Moyroud ) 主导了 Mistral 的第一轮融资,他表示:" 他们的表现超出了我们的内部预期," 并补充道 " 对这项业务越来越感到兴奋。"

和硅谷分庭抗礼?

目前,以谷歌、OpenAI 为首的硅谷 AI 公司正处于金字塔顶端,并不断向上谋求发展,这些硅谷公司也是大多数投资者重点关注的对象。

据悉,OpenAI 正在尝试以 860 亿美元的估值出售员工股票;Anthropic 最近收到了谷歌和亚马逊的投资承诺,投资总额可能达到 60 亿美元。

Mistral 的异军突起点亮了欧洲在 AI 领域的一盏灯。

因为市值超过 10 亿欧元的公司在欧洲更为稀缺,而此前法国总统马克龙也多次暗示对 AI 领域的雄心勃勃,希望能够培育欧洲本土的 AI 企业。

Mistral 的优势不止于技术面,Mensch 曾表示,相对于规模更大、资金更充足的竞争对手,Mistral 在效率上更有优势。

他表示,该公司仅用 10 人的团队就推出了第一个 LLM 模型,培训成本不到 50 万美元,而竞争对手则花费了数千万美元。他补充道:" 我们很高兴成为资本效率最高的 LLM 公司。"

另一个优势在于开源。因 Mistral 公开发布其 AI 模型,支持 Apache 2.0 开源协议,这能够使企业客户更好地控制他们的数据,对其中的使用过程可见性更高,并且能够吸引开发领域的专业人才。

不过,尽管 Mistral 在 6 月的种子轮融资中获得了创纪录的 1.05 亿欧元,但其目前尚未盈利。Mensch 表示这种情况将在 " 年底前 " 发生改变,他预计将发布一个新平台供客户访问其 LLM 模型。

Mitral 投资方之一的 New Wave 的合伙人皮亚 · 德伊里巴内 ( Pia d'Iribarne ) 表示,建立大型人工智能企业的 " 基本面已经具备 "。


标签:

推荐阅读