大模型不稀奇,现在开始卷「小模型」了?

Geekpark.net - 3 de fevereiro de 2024

大模型不稀奇,现在开始卷「小模型」了?

在通往 AGI 的路上,绝大多数公司的路线是不断做大参数,但面壁智能却走了一条相反的路线——尽可能把模型参数做小。 2 月 1 日,面壁智能推出了只有 2B(注:20 亿)参数量级的模型 MiniCPM,而其性能却超过了大参数模型 Mistral-7B(法国大模型公司 Mistral 旗下知名模型)、且部分超越 Llama-13B(Meta 旗下知名开源大模型)等,内部称之为「以小博大」。 这个结果揭露了这样一个事实:很多超大参数的大模型,它们的模型效率或许并没有最大化。 「我们希望探索模型性能的天花板。」面壁智…

Ver Notícia Completa
Análise Internacional

Outras Notícias Relevantes

Primeiro Passo

Bem Vindo

Ao se cadastrar, você declara que concorda com nossos termos de uso e políticas de privacidade.
Oportunidades Hoje

Aproveite

Seu Passaporte para Investimentos Globais

O Ivar recomenda o banco Swissquote para seus investimentos internacionais. Ao abrir sua conta pelo link abaixo e negociar 5 lotes ou mais, você ganha $200 para usar no Ivar AI e ativar sua assinatura. Aproveite essa vantagem exclusiva disponível hoje!

Swissquote

Oferta disponível para você que ainda não abriu sua conta no Swissquote.
Serviços disponíveis globalmente excetuando apenas os seguintes países: Argélia, Bélgica, Canadá, China, Coreia do Norte, EUA, França, Hong Kong, Irã, Iraque, Nigéria, Singapura, Síria, Turquia e Zimbábue.