大模型不稀奇,现在开始卷「小模型」了?

Geekpark.net - 3 февруари 2024 г.

大模型不稀奇,现在开始卷「小模型」了?

在通往 AGI 的路上,绝大多数公司的路线是不断做大参数,但面壁智能却走了一条相反的路线——尽可能把模型参数做小。 2 月 1 日,面壁智能推出了只有 2B(注:20 亿)参数量级的模型 MiniCPM,而其性能却超过了大参数模型 Mistral-7B(法国大模型公司 Mistral 旗下知名模型)、且部分超越 Llama-13B(Meta 旗下知名开源大模型)等,内部称之为「以小博大」。 这个结果揭露了这样一个事实:很多超大参数的大模型,它们的模型效率或许并没有最大化。 「我们希望探索模型性能的天花板。」面壁智…

Виж цялата новина
Международен анализ

Други Важни Новини

Първа стъпка

Добре дошли

При регистрацията си вие потвърждавате, че сте съгласни с нашите условия за ползване и политиката ни за поверителност.
Възможности днес

Използвайте

Вашият паспорт за глобални инвестиции

Ивар препоръчва банката Swissquote за вашите международни инвестиции. Като отворите сметка чрез линка по-долу и търгувате с 5 лота или повече, ще получите $200 да използвате в Ivar AI и да активирате абонамента си. Възползвайте се от това ексклузивно предимство, налично днес!

Swissquote

Предложението е налично за вас, които все още не сте отворили сметка в Swissquote.
Услугите са достъпни глобално с изключение на следните държави: Алжир, Белгия, Канада, Китай, Северна Корея, САЩ, Франция, Хонконг, Иран, Ирак, Нигерия, Сингапур, Сирия, Турция и Зимбабве.