大模型不稀奇,现在开始卷「小模型」了?

Geekpark.net - 2024년 2월 3일

大模型不稀奇,现在开始卷「小模型」了?

在通往 AGI 的路上,绝大多数公司的路线是不断做大参数,但面壁智能却走了一条相反的路线——尽可能把模型参数做小。 2 月 1 日,面壁智能推出了只有 2B(注:20 亿)参数量级的模型 MiniCPM,而其性能却超过了大参数模型 Mistral-7B(法国大模型公司 Mistral 旗下知名模型)、且部分超越 Llama-13B(Meta 旗下知名开源大模型)等,内部称之为「以小博大」。 这个结果揭露了这样一个事实:很多超大参数的大模型,它们的模型效率或许并没有最大化。 「我们希望探索模型性能的天花板。」面壁智…

전체 뉴스 보기
국제 분석

기타 중요 뉴스

첫걸음

어서 오십시오

가입하면 당사의 이용 약관과 개인 정보 보호 정책에 동의하는 것으로 간주됩니다.
오늘의 기회

즐기다

글로벌 투자를 위한 여권

Ivar는 국제 투자를 위해 Swissquote 은행을 권장합니다. 아래 링크를 통해 계정을 연 후 5개 이상의 로트를 거래하면 Ivar AI에서 사용할 $200을 받을 수 있고 구독을 활성화할 수 있습니다. 오늘 제공되는 이 독점 혜택을 놓치지 마세요!

Swissquote

스위스쿼트(Swissquote)에서 아직 계정을 개설하지 않은 경우에만 해당하는 특별 혜택입니다.
글로벌로 제공되는 서비스 다음 국가들을 제외하고: 알제리, 벨기에, 캐나다, 중국, 북한, 미국, 프랑스, 홍콩, 이란, 이라크, 나이지리아, 싱가포르, 시리아, 터키 및 짐바브웨.