大模型不稀奇,现在开始卷「小模型」了?

Geekpark.net - 3 Φεβρουαρίου 2024

大模型不稀奇,现在开始卷「小模型」了?

在通往 AGI 的路上,绝大多数公司的路线是不断做大参数,但面壁智能却走了一条相反的路线——尽可能把模型参数做小。 2 月 1 日,面壁智能推出了只有 2B(注:20 亿)参数量级的模型 MiniCPM,而其性能却超过了大参数模型 Mistral-7B(法国大模型公司 Mistral 旗下知名模型)、且部分超越 Llama-13B(Meta 旗下知名开源大模型)等,内部称之为「以小博大」。 这个结果揭露了这样一个事实:很多超大参数的大模型,它们的模型效率或许并没有最大化。 「我们希望探索模型性能的天花板。」面壁智…

Δείτε το πλήρες άρθρο

Πληκτρολογώντας...

Διεθνής Ανάλυση

Άλλες Σημαντικές Ειδήσεις

Πρώτο Βήμα

Καλώς ήρθατε

Με την εγγραφή σας, δηλώνετε ότι συμφωνείτε με τους όρους χρήσης και την πολιτική απορρήτου μας.
Ευκαιρίες Σήμερα

Αξιοποιήστε

Το Διαβατήριο σας για Παγκόσμιες Επενδύσεις

Ο Ivar προτείνει την τράπεζα Swissquote για τις διεθνείς επενδύσεις σας. Αν ανοίξετε λογαριασμό μέσω του παρακάτω συνδέσμου και εμπορεύεστε 5 ποσά ή περισσότερα, κερδίζετε $200 για χρήση στο Ivar AI και για να ενεργοποιήσετε τη συνδρομή σας. Αξιοποιήστε αυτό το αποκλειστικό πλεονέκτημα που είναι διαθέσιμο σήμερα!

Swissquote

Προσφορά διαθέσιμη για εσάς που δεν έχετε ακόμα ανοίξει λογαριασμό στο Swissquote.
Υπηρεσίες διαθέσιμες παγκοσμίως εκτός από τις ακόλουθες χώρες: Αλγερία, Βέλγιο, Καναδάς, Κίνα, Βόρεια Κορέα, ΗΠΑ, Γαλλία, Χονγκ Κονγκ, Ιράν, Ιράκ, Νιγηρία, Σιγκαπούρη, Συρία, Τουρκία και Ζιμπάμπουε.