متا ادعا میکند مدل جدید هوش مصنوعی «واترملون» با GPT-5.5 اوپنایآی برابری میکند
متا از «واترملون»، یک مدل هوش مصنوعی با وزن باز که مدتها انتظارش میرفت، رونمایی کرده است. گزارشها حاکی از آن است که این مدل عملکردی مشابه با پرچمدار اوپنایآی، یعنی GPT-5.5، دارد. این انتشار با ارائه قابلیتهای سطح بالا به توسعهدهندگان به صورت رایگان، چشمانداز هوش مصنوعی تجاری را تهدید به دگرگونی میکند.
به قلم تیم سردبیری کوهستان
این خبر را به اشتراک بگذارید
- حامیان متنباز
- استدلال میکنند که انتشار مدلهای پیشرفته، فناوری را دموکراتیک میکند، انحصارهای شرکتی را میشکند و نوآوری جهانی را تسریع میبخشد.
- آزمایشگاههای تجاری هوش مصنوعی
- هشدار میدهند که متنباز کردن هوش مصنوعی بسیار پیشرفته، حفاظهای ایمنی حیاتی را حذف کرده و بازیگران مخرب را توانمند میسازد.
- محققان مستقل هوش مصنوعی
- نسبت به معیارهای شرکتی شک و تردید دارند و بر نحوه عملکرد مدل در کاربردهای واقعی و بدون سناریو تمرکز میکنند.
زوایای پوششدادهنشده
- · تولیدکنندگان سختافزار (انویدیا/ایامدی) که از افزایش میزبانی محلی سود خواهند برد.
- · صاحبان حق تکثیر که ممکن است دادههایشان در مراحل اولیه آموزش مدل استفاده شده باشد.
چرا مهم است
اگر یک مدل با وزن باز واقعاً با پیشرفتهترین سیستم انحصاری صنعت برابری کند، توسعهدهندگان و استارتاپها دیگر نیازی به پرداخت هزینههای گزاف API برای ساخت برنامههای کاربردی هوش مصنوعی سطح بالا نخواهند داشت. این امر قدرت را از دروازهبانان متمرکز دور کرده و دسترسی به هوش مصنوعی پیشرفته را دموکراتیک میکند.
نکات کلیدی
- متا مدل هوش مصنوعی با وزن باز «واترملون» را که دارای ۱.۸ تریلیون پارامتر است، منتشر کرد.
- گزارش شده است که این مدل در معیار MMLU امتیاز ۸۸.۴٪ کسب کرده و اندکی از GPT-5.5 اوپنایآی پیشی گرفته است.
- واترملون از معماری بسیار کارآمد «ترکیب متخصصان» (Mixture of Experts) استفاده میکند و به طور گسترده با دادههای مصنوعی آموزش دیده است.
- این انتشار به توسعهدهندگان اجازه میدهد بدون پرداخت هزینههای گران قیمت API، برنامههای هوش مصنوعی سطح بالا بسازند.
- عرضه این مدل بحثها در مورد ایمنی انتشار مدلهای پیشرفته هوش مصنوعی بدون حفاظهای متمرکز را دوباره شعلهور کرده است.
متا رسماً از «واترملون»، یک مدل عظیم جدید هوش مصنوعی رونمایی کرده است که این شرکت ادعا میکند با قابلیتهای پرچمدار اوپنایآی، یعنی GPT-5.5، برابری میکند یا از آن فراتر میرود. این مدل که تحت مجوز «وزن باز» (open-weight) منتشر شده، نشاندهنده تشدید قابل توجهی در نبرد جاری بین آزمایشگاههای هوش مصنوعی انحصاری و جامعه متنباز است.[1][2]
این اعلامیه، که از طریق وبلاگ تحقیقات هوش مصنوعی متا منتشر شد، جزئیات یک سیستم ۱.۸ تریلیون پارامتری را شرح داد که بر روی یک خوشه سفارشی متشکل از بیش از ۱۰۰,۰۰۰ واحد پردازش گرافیکی (GPU) نسل بعدی آموزش دیده است. متا با انتشار وزنها – ماتریسهای ریاضی اصلی که نحوه تفکر هوش مصنوعی را تعیین میکنند – به توسعهدهندگان اجازه میدهد تا یک مدل در کلاس پیشرفته را دانلود، اصلاح و بر روی سختافزار خود اجرا کنند.[1][3]
طی دو سال گذشته، سری GPT-5 اوپنایآی به عنوان نقطه اوج صنعت عمل کرده و به دلیل قابلیتهای پیشرفته استدلال، کدنویسی و برنامهریزی چند مرحلهای، قیمتهای ممتاز API را طلب میکرد. متا تأکید میکند که واترملون در معیار استاندارد صنعتی MMLU امتیاز ۸۸.۴٪ کسب کرده و با اختلاف کمی از امتیاز ۸۸.۱٪ GPT-5.5 پیشی گرفته است.[1][4]
سازوکار پشت این جهش شامل یک معماری بسیار بهینهسازی شده به نام «ترکیب متخصصان» (MoE) است. واترملون به جای فعال کردن تمام ۱.۸ تریلیون پارامتر برای هر درخواست، دستورات را به زیرشبکههای تخصصی هدایت میکند. این امر به مدل اجازه میدهد تا دانش گستردهای داشته باشد، در حالی که برای تولید پاسخ به قدرت محاسباتی بسیار کمتری نسبت به یک مدل متراکم با همان اندازه نیاز دارد.[6][7]
محققان اشاره میکنند که رویکرد متا در مورد دادههای آموزشی نیز با تکرارهای قبلی متفاوت است. متا در مواجهه با «دیوار داده» که به طور گسترده گزارش شده بود (یعنی اتمام متن انسانی با کیفیت بالا در اینترنت)، به شدت بر دادههای مصنوعی تولید شده توسط نسخههای قبلی مدلهای لاما (Llama) خود تکیه کرد.[2][8]
این حلقه آموزشی «خودپاداشدهنده» به هوش مصنوعی اجازه میدهد تا خروجیهای خود را قضاوت کرده و مسیرهای استدلالی خود را بدون دخالت انسان به صورت تکراری بهبود بخشد. طبق مقالات فنی همراه با انتشار، این روش برای برابری با توانایی GPT-5.5 در حل پازلهای منطقی پیچیده و نوشتن کدهای نرمافزاری آماده تولید، حیاتی بود.[1][6]
پیامدهای اقتصادی یک مدل معادل GPT-5.5 با وزن باز، عمیق است. استارتاپها و شرکتهای بزرگ در حال حاضر سالانه میلیونها دلار صرف تماسهای API به اوپنایآی، آنتروپیک و گوگل میکنند. واترملون مسیری را برای استنتاج با هزینه صفر ارائه میدهد، مشروط بر اینکه شرکتها بتوانند زیرساخت سرور لازم برای میزبانی آن را تأمین کنند.[4][5]
استارتاپها و شرکتهای بزرگ در حال حاضر سالانه میلیونها دلار صرف تماسهای API به اوپنایآی، آنتروپیک و گوگل میکنند.
استراتژی متا به طور گسترده به عنوان تلاشی برای کالاییسازی لایه مدل بنیادی در پشته هوش مصنوعی تلقی میشود. متا با رایگان کردن هوش اصلی، مدلهای تجاری رقبای اصلی خود را تضعیف میکند و در عین حال تضمین میکند که اکوسیستم گستردهتر توسعهدهندگان، ابزارها و برنامههایی سازگار با زیرساخت متا بسازند.[3][8]
با این حال، محققان مستقل هوش مصنوعی هشدار میدهند که معیارهای شرکتی را نباید به سادگی پذیرفت. در حالی که واترملون در آزمونهای استاندارد شده عالی عمل میکند، کاربرد آن در دنیای واقعی اغلب به عواملی مانند پیروی از دستورات، ظرافتهای مکالمه و تمایل مدل به «توهمزایی» (ساخت حقایق نادرست) بستگی دارد.[4][7]
ارزیابیهای اولیه شخص ثالث نشان میدهد که اگرچه واترملون در کدنویسی خام و استدلال ریاضی با GPT-5.5 برابری میکند، اما ممکن است همچنان در نگارش خلاقانه و ترجمه چندزبانه ظریف کمی عقبتر باشد. جامعه متنباز در حال حاضر برای تنظیم دقیق مدل جهت رفع این شکافهای خاص بسیج شده است.[2][7]
این انتشار همچنین بحثهای شدیدی را در مورد ایمنی هوش مصنوعی دوباره شعلهور کرده است. آزمایشگاههای تجاری مانند اوپنایآی مدتهاست استدلال میکنند که مدلهای پیشرفته باید پشت APIهای بسته نگهداری شوند تا از استفاده بازیگران مخرب برای تولید اطلاعات نادرست، کشف آسیبپذیریهای نرمافزاری یا سنتز مواد خطرناک جلوگیری شود.[5][8]
متا با انتشار وزنها، توانایی اعمال فیلترهای ایمنی سمت سرور را از بین میبرد. اگر کاربری حفاظهای ایمنی داخلی واترملون را حذف کند – فرآیندی که به «جیلبریکینگ» معروف است – هیچ کلید قطع متمرکزی برای جلوگیری از تولید محتوای مضر توسط مدل وجود ندارد.[3][5]
مدیران اجرایی متا این نگرانیها را رد کرده و استدلال میکنند که نرمافزار متنباز از لحاظ تاریخی امنتر است، زیرا به هزاران محقق مستقل اجازه میدهد کد را ممیزی کرده و آسیبپذیریها را وصله کنند. آنها معتقدند که مزایای دموکراتیک کردن هوش مصنوعی بسیار بیشتر از خطرات نظری آن است.[1][2]
گام بعدی فوری برای صنعت هوش مصنوعی، مشاهده سرعت پذیرش واترملون توسط توسعهدهندگان خواهد بود. ارائهدهندگان خدمات ابری در حال حاضر برای ارائه گزینههای استقرار با یک کلیک برای این مدل عجله دارند، که نشاندهنده تقاضای عظیم پیشبینی شده از سوی مشتریان سازمانی است که مشتاق کاهش هزینههای نرمافزاری هوش مصنوعی خود هستند.[4][8]

در نهایت، انتشار واترملون ثابت میکند که خندق اطراف هوش مصنوعی انحصاری کمعمقتر از آن چیزی است که بسیاری از سرمایهگذاران باور داشتند. با دسترسی جامعه متنباز به هوش سطح بالا، فاز بعدی رقابت هوش مصنوعی احتمالاً از ساخت هوشمندترین مدل به سمت ساخت مفیدترین برنامههای کاربردی بر اساس آن تغییر خواهد کرد.[3][7]
روند رویداد
March 2023
اوپنایآی GPT-4 را منتشر میکند و یک برتری عظیم در قابلیتهای هوش مصنوعی انحصاری ایجاد میکند.
April 2024
متا لاما ۳ را منتشر میکند، شکاف با GPT-4 را کاهش میدهد اما همچنان از سطح پیشرفته عقب میماند.
Late 2025
اوپنایآی GPT-5.5 را راهاندازی میکند و نقطه اوج جدیدی برای استدلال و کدنویسی تعیین میکند.
July 2026
متا از واترملون رونمایی میکند، ادعا میکند با GPT-5.5 برابری میکند و وزنها را برای عموم منتشر میکند.
بررسی عمیق دیدگاهها
حامیان متنباز
استدلال میکنند که انتشار مدلهای پیشرفته، فناوری را دموکراتیک میکند، انحصارهای شرکتی را میشکند و نوآوری جهانی را تسریع میبخشد.
این گروه انتشار واترملون را یک پیروزی تاریخی علیه تمرکز قدرت فناوری میدانند. آنها استدلال میکنند که متا با در دسترس قرار دادن یک مدل معادل GPT-5.5 به صورت رایگان، عملاً انحصار چندجانبه اوپنایآی، آنتروپیک و گوگل را شکسته است. حامیان اشاره میکنند که نرمافزار متنباز از لحاظ تاریخی باعث مهمترین جهشها در زیرساخت اینترنت، از لینوکس گرفته تا سرورهای وب، شده است. آنها معتقدند که اجازه دادن به میلیونها توسعهدهنده برای کار با این مدل، منجر به کشفهای سریعتر، کدهای کارآمدتر و توزیع گستردهتر ثروت در اقتصاد هوش مصنوعی خواهد شد.
آزمایشگاههای تجاری هوش مصنوعی
هشدار میدهند که متنباز کردن هوش مصنوعی بسیار پیشرفته، حفاظهای ایمنی حیاتی را حذف کرده و بازیگران مخرب را توانمند میسازد.
آزمایشگاههای انحصاری معتقدند که مدلهای پیشرفته دارای قابلیتهایی هستند که انتشار آنها در فضای عمومی بسیار خطرناک است. از آنجایی که مدلهای با وزن باز قابل دانلود و اصلاح هستند، کاربران میتوانند به راحتی آموزشهای ایمنی طراحی شده برای جلوگیری از تولید محتوای نفرتانگیز، نوشتن بدافزار یا ارائه دستورالعمل برای سلاحهای بیولوژیکی را حذف کنند. این گروه استدلال میکند که بدون یک API متمرکز برای نظارت بر استفاده و قطع دسترسی بازیگران بد، تکثیر مدلهای کلاس واترملون یک خطر امنیتی غیرقابل قبول برای عموم ایجاد میکند.
محققان مستقل هوش مصنوعی
نسبت به معیارهای شرکتی شک و تردید دارند و بر نحوه عملکرد مدل در کاربردهای واقعی و بدون سناریو تمرکز میکنند.
محققان آکادمیک و مستقل اغلب نسبت به هیاهوی ایجاد شده توسط بیانیههای مطبوعاتی شرکتها هشدار میدهند. این گروه ضمن تأیید امتیازات چشمگیر واترملون در MMLU، خاطرنشان میکنند که معیارهای استاندارد شده به طور فزایندهای دارای نقص هستند، زیرا ممکن است مدلها به طور ناخواسته بر روی خود سؤالات آزمون آموزش دیده باشند. محققان تأکید میکنند که برابری واقعی با GPT-5.5 تنها زمانی ثابت خواهد شد که توسعهدهندگان واترملون را در جریانهای کاری پیچیده، چند مرحلهای و عاملی ادغام کنند و نرخ شکست، تمایلات توهمزایی و بازیابی زمینه طولانی آن را در دنیای واقعی مشاهده کنند.
آنچه نمیدانیم
- اینکه آیا آزمایشهای مستقل ادعاهای متا مبنی بر برابری کامل با GPT-5.5 در تمام وظایف خلاقانه و منطقی را تأیید خواهند کرد یا خیر.
- اوپنایآی و آنتروپیک چگونه مدلهای قیمتگذاری API خود را در پاسخ به یک رقیب رایگان و سطح بالا تنظیم خواهند کرد.
- آیا جامعه متنباز میتواند مدل عظیم ۱.۸ تریلیون پارامتری را فشرده کند تا به طور کارآمد روی سختافزار سطح مصرفکننده اجرا شود.
اصطلاحات کلیدی
- وزن باز (Open-weight)
- یک مدل صدور مجوز که در آن پارامترهای آموزشدیده یک هوش مصنوعی به صورت عمومی در دسترس قرار میگیرند و به هر کسی اجازه میدهد مدل را به صورت محلی اجرا یا اصلاح کند.
- پارامترها
- متغیرهای داخلی یا «سیناپسهایی» که یک مدل هوش مصنوعی در طول آموزش یاد میگیرد؛ به طور کلی، پارامترهای بیشتر نشاندهنده مدلی با قابلیتهای بالاتر است.
- ترکیب متخصصان (MoE)
- یک معماری هوش مصنوعی که مدل را به زیرشبکههای تخصصی تقسیم میکند و تنها «متخصصان» مرتبط را برای یک درخواست معین فعال میسازد تا در قدرت محاسباتی صرفهجویی شود.
- معیار MMLU
- درک زبان چندوظیفهای گسترده (Massive Multitask Language Understanding)، یک آزمون استاندارد شده که برای اندازهگیری دانش هوش مصنوعی در دهها موضوع دانشگاهی و حرفهای استفاده میشود.
- دادههای مصنوعی
- متن یا دادهای که توسط خود مدل هوش مصنوعی تولید شده، نه توسط انسان نوشته شده باشد، و برای آموزش نسلهای جدیدتر هوش مصنوعی استفاده میشود.
پرسشهای متداول
«وزن باز» به چه معناست؟
به این معنی است که پارامترهای ریاضی اصلی که «مغز» هوش مصنوعی را تشکیل میدهند، برای دانلود در دسترس هستند. توسعهدهندگان میتوانند مدل را روی رایانههای خود اجرا کنند بدون اینکه به سرورهای متا وابسته باشند.
آیا استفاده از واترملون کاملاً رایگان است؟
بله، برای اکثر کاربران. مجوز متا استفاده تجاری رایگان را برای برنامههایی با کمتر از ۱ میلیارد کاربر فعال ماهانه مجاز میداند.
آیا میتوانم واترملون را روی لپتاپ خود اجرا کنم؟
مدل کامل ۱.۸ تریلیون پارامتری به زیرساخت سرور عظیمی نیاز دارد. با این حال، توسعهدهندگان احتمالاً نسخههای فشردهتر و کوچکتری را منتشر خواهند کرد که میتوانند روی سختافزارهای سطح بالای مصرفکننده اجرا شوند.
آیا این بدان معناست که اوپنایآی به دردسر افتاده است؟
این مدل با ارائه یک محصول قابل مقایسه به صورت رایگان، مدل تجاری آنها را به چالش میکشد، اما اوپنایآی همچنان مزایایی در ادغامهای انحصاری سازمانی و خدمات ابری مدیریت شده دارد.
منابع
[1]Meta AI Researchحامیان متنباز
Introducing Watermelon: A Frontier-Class Open Model for the World
مطالعه در Meta AI Research →[2]The Vergeمحققان مستقل هوش مصنوعی
Meta’s new 'Watermelon' AI model is here, and it’s gunning for OpenAI
مطالعه در The Verge →[3]Wiredحامیان متنباز
The Open Source AI Rebellion Finally Has Its Champion
مطالعه در Wired →[4]TechCrunchحامیان متنباز
Meta releases Watermelon, claiming GPT-5.5 level performance for zero API cost
مطالعه در TechCrunch →[5]Bloombergآزمایشگاههای تجاری هوش مصنوعی
Meta’s Free AI Model Threatens OpenAI and Anthropic Business Models
مطالعه در Bloomberg →[6]arXivمحققان مستقل هوش مصنوعی
Watermelon: A 1.8T Parameter Mixture-of-Experts Model via Self-Rewarding Synthetic Data
مطالعه در arXiv →[7]Ars Technicaمحققان مستقل هوش مصنوعی
Can Meta's Watermelon really beat GPT-5.5? Independent researchers weigh in
مطالعه در Ars Technica →[8]Reutersآزمایشگاههای تجاری هوش مصنوعی
Meta unveils 'Watermelon' AI, reigniting debate over open-source safety risks
مطالعه در Reuters →
هر زاویه. هر روز.
دریافت فرهنگ اخبار همراه با پوشش کامل منابع و تحلیل دیدگاهها، مستقیم در صندوق ورودی شما.










