رقابت تسلیحاتی هوش مصنوعیتوضیح و تحلیل۱۳ تیر ۱۴۰۵، ۱۰:۲۳· 5 دقیقه مطالعه

متا ادعا می‌کند مدل جدید هوش مصنوعی «واترملون» با GPT-5.5 اوپن‌ای‌آی برابری می‌کند

متا از «واترملون»، یک مدل هوش مصنوعی با وزن باز که مدت‌ها انتظارش می‌رفت، رونمایی کرده است. گزارش‌ها حاکی از آن است که این مدل عملکردی مشابه با پرچمدار اوپن‌ای‌آی، یعنی GPT-5.5، دارد. این انتشار با ارائه قابلیت‌های سطح بالا به توسعه‌دهندگان به صورت رایگان، چشم‌انداز هوش مصنوعی تجاری را تهدید به دگرگونی می‌کند.

به قلم تیم سردبیری کوهستان

این خبر را به اشتراک بگذارید

حامیان متن‌باز 40%آزمایشگاه‌های تجاری هوش مصنوعی 30%محققان مستقل هوش مصنوعی 30%

حامیان متن‌باز: استدلال می‌کنند که انتشار مدل‌های پیشرفته، فناوری را دموکراتیک می‌کند، انحصارهای شرکتی را می‌شکند و نوآوری جهانی را تسریع می‌بخشد.
آزمایشگاه‌های تجاری هوش مصنوعی: هشدار می‌دهند که متن‌باز کردن هوش مصنوعی بسیار پیشرفته، حفاظ‌های ایمنی حیاتی را حذف کرده و بازیگران مخرب را توانمند می‌سازد.
محققان مستقل هوش مصنوعی: نسبت به معیارهای شرکتی شک و تردید دارند و بر نحوه عملکرد مدل در کاربردهای واقعی و بدون سناریو تمرکز می‌کنند.

زوایای پوشش‌داده‌نشده

· تولیدکنندگان سخت‌افزار (انویدیا/ای‌ام‌دی) که از افزایش میزبانی محلی سود خواهند برد.
· صاحبان حق تکثیر که ممکن است داده‌هایشان در مراحل اولیه آموزش مدل استفاده شده باشد.

چرا مهم است

اگر یک مدل با وزن باز واقعاً با پیشرفته‌ترین سیستم انحصاری صنعت برابری کند، توسعه‌دهندگان و استارتاپ‌ها دیگر نیازی به پرداخت هزینه‌های گزاف API برای ساخت برنامه‌های کاربردی هوش مصنوعی سطح بالا نخواهند داشت. این امر قدرت را از دروازه‌بانان متمرکز دور کرده و دسترسی به هوش مصنوعی پیشرفته را دموکراتیک می‌کند.

نکات کلیدی

متا مدل هوش مصنوعی با وزن باز «واترملون» را که دارای ۱.۸ تریلیون پارامتر است، منتشر کرد.
گزارش شده است که این مدل در معیار MMLU امتیاز ۸۸.۴٪ کسب کرده و اندکی از GPT-5.5 اوپن‌ای‌آی پیشی گرفته است.
واترملون از معماری بسیار کارآمد «ترکیب متخصصان» (Mixture of Experts) استفاده می‌کند و به طور گسترده با داده‌های مصنوعی آموزش دیده است.
این انتشار به توسعه‌دهندگان اجازه می‌دهد بدون پرداخت هزینه‌های گران قیمت API، برنامه‌های هوش مصنوعی سطح بالا بسازند.
عرضه این مدل بحث‌ها در مورد ایمنی انتشار مدل‌های پیشرفته هوش مصنوعی بدون حفاظ‌های متمرکز را دوباره شعله‌ور کرده است.

1.8 trillion

پارامترهای واترملون

88.4%

امتیاز معیار MMLU

هزینه استفاده تجاری (برای کمتر از ۱ میلیارد کاربر فعال ماهانه)

متا رسماً از «واترملون»، یک مدل عظیم جدید هوش مصنوعی رونمایی کرده است که این شرکت ادعا می‌کند با قابلیت‌های پرچمدار اوپن‌ای‌آی، یعنی GPT-5.5، برابری می‌کند یا از آن فراتر می‌رود. این مدل که تحت مجوز «وزن باز» (open-weight) منتشر شده، نشان‌دهنده تشدید قابل توجهی در نبرد جاری بین آزمایشگاه‌های هوش مصنوعی انحصاری و جامعه متن‌باز است.[1][2]

این اعلامیه، که از طریق وبلاگ تحقیقات هوش مصنوعی متا منتشر شد، جزئیات یک سیستم ۱.۸ تریلیون پارامتری را شرح داد که بر روی یک خوشه سفارشی متشکل از بیش از ۱۰۰,۰۰۰ واحد پردازش گرافیکی (GPU) نسل بعدی آموزش دیده است. متا با انتشار وزن‌ها – ماتریس‌های ریاضی اصلی که نحوه تفکر هوش مصنوعی را تعیین می‌کنند – به توسعه‌دهندگان اجازه می‌دهد تا یک مدل در کلاس پیشرفته را دانلود، اصلاح و بر روی سخت‌افزار خود اجرا کنند.[1][3]

طی دو سال گذشته، سری GPT-5 اوپن‌ای‌آی به عنوان نقطه اوج صنعت عمل کرده و به دلیل قابلیت‌های پیشرفته استدلال، کدنویسی و برنامه‌ریزی چند مرحله‌ای، قیمت‌های ممتاز API را طلب می‌کرد. متا تأکید می‌کند که واترملون در معیار استاندارد صنعتی MMLU امتیاز ۸۸.۴٪ کسب کرده و با اختلاف کمی از امتیاز ۸۸.۱٪ GPT-5.5 پیشی گرفته است.[1]

سازوکار پشت این جهش شامل یک معماری بسیار بهینه‌سازی شده به نام «ترکیب متخصصان» (MoE) است. واترملون به جای فعال کردن تمام ۱.۸ تریلیون پارامتر برای هر درخواست، دستورات را به زیرشبکه‌های تخصصی هدایت می‌کند. این امر به مدل اجازه می‌دهد تا دانش گسترده‌ای داشته باشد، در حالی که برای تولید پاسخ به قدرت محاسباتی بسیار کمتری نسبت به یک مدل متراکم با همان اندازه نیاز دارد.[5]

محققان اشاره می‌کنند که رویکرد متا در مورد داده‌های آموزشی نیز با تکرارهای قبلی متفاوت است. متا در مواجهه با «دیوار داده» که به طور گسترده گزارش شده بود (یعنی اتمام متن انسانی با کیفیت بالا در اینترنت)، به شدت بر داده‌های مصنوعی تولید شده توسط نسخه‌های قبلی مدل‌های لاما (Llama) خود تکیه کرد.[2][6]

این حلقه آموزشی «خودپاداش‌دهنده» به هوش مصنوعی اجازه می‌دهد تا خروجی‌های خود را قضاوت کرده و مسیرهای استدلالی خود را بدون دخالت انسان به صورت تکراری بهبود بخشد. طبق مقالات فنی همراه با انتشار، این روش برای برابری با توانایی GPT-5.5 در حل پازل‌های منطقی پیچیده و نوشتن کدهای نرم‌افزاری آماده تولید، حیاتی بود.[1][5]

پیامدهای اقتصادی یک مدل معادل GPT-5.5 با وزن باز، عمیق است. استارتاپ‌ها و شرکت‌های بزرگ در حال حاضر سالانه میلیون‌ها دلار صرف تماس‌های API به اوپن‌ای‌آی، آنتروپیک و گوگل می‌کنند. واترملون مسیری را برای استنتاج با هزینه صفر ارائه می‌دهد، مشروط بر اینکه شرکت‌ها بتوانند زیرساخت سرور لازم برای میزبانی آن را تأمین کنند.[4]

استارتاپ‌ها و شرکت‌های بزرگ در حال حاضر سالانه میلیون‌ها دلار صرف تماس‌های API به اوپن‌ای‌آی، آنتروپیک و گوگل می‌کنند.

استراتژی متا به طور گسترده به عنوان تلاشی برای کالایی‌سازی لایه مدل بنیادی در پشته هوش مصنوعی تلقی می‌شود. متا با رایگان کردن هوش اصلی، مدل‌های تجاری رقبای اصلی خود را تضعیف می‌کند و در عین حال تضمین می‌کند که اکوسیستم گسترده‌تر توسعه‌دهندگان، ابزارها و برنامه‌هایی سازگار با زیرساخت متا بسازند.[3][6]

با این حال، محققان مستقل هوش مصنوعی هشدار می‌دهند که معیارهای شرکتی را نباید به سادگی پذیرفت. در حالی که واترملون در آزمون‌های استاندارد شده عالی عمل می‌کند، کاربرد آن در دنیای واقعی اغلب به عواملی مانند پیروی از دستورات، ظرافت‌های مکالمه و تمایل مدل به «توهم‌زایی» (ساخت حقایق نادرست) بستگی دارد.

ارزیابی‌های اولیه شخص ثالث نشان می‌دهد که اگرچه واترملون در کدنویسی خام و استدلال ریاضی با GPT-5.5 برابری می‌کند، اما ممکن است همچنان در نگارش خلاقانه و ترجمه چندزبانه ظریف کمی عقب‌تر باشد. جامعه متن‌باز در حال حاضر برای تنظیم دقیق مدل جهت رفع این شکاف‌های خاص بسیج شده است.[2]

این انتشار همچنین بحث‌های شدیدی را در مورد ایمنی هوش مصنوعی دوباره شعله‌ور کرده است. آزمایشگاه‌های تجاری مانند اوپن‌ای‌آی مدت‌هاست استدلال می‌کنند که مدل‌های پیشرفته باید پشت APIهای بسته نگهداری شوند تا از استفاده بازیگران مخرب برای تولید اطلاعات نادرست، کشف آسیب‌پذیری‌های نرم‌افزاری یا سنتز مواد خطرناک جلوگیری شود.[4][6]

متا با انتشار وزن‌ها، توانایی اعمال فیلترهای ایمنی سمت سرور را از بین می‌برد. اگر کاربری حفاظ‌های ایمنی داخلی واترملون را حذف کند – فرآیندی که به «جیلبریکینگ» معروف است – هیچ کلید قطع متمرکزی برای جلوگیری از تولید محتوای مضر توسط مدل وجود ندارد.[3][4]

مدیران اجرایی متا این نگرانی‌ها را رد کرده و استدلال می‌کنند که نرم‌افزار متن‌باز از لحاظ تاریخی امن‌تر است، زیرا به هزاران محقق مستقل اجازه می‌دهد کد را ممیزی کرده و آسیب‌پذیری‌ها را وصله کنند. آن‌ها معتقدند که مزایای دموکراتیک کردن هوش مصنوعی بسیار بیشتر از خطرات نظری آن است.[1][2]

گام بعدی فوری برای صنعت هوش مصنوعی، مشاهده سرعت پذیرش واترملون توسط توسعه‌دهندگان خواهد بود. ارائه‌دهندگان خدمات ابری در حال حاضر برای ارائه گزینه‌های استقرار با یک کلیک برای این مدل عجله دارند، که نشان‌دهنده تقاضای عظیم پیش‌بینی شده از سوی مشتریان سازمانی است که مشتاق کاهش هزینه‌های نرم‌افزاری هوش مصنوعی خود هستند.[6]

اکنون توسعه‌دهندگان بدون پرداخت هزینه‌های دسترسی ممتاز، به مدل‌های هوش مصنوعی سطح بالا دسترسی دارند.

در نهایت، انتشار واترملون ثابت می‌کند که خندق اطراف هوش مصنوعی انحصاری کم‌عمق‌تر از آن چیزی است که بسیاری از سرمایه‌گذاران باور داشتند. با دسترسی جامعه متن‌باز به هوش سطح بالا، فاز بعدی رقابت هوش مصنوعی احتمالاً از ساخت هوشمندترین مدل به سمت ساخت مفیدترین برنامه‌های کاربردی بر اساس آن تغییر خواهد کرد.[3]

روند رویداد

March 2023
اوپن‌ای‌آی GPT-4 را منتشر می‌کند و یک برتری عظیم در قابلیت‌های هوش مصنوعی انحصاری ایجاد می‌کند.
April 2024
متا لاما ۳ را منتشر می‌کند، شکاف با GPT-4 را کاهش می‌دهد اما همچنان از سطح پیشرفته عقب می‌ماند.
Late 2025
اوپن‌ای‌آی GPT-5.5 را راه‌اندازی می‌کند و نقطه اوج جدیدی برای استدلال و کدنویسی تعیین می‌کند.
July 2026
متا از واترملون رونمایی می‌کند، ادعا می‌کند با GPT-5.5 برابری می‌کند و وزن‌ها را برای عموم منتشر می‌کند.

بررسی عمیق دیدگاه‌ها

حامیان متن‌باز

استدلال می‌کنند که انتشار مدل‌های پیشرفته، فناوری را دموکراتیک می‌کند، انحصارهای شرکتی را می‌شکند و نوآوری جهانی را تسریع می‌بخشد.

این گروه انتشار واترملون را یک پیروزی تاریخی علیه تمرکز قدرت فناوری می‌دانند. آن‌ها استدلال می‌کنند که متا با در دسترس قرار دادن یک مدل معادل GPT-5.5 به صورت رایگان، عملاً انحصار چندجانبه اوپن‌ای‌آی، آنتروپیک و گوگل را شکسته است. حامیان اشاره می‌کنند که نرم‌افزار متن‌باز از لحاظ تاریخی باعث مهم‌ترین جهش‌ها در زیرساخت اینترنت، از لینوکس گرفته تا سرورهای وب، شده است. آن‌ها معتقدند که اجازه دادن به میلیون‌ها توسعه‌دهنده برای کار با این مدل، منجر به کشف‌های سریع‌تر، کدهای کارآمدتر و توزیع گسترده‌تر ثروت در اقتصاد هوش مصنوعی خواهد شد.

آزمایشگاه‌های تجاری هوش مصنوعی

هشدار می‌دهند که متن‌باز کردن هوش مصنوعی بسیار پیشرفته، حفاظ‌های ایمنی حیاتی را حذف کرده و بازیگران مخرب را توانمند می‌سازد.

آزمایشگاه‌های انحصاری معتقدند که مدل‌های پیشرفته دارای قابلیت‌هایی هستند که انتشار آن‌ها در فضای عمومی بسیار خطرناک است. از آنجایی که مدل‌های با وزن باز قابل دانلود و اصلاح هستند، کاربران می‌توانند به راحتی آموزش‌های ایمنی طراحی شده برای جلوگیری از تولید محتوای نفرت‌انگیز، نوشتن بدافزار یا ارائه دستورالعمل برای سلاح‌های بیولوژیکی را حذف کنند. این گروه استدلال می‌کند که بدون یک API متمرکز برای نظارت بر استفاده و قطع دسترسی بازیگران بد، تکثیر مدل‌های کلاس واترملون یک خطر امنیتی غیرقابل قبول برای عموم ایجاد می‌کند.

محققان مستقل هوش مصنوعی

نسبت به معیارهای شرکتی شک و تردید دارند و بر نحوه عملکرد مدل در کاربردهای واقعی و بدون سناریو تمرکز می‌کنند.

محققان آکادمیک و مستقل اغلب نسبت به هیاهوی ایجاد شده توسط بیانیه‌های مطبوعاتی شرکت‌ها هشدار می‌دهند. این گروه ضمن تأیید امتیازات چشمگیر واترملون در MMLU، خاطرنشان می‌کنند که معیارهای استاندارد شده به طور فزاینده‌ای دارای نقص هستند، زیرا ممکن است مدل‌ها به طور ناخواسته بر روی خود سؤالات آزمون آموزش دیده باشند. محققان تأکید می‌کنند که برابری واقعی با GPT-5.5 تنها زمانی ثابت خواهد شد که توسعه‌دهندگان واترملون را در جریان‌های کاری پیچیده، چند مرحله‌ای و عاملی ادغام کنند و نرخ شکست، تمایلات توهم‌زایی و بازیابی زمینه طولانی آن را در دنیای واقعی مشاهده کنند.

آنچه نمی‌دانیم

اینکه آیا آزمایش‌های مستقل ادعاهای متا مبنی بر برابری کامل با GPT-5.5 در تمام وظایف خلاقانه و منطقی را تأیید خواهند کرد یا خیر.
اوپن‌ای‌آی و آنتروپیک چگونه مدل‌های قیمت‌گذاری API خود را در پاسخ به یک رقیب رایگان و سطح بالا تنظیم خواهند کرد.
آیا جامعه متن‌باز می‌تواند مدل عظیم ۱.۸ تریلیون پارامتری را فشرده کند تا به طور کارآمد روی سخت‌افزار سطح مصرف‌کننده اجرا شود.

اصطلاحات کلیدی

وزن باز (Open-weight): یک مدل صدور مجوز که در آن پارامترهای آموزش‌دیده یک هوش مصنوعی به صورت عمومی در دسترس قرار می‌گیرند و به هر کسی اجازه می‌دهد مدل را به صورت محلی اجرا یا اصلاح کند.
پارامترها: متغیرهای داخلی یا «سیناپس‌هایی» که یک مدل هوش مصنوعی در طول آموزش یاد می‌گیرد؛ به طور کلی، پارامترهای بیشتر نشان‌دهنده مدلی با قابلیت‌های بالاتر است.
ترکیب متخصصان (MoE): یک معماری هوش مصنوعی که مدل را به زیرشبکه‌های تخصصی تقسیم می‌کند و تنها «متخصصان» مرتبط را برای یک درخواست معین فعال می‌سازد تا در قدرت محاسباتی صرفه‌جویی شود.
معیار MMLU: درک زبان چندوظیفه‌ای گسترده (Massive Multitask Language Understanding)، یک آزمون استاندارد شده که برای اندازه‌گیری دانش هوش مصنوعی در ده‌ها موضوع دانشگاهی و حرفه‌ای استفاده می‌شود.
داده‌های مصنوعی: متن یا داده‌ای که توسط خود مدل هوش مصنوعی تولید شده، نه توسط انسان نوشته شده باشد، و برای آموزش نسل‌های جدیدتر هوش مصنوعی استفاده می‌شود.

پرسش‌های متداول

«وزن باز» به چه معناست؟

به این معنی است که پارامترهای ریاضی اصلی که «مغز» هوش مصنوعی را تشکیل می‌دهند، برای دانلود در دسترس هستند. توسعه‌دهندگان می‌توانند مدل را روی رایانه‌های خود اجرا کنند بدون اینکه به سرورهای متا وابسته باشند.

آیا استفاده از واترملون کاملاً رایگان است؟

بله، برای اکثر کاربران. مجوز متا استفاده تجاری رایگان را برای برنامه‌هایی با کمتر از ۱ میلیارد کاربر فعال ماهانه مجاز می‌داند.

آیا می‌توانم واترملون را روی لپ‌تاپ خود اجرا کنم؟

مدل کامل ۱.۸ تریلیون پارامتری به زیرساخت سرور عظیمی نیاز دارد. با این حال، توسعه‌دهندگان احتمالاً نسخه‌های فشرده‌تر و کوچک‌تری را منتشر خواهند کرد که می‌توانند روی سخت‌افزارهای سطح بالای مصرف‌کننده اجرا شوند.

آیا این بدان معناست که اوپن‌ای‌آی به دردسر افتاده است؟

این مدل با ارائه یک محصول قابل مقایسه به صورت رایگان، مدل تجاری آن‌ها را به چالش می‌کشد، اما اوپن‌ای‌آی همچنان مزایایی در ادغام‌های انحصاری سازمانی و خدمات ابری مدیریت شده دارد.

منابع

[1]Meta AI Researchحامیان متن‌باز
Introducing Watermelon: A Frontier-Class Open Model for the World
مطالعه در Meta AI Research →
[2]The Vergeمحققان مستقل هوش مصنوعی
Meta says its new AI model is ready to compete on coding
مطالعه در The Verge →
[3]Wiredحامیان متن‌باز
OpenAI Launches Full-Scale Effort to Patch Open-Source Bugs as It Takes on Anthropic’s Mythos
مطالعه در Wired →
[4]Bloombergآزمایشگاه‌های تجاری هوش مصنوعی
Meta’s Free AI Model Threatens OpenAI and Anthropic Business Models
مطالعه در Bloomberg →
[5]arXivمحققان مستقل هوش مصنوعی
Watermelon: A 1.8T Parameter Mixture-of-Experts Model via Self-Rewarding Synthetic Data
مطالعه در arXiv →
[6]Reutersآزمایشگاه‌های تجاری هوش مصنوعی
Meta unveils 'Watermelon' AI, reigniting debate over open-source safety risks
مطالعه در Reuters →

همیشه در جریان باشید

هر زاویه. هر روز.

دریافت فرهنگ اخبار همراه با پوشش کامل منابع و تحلیل دیدگاه‌ها، مستقیم در صندوق ورودی شما.

دریافت خلاصه خبری ←مرور فرهنگ