مِیتوان از «لانگکت-۲.۰» رونمایی کرد؛ اولین مدل هوش مصنوعی یک تریلیون پارامتری که کاملاً با سیلیکون داخلی آموزش دیده است
شرکت غول فناوری چینی مِیتوان با موفقیت یک مدل هوش مصنوعی پیشرو را بدون اتکا به سختافزارهای محدود شده آمریکایی آموزش داده و بدین ترتیب امکانپذیری اکوسیستمهای جایگزین سیلیکونی را اثبات کرده است. این موفقیت متکی بر بهینهسازیهای نرمافزاری نوینی است که برای غلبه بر تنگناهای شبکهای تراشههای داخلی طراحی شدهاند.
به قلم تیم سردبیری کوهستان
این خبر را به اشتراک بگذارید
- خوشبینان فناوری داخلی
- این دستاورد را به عنوان پیروزی مهندسی میبینند که ثابت میکند چین میتواند به خودکفایی کامل در رقابت هوش مصنوعی پیشرو دست یابد.
- واقعگرایان ژئوپلیتیک
- بر این تمرکز دارند که چگونه کنترلهای صادراتی آمریکا ناخواسته ایجاد یک اکوسیستم هوش مصنوعی موازی و مستقل را تسریع کردند.
- شکاکان سختافزاری
- بر هزینههای پنهان دور زدن انویدیا، به ویژه جریمههای شدید انرژی و چالشهای بازده تولید، تأکید میکنند.
زوایای پوششدادهنشده
- · فعالان محیط زیست نگران ردپای عظیم انرژی کلاسترهای آموزش هوش مصنوعی با کارایی کمتر.
- · سیاستگذاران آمریکایی که در حال ارزیابی اثربخشی کنترلهای صادراتی فعلی نیمهرسانا هستند.
چرا مهم است
سالها بود که صنعت جهانی هوش مصنوعی فرض میکرد آموزش مدلهای عظیم و پیشرو نیازمند سختافزار انویدیا است. دستاورد مِیتوان نشان میدهد که اکوسیستمهای جایگزین سیلیکونی به اندازهای بالغ شدهاند که بتوانند محدودیتهای صادراتی آمریکا را دور بزنند و این امر چشمانداز ژئوپلیتیک هوش مصنوعی را به طور اساسی تغییر میدهد.
نکات کلیدی
- مِیتوان لانگکت-۲.۰، یک مدل هوش مصنوعی یک تریلیون پارامتری را منتشر کرد که کاملاً بر روی سیلیکون داخلی چین آموزش دیده است.
- این دستاورد ثابت میکند که مدلهای هوش مصنوعی پیشرو میتوانند بدون اتکا به سختافزارهای محدود شده آمریکایی مانند پردازندههای گرافیکی انویدیا توسعه یابند.
- مهندسان با توسعه یک چارچوب آموزش موازی ۴ بُعدی سفارشی، بر سرعتهای کندتر اتصال داخلی سختافزار غلبه کردند.
- یک سیستم تحمل خطای قوی به کلاستر ۳۰,۰۰۰ تراشهای اجازه داد تا از خرابیهای سختافزاری در کمتر از ۴۵ ثانیه بازیابی شود.
- اگرچه آموزش بر روی سیلیکون داخلی موفقیتآمیز بود، اما به طور قابل توجهی برق بیشتری نسبت به استفاده از معادلهای غربی نیاز دارد.
- این نقطه عطف نشان میدهد که چگونه کنترلهای صادراتی آمریکا، دو شاخه شدن اکوسیستم جهانی هوش مصنوعی را تسریع کرده است.
در یک نقطه عطف که مرزهای رقابت جهانی هوش مصنوعی را بازتعریف میکند، شرکت غول فناوری چینی مِیتوان از «لانگکت-۲.۰» (LongCat-2.0) رونمایی کرد؛ یک مدل هوش مصنوعی پیشرو که دارای یک تریلیون پارامتر است. در حالی که مقیاس این مدل آن را در ردههای بالای سیستمهای هوش مصنوعی جهانی قرار میدهد، اهمیت واقعی آن در منشأ آن نهفته است: لانگکت-۲.۰ اولین مدل در این اندازه است که کاملاً با سیلیکون داخلی چین آموزش دیده است.[1][2]
این اعلامیه، یک فرض قدیمی در سیلیکون ولی و واشنگتن را به چالش میکشد: اینکه تراکم محاسباتی محض و الزامات شبکهای مدلهای یک تریلیون پارامتری، به طور قطع نیازمند سختافزار شرکت آمریکایی انویدیا است. مِیتوان با موفقیت مدیریت یک کلاستر عظیم از تراشههای داخلی، ملموسترین شواهد را تا به امروز ارائه کرده است که اکوسیستمهای جایگزین نیمهرسانا میتوانند از توسعه هوش مصنوعی پیشرفته پشتیبانی کنند.[3][8]
مِیتوان، که در سطح جهانی عمدتاً به عنوان یک غول خدمات محلی و تحویل غذا شناخته میشود، در طول سه سال گذشته به شدت به سمت تحقیقات هوش مصنوعی بنیادی متمایل شده است. انتشار لانگکت-۲.۰ نشاندهنده گذار این شرکت از مصرفکننده هوش مصنوعی به یک معمار اصلی است و آن را در کنار بایدو، علیبابا و تنسنت در پیشگامان هوش مصنوعی داخلی چین قرار میدهد.[2][4]
بر اساس گزارش فنی منتشر شده توسط آزمایشگاه هوش مصنوعی مِیتوان، لانگکت-۲.۰ از معماری «ترکیب پراکنده متخصصان» (Sparse Mixture-of-Experts یا MoE) استفاده میکند. این طراحی تنها زیرمجموعهای از یک تریلیون پارامتر خود را برای هر پرسوجوی معین فعال میکند و کارایی را به حداکثر میرساند. در بنچمارکهای اولیه، این مدل قابلیتهای استدلال، کدنویسی و چندزبانه را تقریباً در حد مدلهای کلاس GPT-4 نشان میدهد، اگرچه از پیشرفتهترین سیستمهای غربی که اخیراً منتشر شدهاند، عقبتر است.[6][7]
مکانیسم پشت این دستاورد، یک شاهکار در غلبه بر محدودیتهای سختافزاری از طریق نبوغ نرمافزاری است. آموزش یک مدل هوش مصنوعی عظیم صرفاً در مورد قدرت محاسباتی خام یا FLOPs نیست؛ بلکه اساساً یک مشکل شبکهای است. دادهها باید به طور یکپارچه بین دهها هزار تراشه جریان یابند. مزیت اصلی انویدیا برای مدت طولانی NVLink بوده است، یک فناوری اتصال اختصاصی که به پردازندههای گرافیکی آن اجازه میدهد حافظه را با سرعتهای سرسامآور به اشتراک بگذارند.[5][8]
تراشههای داخلی چین، که به طور گستردهای اعتقاد بر این است که آخرین نسل از سری Ascend هواوی هستند، دارای قدرت محاسباتی خام قابل توجهی هستند اما از نظر تاریخی از پهنای باند اتصال کندتری رنج میبرند. برای دور زدن این «دیوار حافظه»، مهندسان مِیتوان مجبور شدند معماری آموزش را از پایه بازنگری کنند.[2][5]
راهحل در قالب یک چارچوب آموزش توزیعشده سفارشی ارائه شد. مِیتوان یک استراتژی آموزش موازی ۴ بُعدی نوین را توسعه داد که مدل را به گونهای در سراسر کلاستر تقسیم میکند که نیاز به «صحبت» مداوم تراشهها با یکدیگر را به حداقل میرساند. با کاهش سربار ارتباطی تا حدود ۴۰ درصد، آنها به تراشههای داخلی اجازه دادند زمان بیشتری را صرف محاسبه کنند و زمان کمتری را منتظر دادهها بمانند.[6][7]
با کاهش سربار ارتباطی تا حدود ۴۰ درصد، آنها به تراشههای داخلی اجازه دادند زمان بیشتری را صرف محاسبه کنند و زمان کمتری را منتظر دادهها بمانند.
بهینهسازی نرمافزاری به همان اندازه حیاتی بود. اکوسیستم جهانی هوش مصنوعی به شدت به CUDA، پلتفرم نرمافزاری اختصاصی انویدیا، وابسته است. انتقال به سیلیکون داخلی نیازمند بازنویسی کدهای عظیم برای اجرا بر روی پلتفرمهای جایگزین مانند CANN (معماری محاسباتی برای شبکههای عصبی) هواوی است. مِیتوان یک کامپایلر سفارشی به نام «کاتاپولت» (Catapult) را به کار گرفت که عملیات تانسور را به طور خودکار برای ویژگیهای خاص سختافزار داخلی ترجمه و بهینهسازی میکند.[7][8]
شاید دلهرهآورترین چالش، تحمل خطا بود. آموزش یک مدل یک تریلیون پارامتری نیازمند اجرای مداوم یک کلاستر متشکل از تقریباً ۳۰,۰۰۰ تراشه برای بیش از ۹۰ روز است. در هر کلاستر با این اندازه، خرابی سختافزاری یک اتفاق روزمره است. اگر یک تراشه از کار بیفتد و سیستم نتواند بازیابی شود، روزها پیشرفت آموزش – و میلیونها دلار برق – ممکن است از دست برود.[4][6]
مقاله فنی مِیتوان یک سیستم «چکپوینتگیری ناهمزمان» را شرح میدهد که وضعیت مدل را هر چند دقیقه یک بار بدون توقف فرآیند آموزش ذخیره میکند. هنگامی که یک گره داخلی از کار میافتد، سیستم به طور خودکار سختافزار مرده را ایزوله میکند، بار کاری را به تراشههای پشتیبان بیکار اختصاص میدهد و آموزش را ظرف ۴۵ ثانیه از سر میگیرد. این تحمل خطای قوی، ستون فقراتی بود که اجرای سه ماهه آموزش را امکانپذیر ساخت.[6][7]
برای اثبات کارایی پشته فناوری خود، مِیتوان یک نسخه کوچکتر ۷۰ میلیارد پارامتری از لانگکت-۲.۰ را به صورت متنباز منتشر کرده است، همراه با کد استنتاج بهینهسازی شده برای سختافزار داخلی. محققان مستقل قبلاً شروع به آزمایش مدل با وزن باز کردهاند و تأیید میکنند که معماری زیربنایی سالم و در جدولهای امتیازدهی متنباز بسیار رقابتی است.[4][5]
با وجود این پیروزی، تحلیلگران صنعت به هزینههای پنهان دور زدن انویدیا اشاره میکنند. مبادله اصلی، بهرهوری انرژی است. سیلیکون داخلی، که به دلیل تحریمهای تجهیزات بر روی گرههای فرآیندی کمی قدیمیتر تولید میشود، برای دستیابی به همان خروجی محاسباتی، به طور قابل توجهی به انرژی بیشتری نیاز دارد. برآوردها نشان میدهد که اجرای آموزش مِیتوان تا ۴۵ درصد بیشتر از یک اجرای معادل بر روی H100های انویدیا برق مصرف کرده است.[3][5]
بازده تولید، لایه دیگری از عدم قطعیت را ایجاد میکند. در حالی که مِیتوان با موفقیت ۳۰,۰۰۰ تراشه مورد نیاز برای این اجرا را به دست آورد، مقیاسبندی به مرز بعدی – مدلهایی با ۱۰ تریلیون پارامتر – به صدها هزار پردازنده نیاز خواهد داشت. اینکه آیا ریختهگریهای داخلی چین میتوانند این تراشهها را در آن حجم، با بازده کافی بالا برای مدیریت هزینهها، تولید کنند، یک پرسش باز باقی میماند.[2][3]

با این حال، پیامدهای ژئوپلیتیک لانگکت-۲.۰ عمیق است. کنترلهای صادراتی آمریکا، که برای خفه کردن دسترسی چین به قابلیتهای پیشرفته هوش مصنوعی طراحی شده بودند، در عوض به عنوان یک کاتالیزور قدرتمند برای خودکفایی داخلی عمل کردهاند. با مجبور کردن غولهای فناوری چینی به سرمایهگذاری سنگین در پشتههای نرمافزاری و سختافزاری خود، این محدودیتها ناخواسته یک اکوسیستم هوش مصنوعی موازی و کاملاً مستقل را به وجود آوردهاند.[1][8]
همانطور که «پرده سیلیکونی» سختتر میشود، چشمانداز جهانی هوش مصنوعی در حال دو شاخه شدن است. موفقیت مِیتوان ثابت میکند که مانع ورود به هوش مصنوعی پیشرو دیگر به طور سختگیرانه توسط یک فروشنده سختافزار غربی کنترل نمیشود. اکنون مسابقه به سمت هوش عمومی مصنوعی در دو مسیر کاملاً جداگانه در حال انجام است.[3][8]
روند رویداد
اکتبر ۲۰۲۲
آمریکا کنترلهای صادراتی گستردهای را برای محدود کردن فروش تراشههای پیشرفته هوش مصنوعی به چین اعمال میکند.
آگوست ۲۰۲۳
تولیدکنندگان داخلی نسلهای جدید شتابدهندههای هوش مصنوعی را برای پر کردن خلأ باقیمانده توسط انویدیا منتشر میکنند.
ژانویه ۲۰۲۶
مِیتوان آموزش مداوم ۹۰ روزه لانگکت-۲.۰ را در یک کلاستر متشکل از ۳۰,۰۰۰ تراشه داخلی آغاز میکند.
ژوئیه ۲۰۲۶
مِیتوان رسماً از لانگکت-۲.۰ رونمایی میکند و یک نسخه کوچکتر ۷۰B را به صورت متنباز منتشر میکند تا امکانپذیری پشته نرمافزاری خود را اثبات کند.
بررسی عمیق دیدگاهها
خوشبینان فناوری داخلی
این دستاورد را به عنوان پیروزی مهندسی میبینند که ثابت میکند چین میتواند به خودکفایی کامل در رقابت هوش مصنوعی پیشرو دست یابد.
برای طرفداران بخش فناوری داخلی چین، لانگکت-۲.۰ یک لحظه تعیینکننده است که سالها سرمایهگذاری سنگین در سیلیکون جایگزین را تأیید میکند. آنها استدلال میکنند که مانع اصلی استقلال هوش مصنوعی هرگز قابلیت تولید خام نبوده، بلکه اکوسیستم نرمافزاری بوده است. مِیتوان با بازنویسی موفقیتآمیز پشته آموزش برای دور زدن CUDA و NVLink انویدیا، ثابت کرده است که میتوان با نبوغ نرمافزاری از «دیوار حافظه» عبور کرد. این گروه این دستاورد را شاهدی میداند که صنعت داخلی از مرحله صرفاً کپیبرداری از معماریهای غربی عبور کرده و اکنون در سطح بنیادی در حال نوآوری است.
واقعگرایان ژئوپلیتیک
بر این تمرکز دارند که چگونه کنترلهای صادراتی آمریکا ناخواسته ایجاد یک اکوسیستم هوش مصنوعی موازی و مستقل را تسریع کردند.
تحلیلگرانی که بر مخاطرات ژئوپلیتیک تمرکز دارند، استدلال میکنند که لانگکت-۲.۰ دقیقاً همان سناریویی را نشان میدهد که کنترلهای صادراتی آمریکا برای جلوگیری از آن طراحی شده بودند. واشنگتن با قطع دسترسی به آسانترین و کارآمدترین سختافزار (انویدیا)، غولهای فناوری چینی را در گوشهای قرار داد و چارهای جز سرازیر کردن میلیاردها دلار به جایگزینهای داخلی برای آنها باقی نگذاشت. این گروه اشاره میکند که در حالی که اثر کوتاهمدت ممنوعیتها مخرب بود، نتیجه بلندمدت یک اکوسیستم فناوری دو شاخه شده است که در آن آمریکا هیچ دید یا اهرمی بر سختافزاری که پیشرفتهترین مدلهای هوش مصنوعی چین را تأمین میکند، ندارد.
شکاکان سختافزاری
بر هزینههای پنهان دور زدن انویدیا، به ویژه جریمههای شدید انرژی و چالشهای بازده تولید، تأکید میکنند.
تحلیلگران نیمهرسانا و شکاکان سختافزاری، دستاورد نرمافزاری را تأیید میکنند اما به اقتصاد غیرقابل تحمل سیلیکون زیربنایی اشاره میکنند. آنها تأکید میکنند که تراشههای داخلی، که بدون دسترسی به جدیدترین دستگاههای لیتوگرافی فرابنفش شدید (EUV) تولید میشوند، ذاتاً از نظر مصرف انرژی کارایی کمتری دارند. آموزش مدلی مانند لانگکت-۲.۰ بر روی این سختافزار نیازمند مراکز داده عظیم و گرانقیمتی است که به طور قابل توجهی برق بیشتری نسبت به معادلهای غربی مصرف میکنند. علاوه بر این، آنها این سؤال را مطرح میکنند که آیا ریختهگریهای داخلی میتوانند به بازده تولید لازم برای تولید این تراشهها در مقیاس مورد نیاز برای نسل بعدی مدلهای ۱۰ تریلیون پارامتری دست یابند یا خیر.
آنچه نمیدانیم
- نرخهای دقیق بازده تولید تراشههای داخلی استفاده شده در کلاستر، که هزینه مالی واقعی پروژه را تعیین میکند.
- هویت دقیق سازنده تراشه، اگرچه به طور گستردهای فرض میشود که هواوی باشد.
- اینکه آیا الزامات انرژی سیلیکون داخلی مانع از مقیاسبندی مِیتوان به نسل بعدی مدلهای ۱۰ تریلیون پارامتری خواهد شد یا خیر.
اصطلاحات کلیدی
- پارامتر (Parameter)
- متغیرهای داخلی یا «سیناپسهایی» که یک مدل هوش مصنوعی در طول آموزش یاد میگیرد؛ تعداد پارامتر بالاتر عموماً با قابلیت و ظرافت بیشتر مرتبط است.
- اتصال داخلی (Interconnect)
- فناوری شبکهسازی تخصصی که به هزاران تراشه هوش مصنوعی مجزا اجازه میدهد حافظه را به اشتراک بگذارند و با سرعت بالا با یکدیگر ارتباط برقرار کنند.
- ترکیب متخصصان (Mixture-of-Experts - MoE)
- معماری هوش مصنوعی که یک مدل عظیم را به زیرشبکههای کوچکتر و تخصصی تقسیم میکند و تنها «متخصصان» لازم را برای یک کار خاص فعال میکند تا در مصرف توان محاسباتی صرفهجویی شود.
- تحمل خطا (Fault Tolerance)
- توانایی یک کلاستر محاسباتی عظیم برای تشخیص خرابی سختافزار، ایزوله کردن قطعه خراب و از سرگیری عملیات بدون از کار انداختن کل سیستم.
- CUDA
- پلتفرم نرمافزاری اختصاصی انویدیا که به توسعهدهندگان اجازه میدهد برنامهها را برای پردازندههای گرافیکی آن بنویسند و به عنوان یک مزیت رقابتی عمده در صنعت هوش مصنوعی عمل میکند.
پرسشهای متداول
مِیتوان برای آموزش لانگکت-۲.۰ از چه تراشههایی استفاده کرد؟
در حالی که مِیتوان به طور رسمی نام سازنده را اعلام نکرده است، تحلیلگران صنعت به طور گستردهای معتقدند که این کلاستر با استفاده از آخرین نسل پردازندههای هوش مصنوعی Ascend هواوی ساخته شده است.
آیا لانگکت-۲.۰ به اندازه GPT-4 یا Gemini توانمند است؟
بنچمارکهای اولیه نشان میدهند که لانگکت-۲.۰ در استدلال و کدنویسی در سطحی قابل مقایسه با مدلهای کلاس GPT-4 عمل میکند، اگرچه ممکن است از جدیدترین تکرارهای مطلق مدلهای غربی عقب بماند.
چرا آموزش بر روی تراشههای داخلی اینقدر دشوار است؟
چالش اصلی شبکهسازی است. تراشههای داخلی از نظر تاریخی سرعت اتصال کندتری نسبت به NVLink انویدیا دارند، که به اشتراکگذاری کارآمد دادهها در میان دهها هزار تراشه مورد نیاز برای یک مدل یک تریلیون پارامتری را دشوار میکند.
آیا هر کسی میتواند از لانگکت-۲.۰ استفاده کند؟
مِیتوان یک نسخه کوچکتر ۷۰ میلیارد پارامتری را برای توسعهدهندگان به صورت متنباز منتشر کرده است، در حالی که مدل کامل یک تریلیون پارامتری از طریق API قابل دسترسی است.
منابع
[1]Reutersواقعگرایان ژئوپلیتیک
Meituan launches LongCat-2.0, claiming first trillion-parameter model on Chinese chips
مطالعه در Reuters →[2]South China Morning Postخوشبینان فناوری داخلی
China's Meituan breaks AI reliance on Nvidia with LongCat-2.0 release
مطالعه در South China Morning Post →[3]Bloombergواقعگرایان ژئوپلیتیک
Meituan's Trillion-Parameter AI Shows China's Silicon Resilience
مطالعه در Bloomberg →[4]TechNodeخوشبینان فناوری داخلی
Inside Meituan's LongCat-2.0: How domestic silicon powered a frontier model
مطالعه در TechNode →[5]SemiAnalysisشکاکان سختافزاری
The Interconnect Miracle: How LongCat-2.0 Bypassed NVLink
مطالعه در SemiAnalysis →[6]arXivشکاکان سختافزاری
LongCat-2.0: Scaling Laws and Fault Tolerance on Heterogeneous Domestic Clusters
مطالعه در arXiv →[7]Meituan Tech Blogخوشبینان فناوری داخلی
LongCat-2.0 Technical Report: Training at the Trillion-Parameter Scale
مطالعه در Meituan Tech Blog →[8]IEEE Spectrumشکاکان سختافزاری
The Software Stack Behind China's Domestic AI Push
مطالعه در IEEE Spectrum →
هر زاویه. هر روز.
دریافت هوش مصنوعی اخبار همراه با پوشش کامل منابع و تحلیل دیدگاهها، مستقیم در صندوق ورودی شما.









