توضیح کوهستانزیرساخت هوش مصنوعیتحول صنعتی۱۳ تیر ۱۴۰۵، ۱۸:۲۴· 5 دقیقه مطالعه

شتاب گرفتن انتقال هوش مصنوعی تولیدی به ابر خصوصی توسط شرکت‌ها برای کنترل هزینه و حاکمیت داده

Q: هوش مصنوعی حاکمیتی چیست؟

بازگرداندن هوش مصنوعی فرآیند انتقال حجم کاری هوش مصنوعی، مانند اجرای مدلهای زبان بزرگ، از محیطهای ابر عمومی به سرورهای خصوصی و داخلی (در محل) است.

Q: چرا شرکتها هوش مصنوعی را از ابر خارج میکنند؟

محرکهای اصلی هزینه و امنیت هستند. اجرای استنتاج هوش مصنوعی با حجم بالا در ابر میتواند بسیار گران باشد، و بسیاری از شرکتها تمایلی به ارسال دادههای اختصاصی حساس به APIهای خارجی ندارند.

Q: آیا این بدان معناست که ابر عمومی برای هوش مصنوعی از بین رفته است؟

خیر. ابر عمومی همچنان محیط ترجیحی برای آموزش مدلهای عظیم جدید و آزمایش در مراحل اولیه است. اکثر شرکتها رویکرد ترکیبی را اتخاذ میکنند و از ابر برای آموزش و اوج تقاضا استفاده میکنند، در حالی که استنتاج پایدار را به صورت داخلی نگه میدارند.

Q: چه چیزی هوش مصنوعی داخلی را اکنون ممکن میسازد؟

بهبود سریع مدلهای متنباز، که کوچکتر و کارآمدتر از مدلهای اختصاصی اولیه هستند، اجرای هوش مصنوعی بسیار توانمند را بر روی قفسههای سرور استاندارد سازمانی امکانپذیر کرده است.

شرکت‌های بزرگ به طور فزاینده‌ای در حال خارج کردن حجم کاری هوش مصنوعی از ابرهای عمومی و انتقال آنها به زیرساخت‌های خصوصی و داخلی (در محل) هستند. این تغییر که ناشی از افزایش هزینه‌های API، نگرانی‌های مربوط به حریم خصوصی داده‌ها و بلوغ مدل‌های متن‌باز است، نشان‌دهنده یک عقب‌گرد قابل توجه از استراتژی «اول ابری» است که بر دوران اولیه رونق هوش مصنوعی مولد حاکم بود.

به قلم تیم سردبیری کوهستان

این خبر را به اشتراک بگذارید

رهبران فناوری اطلاعات سازمانی 40%تحلیلگران صنعت 35%ارائه‌دهندگان سخت‌افزار 25%

رهبران فناوری اطلاعات سازمانی: تمرکز بر بازیابی کنترل بر حاکمیت داده، کاهش هزینه‌های غیرقابل پیش‌بینی API و تضمین انطباق با انتقال حجم کاری حیاتی هوش مصنوعی به داخل سازمان.
تحلیلگران صنعت: این تغییر را بلوغ طبیعی بازار هوش مصنوعی می‌دانند و آینده‌ای ترکیبی را پیش‌بینی می‌کنند که در آن استنتاج پایدار در محل اجرا می‌شود، در حالی که آموزش مدل‌ها در ابر باقی می‌ماند.
ارائه‌دهندگان سخت‌افزار: با ارائه تراشه‌های استنتاج تخصصی و پشته‌های نرم‌افزاری طراحی شده برای آسان‌تر کردن استقرار هوش مصنوعی داخلی برای شرکت‌ها، از این روند بهره می‌برند.

زوایای پوشش‌داده‌نشده

· ارائه‌دهندگان ابر عمومی (AWS، گوگل کلود، آژور)
· توسعه‌دهندگان هوش مصنوعی متن‌باز

چرا مهم است

حرکت به سمت زیرساخت خصوصی هوش مصنوعی، کنترل بیشتری بر داده‌ها به شرکت‌ها می‌دهد و هزینه اجرای هوش مصنوعی در مقیاس بزرگ را به طور چشمگیری کاهش می‌دهد. برای مصرف‌کنندگان، این بدان معناست که کسب‌وکارهای بیشتری می‌توانند هوش مصنوعی را در محصولات خود ادغام کنند، بدون اینکه هزینه‌های هنگفت محاسبات ابری را به مشتری منتقل کنند یا حریم خصوصی کاربران را به خطر بیندازند.

نکات کلیدی

شرکت‌ها به طور فزاینده‌ای حجم کاری هوش مصنوعی را از ابرهای عمومی به زیرساخت‌های خصوصی منتقل می‌کنند.
این تغییر ناشی از هزینه بالای APIهای ابری برای استنتاج تولیدی در وضعیت پایدار است.
نگرانی‌های مربوط به حریم خصوصی داده‌ها و حاکمیت، پذیرش «هوش مصنوعی حاکمیتی» را تسریع می‌کند.
مدل‌های متن‌باز بسیار توانمند، اجرای کارآمد هوش مصنوعی را بر روی سخت‌افزارهای کوچک‌تر امکان‌پذیر می‌سازند.
تحلیلگران آینده‌ای ترکیبی را پیش‌بینی می‌کنند که در آن آموزش در ابر انجام می‌شود، اما استنتاج تولیدی به صورت داخلی اجرا می‌گردد.

50–70%

کاهش بالقوه هزینه استنتاج

30%

حجم کاری هوش مصنوعی مولد داخلی تا ۲۰۲۷ (گارتنر)

<5%

حجم کاری هوش مصنوعی مولد داخلی در ۲۰۲۳

هجوم اولیه برای پذیرش هوش مصنوعی مولد با یک معماری واحد و غالب تعریف می‌شد: ارسال داده‌ها به مدل‌های عظیمی که در ابر عمومی میزبانی شده بودند. اما با تبدیل شدن برنامه‌های آزمایشی به استقرار کامل تولیدی، یک تغییر معماری آرام اما عمیق آغاز شده است. شرکت‌های بزرگ به طور فزاینده‌ای درگیر «بازگرداندن هوش مصنوعی» هستند—یعنی خارج کردن مدل‌های زبان بزرگ (LLM) خود از محیط‌های ابر عمومی و انتقال آنها به زیرساخت‌های خصوصی و داخلی (در محل) [1][2].[1]

این حرکت نشان‌دهنده یک عقب‌گرد قابل توجه از دستورالعمل ده ساله «اول ابری» است که بر فناوری اطلاعات سازمانی حاکم بود. نیروهای محرک، ترکیبی از افزایش هزینه‌های استنتاج (Inference)، الزامات سخت‌گیرانه حاکمیت داده، و بلوغ سریع مدل‌های متن‌باز بسیار توانمندی هستند که می‌توانند به طور کارآمد بر روی سخت‌افزارهای کوچک‌تر اجرا شوند [1][3].[1][2]

اقتصاد استنتاج هوش مصنوعی—فرآیند اجرای یک مدل آموزش‌دیده برای تولید پاسخ—در مقیاس بزرگ، اساساً با مرحله نمونه‌سازی متفاوت به نظر می‌رسد. هنگامی که یک شرکت در حال آزمایش یک قابلیت هوش مصنوعی است، پرداخت چند سنت به ازای هر فراخوانی API به ارائه‌دهنده ابری، بسیار مقرون به صرفه است. با این حال، زمانی که آن قابلیت برای میلیون‌ها کاربر مستقر می‌شود، هزینه‌های API می‌تواند به سرعت از درآمد حاصل از محصول پیشی بگیرد [6].

شرکت سرمایه‌گذاری خطرپذیر آندرسن هوروویتز (a16z) اخیراً تحلیلی منتشر کرده که نشان می‌دهد برای حجم کاری مداوم و پرحجم هوش مصنوعی، اجرای مدل‌ها بر روی زیرساخت‌های متعلق به خود سازمان می‌تواند هزینه‌های استنتاج را ۵۰ تا ۷۰ درصد در مقایسه با اتکای کامل به APIهای ابری مدیریت‌شده، کاهش دهد [6]. این گزارش خاطرنشان کرد: «ابر برای آموزش و آزمایش عالی است. اما برای استنتاج تولیدی در وضعیت پایدار، حق بیمه دریافت شده توسط ارائه‌دهندگان ابری به مالیاتی هنگفت بر حاشیه سود تبدیل می‌شود» [6].

فراتر از هزینه، حاکمیت داده و امنیت نیز روند بازگرداندن هوش مصنوعی را تسریع می‌کنند. بسیاری از شرکت‌ها، به ویژه در صنایع بسیار قانون‌گذاری شده مانند مالی، مراقبت‌های بهداشتی و دفاعی، اساساً تمایلی به ارسال داده‌های اختصاصی یا اطلاعات حساس مشتریان به APIهای ابری خارجی ندارند [2][3].[2]

این نگرانی صرفاً تئوری نیست. گزارش‌های اخیر نشان می‌دهند که شرکت‌های بزرگ فناوری فعالانه استفاده از ابزارهای هوش مصنوعی خارجی را برای محافظت از مالکیت فکری خود محدود می‌کنند. به عنوان مثال، علی‌بابا (Alibaba) اخیراً «کد کلود» (Claude Code) شرکت آنتروپیک (Anthropic) را به عنوان «نرم‌افزار پرخطر» طبقه‌بندی کرده و کارکنان خود را از استفاده از آن منع کرده است، که این امر اضطراب فزاینده در مورد نشت داده‌ها از طریق خدمات هوش مصنوعی شخص ثالث را برجسته می‌کند [7].[4]

با میزبانی مدل‌ها به صورت داخلی (در محل) یا در ابرهای خصوصی اختصاصی، سازمان‌ها می‌توانند اطمینان حاصل کنند که داده‌هایشان هرگز از محدوده امنیتی آنها خارج نمی‌شود. این رویکرد «هوش مصنوعی حاکمیتی» به شرکت‌ها اجازه می‌دهد تا مدل‌ها را بر اساس حساس‌ترین داده‌های داخلی خود تنظیم دقیق کنند، بدون اینکه خطر افشا شدن در برابر ارائه‌دهندگان خارجی یا نقض چارچوب‌های انطباق را متحمل شوند [5].

با میزبانی مدل‌ها به صورت داخلی (در محل) یا در ابرهای خصوصی اختصاصی، سازمان‌ها می‌توانند اطمینان حاصل کنند که داده‌هایشان هرگز از محدوده امنیتی آنها خارج نمی‌شود.

امکان‌پذیری بازگرداندن هوش مصنوعی به طور چشمگیری با ظهور مدل‌های متن‌باز و مدل‌های با وزن‌های باز (Open-Weights) بسیار توانمند بهبود یافته است. در روزهای اولیه رونق هوش مصنوعی مولد، تنها راه دسترسی به عملکرد پیشرفته، از طریق APIهای اختصاصی شرکت‌هایی مانند OpenAI یا Anthropic بود [1].[1]

با این حال، امروزه مدل‌هایی مانند لاما ۳ (Llama 3) متا، میکسترال (Mixtral) میسترال، و معماری‌های مختلف متن‌باز تخصصی، عملکردی را ارائه می‌دهند که برای بسیاری از موارد استفاده سازمانی، با مدل‌های اختصاصی رقابت کرده یا از آنها پیشی می‌گیرد [1][6]. نکته حیاتی این است که این مدل‌ها اغلب کوچک‌تر و کارآمدتر هستند، به این معنی که می‌توانند روی یک قفسه سرور واحد اجرا شوند و نیازی به یک مرکز داده عظیم ندارند [6].[1]

اکوسیستم سخت‌افزاری نیز در حال تطبیق با این تغییر است. در حالی که انویدیا (NVIDIA) همچنان نیروی غالب در آموزش هوش مصنوعی باقی مانده است، بازار سخت‌افزار استنتاج در حال متنوع شدن است. شرکت‌ها به طور فزاینده‌ای در حال استقرار شتاب‌دهنده‌های هوش مصنوعی تخصصی و پیکربندی‌های سرور بهینه‌سازی شده هستند که به طور خاص برای اجرای کارآمد مدل‌ها در محل طراحی شده‌اند [5].

خود انویدیا این روند را به رسمیت شناخته و به شدت در حال ترویج مجموعه نرم‌افزاری «NVIDIA AI Enterprise» خود است که برای کمک به شرکت‌ها در استقرار و مدیریت امن حجم کاری هوش مصنوعی در مراکز داده خود طراحی شده است [5]. این شرکت استدلال می‌کند که هر شرکت بزرگ در نهایت به «کارخانه هوش مصنوعی» خود برای پردازش داده‌های اختصاصی‌اش نیاز خواهد داشت [5].

این انتقال بدون چالش نیست. مدیریت زیرساخت هوش مصنوعی داخلی نیازمند استعدادهای تخصصی است که در حال حاضر کمیاب هستند. شرکت‌ها باید پیچیدگی‌های استقرار، نظارت و مقیاس‌گذاری مدل را مدیریت کنند—وظایفی که توسط خدمات ابری مدیریت‌شده ساده‌سازی می‌شوند [2].

علاوه بر این، هزینه‌های سرمایه‌ای اولیه مورد نیاز برای خرید سخت‌افزار هوش مصنوعی می‌تواند قابل توجه باشد، حتی اگر هزینه‌های عملیاتی بلندمدت کمتر باشد. این پویایی منجر به ظهور معماری‌های ترکیبی (هیبریدی) شده است، جایی که شرکت‌ها از زیرساخت‌های داخلی برای حجم کاری پایدار و داده‌های حساس استفاده می‌کنند، در حالی که در دوره‌های اوج تقاضا یا هنگام دسترسی به بزرگترین مدل‌های پیشرو، به ابر عمومی «جهش» (Bursting) می‌کنند [3][4].[2][3]

شرکت تحقیقاتی گارتنر (Gartner) پیش‌بینی می‌کند که تا سال ۲۰۲۷، ۳۰ درصد از حجم کاری هوش مصنوعی مولد به صورت داخلی یا در ابرهای خصوصی اجرا خواهد شد، که این رقم از کمتر از ۵ درصد در سال ۲۰۲۳ افزایش می‌یابد [4]. این پیش‌بینی بر اهمیت و بزرگی تغییر معماری در حال انجام تأکید می‌کند.[3]

در نهایت، بازگرداندن حجم کاری هوش مصنوعی نشان‌دهنده بلوغ این فناوری است. همانطور که هوش مصنوعی از یک آزمایش جدید به یک عملکرد اصلی کسب‌وکار تبدیل می‌شود، شرکت‌ها همان تحلیل دقیق هزینه-فایده و استانداردهای امنیتی را که برای هر زیرساخت حیاتی فناوری اطلاعات دیگر اعمال می‌کنند، برای هوش مصنوعی نیز به کار می‌برند [1][2]. نتیجه، یک اکوسیستم هوش مصنوعی غیرمتمرکزتر، امن‌تر و پایدارتر از نظر اقتصادی است.[1]

روند رویداد

2023
رونق هوش مصنوعی مولد آغاز می‌شود که با هجوم گسترده برای استفاده از APIهای ابری اختصاصی شرکت‌هایی مانند OpenAI مشخص می‌شود.
Early 2024
شرکت‌ها شروع به انتقال پروژه‌های هوش مصنوعی از فاز آزمایشی به تولید می‌کنند، که منجر به افزایش غیرمنتظره هزینه‌های استنتاج ابری می‌شود.
Mid 2024
انتشار مدل‌های متن‌باز بسیار توانمند مانند لاما ۳ (Llama 3)، جایگزین‌های مناسبی برای مدل‌های ابری اختصاصی فراهم می‌کند.
2025
فروشندگان سخت‌افزار، تراشه‌های استنتاج تخصصی طراحی شده برای استقرار کارآمد هوش مصنوعی داخلی را منتشر می‌کنند.
2026
روند «بازگرداندن هوش مصنوعی» با اولویت‌بندی حاکمیت داده و کنترل هزینه برای حجم کاری تولیدی توسط شرکت‌های بزرگ، شتاب می‌گیرد.

بررسی عمیق دیدگاه‌ها

رهبران فناوری اطلاعات سازمانی

تمرکز بر بازیابی کنترل بر حاکمیت داده، کاهش هزینه‌های غیرقابل پیش‌بینی API و تضمین انطباق با انتقال حجم کاری حیاتی هوش مصنوعی به داخل سازمان.

برای مدیران ارشد اطلاعات (CIOs) و رهبران فناوری اطلاعات، حرکت به سمت هوش مصنوعی داخلی اساساً در مورد مدیریت ریسک و اقتصاد واحد است. در حالی که ابر عمومی سریع‌ترین مسیر را برای پذیرش اولیه هوش مصنوعی فراهم کرد، ساختار هزینه متغیر فراخوانی‌های API زمانی که برای میلیون‌ها کاربر مستقر می‌شود، غیرقابل دفاع می‌شود. علاوه بر این، مقررات سخت‌گیرانه حریم خصوصی داده‌ها و خطر نشت مالکیت فکری، ارسال داده‌های حساس شرکتی به مدل‌های شخص ثالث را برای بسیاری از سازمان‌ها غیرممکن می‌سازد. این رهبران استدلال می‌کنند که با ساخت «کارخانه‌های هوش مصنوعی» خصوصی، می‌توانند ضمن حفظ کنترل مطلق بر داده‌های خود، به هزینه‌های قابل پیش‌بینی دست یابند.

تحلیلگران صنعت

این تغییر را بلوغ طبیعی بازار هوش مصنوعی می‌دانند و آینده‌ای ترکیبی را پیش‌بینی می‌کنند که در آن استنتاج پایدار در محل اجرا می‌شود، در حالی که آموزش مدل‌ها در ابر باقی می‌ماند.

تحلیلگران بازار، روند بازگرداندن هوش مصنوعی را نه به عنوان رد ابر، بلکه به عنوان بهینه‌سازی چرخه عمر هوش مصنوعی می‌بینند. آنها اشاره می‌کنند که آموزش مدل‌های بنیادی عظیم همچنان نیازمند قدرت محاسباتی عظیم و انعطاف‌پذیری است که فقط ارائه‌دهندگان ابر بزرگ (هایپراسکالرها) می‌توانند فراهم کنند. با این حال، هنگامی که یک مدل آموزش داده و بهینه‌سازی شد، اجرای مداوم آن (استنتاج) یک حجم کاری بسیار قابل پیش‌بینی است که اغلب اجرای آن بر روی سخت‌افزار متعلق به خود سازمان ارزان‌تر است. تحلیلگران پیش‌بینی می‌کنند که آینده هوش مصنوعی سازمانی ترکیبی خواهد بود: استفاده از ابر برای آموزش و اوج تقاضا، در حالی که برای تولید پایدار به زیرساخت خصوصی متکی است.

ارائه‌دهندگان سخت‌افزار

با ارائه تراشه‌های استنتاج تخصصی و پشته‌های نرم‌افزاری طراحی شده برای آسان‌تر کردن استقرار هوش مصنوعی داخلی برای شرکت‌ها، از این روند بهره می‌برند.

شرکت‌هایی که سخت‌افزار هوش مصنوعی تولید می‌کنند، روند بازگرداندن هوش مصنوعی را به عنوان گسترش عظیمی از بازار هدف کلی خود می‌بینند. به جای فروش انحصاری به تعداد انگشت‌شماری از ارائه‌دهندگان ابر عظیم، اکنون مستقیماً به شرکت‌های فورچون ۵۰۰ می‌فروشند. برای تسهیل این امر، ارائه‌دهندگان سخت‌افزار در حال توسعه شتاب‌دهنده‌های استنتاج تخصصی هستند که کارایی انرژی و هزینه‌های اولیه پایین‌تر را نسبت به قدرت خام آموزش در اولویت قرار می‌دهند. آنها همچنین به شدت در پشته‌های نرم‌افزاری سرمایه‌گذاری می‌کنند که برای ساده‌سازی استقرار و مدیریت مدل‌های متن‌باز در مراکز داده خصوصی طراحی شده‌اند.

آنچه نمی‌دانیم

ارائه‌دهندگان بزرگ ابر عمومی تا چه حد قیمت‌های API خود را برای حفظ حجم کاری استنتاج سازمانی کاهش خواهند داد.
آیا کمبود مداوم استعدادهای تخصصی هوش مصنوعی، توانایی شرکت‌ها برای مدیریت زیرساخت‌های خود را با مشکل مواجه خواهد کرد یا خیر.
پیشرفت‌های آتی در کارایی مدل چگونه ممکن است تحلیل هزینه-فایده استقرار ابری در مقابل داخلی را تغییر دهد.

اصطلاحات کلیدی

استنتاج هوش مصنوعی: فرآیند اجرای یک مدل هوش مصنوعی آموزش‌دیده برای پیش‌بینی، تولید متن یا تحلیل داده‌ها بر اساس ورودی‌های جدید.
داخلی (در محل): نرم‌افزار یا سخت‌افزاری که بر روی رایانه‌های واقع در محل شخص یا سازمان استفاده‌کننده نصب و اجرا می‌شود، نه در یک مرکز راه دور مانند مزرعه سرور یا ابر.
مدل با وزن‌های باز: یک مدل هوش مصنوعی که پارامترهای از پیش آموزش‌دیده (وزن‌ها) آن به صورت عمومی در دسترس قرار می‌گیرد و به توسعه‌دهندگان اجازه می‌دهد مدل را بر روی سخت‌افزار خود اجرا، اصلاح و تنظیم دقیق کنند.
هوش مصنوعی حاکمیتی: مفهومی که در آن یک سازمان یا ملت کنترل کامل بر زیرساخت، مدل‌ها و داده‌های هوش مصنوعی خود را حفظ می‌کند و تضمین می‌کند که اطلاعات حساس در معرض نهادهای خارجی قرار نگیرند.

پرسش‌های متداول

هوش مصنوعی حاکمیتی چیست؟

بازگرداندن هوش مصنوعی فرآیند انتقال حجم کاری هوش مصنوعی، مانند اجرای مدل‌های زبان بزرگ، از محیط‌های ابر عمومی به سرورهای خصوصی و داخلی (در محل) است.

چرا شرکت‌ها هوش مصنوعی را از ابر خارج می‌کنند؟

محرک‌های اصلی هزینه و امنیت هستند. اجرای استنتاج هوش مصنوعی با حجم بالا در ابر می‌تواند بسیار گران باشد، و بسیاری از شرکت‌ها تمایلی به ارسال داده‌های اختصاصی حساس به APIهای خارجی ندارند.

آیا این بدان معناست که ابر عمومی برای هوش مصنوعی از بین رفته است؟

خیر. ابر عمومی همچنان محیط ترجیحی برای آموزش مدل‌های عظیم جدید و آزمایش در مراحل اولیه است. اکثر شرکت‌ها رویکرد ترکیبی را اتخاذ می‌کنند و از ابر برای آموزش و اوج تقاضا استفاده می‌کنند، در حالی که استنتاج پایدار را به صورت داخلی نگه می‌دارند.

چه چیزی هوش مصنوعی داخلی را اکنون ممکن می‌سازد؟

بهبود سریع مدل‌های متن‌باز، که کوچک‌تر و کارآمدتر از مدل‌های اختصاصی اولیه هستند، اجرای هوش مصنوعی بسیار توانمند را بر روی قفسه‌های سرور استاندارد سازمانی امکان‌پذیر کرده است.

منابع

[1]تیم سردبیری کوهستان
تحلیل تیم سردبیری کوهستان
مطالعه در تیم سردبیری کوهستان →
[2]The Wall Street Journalرهبران فناوری اطلاعات سازمانی
Companies Pull AI From the Cloud to Cut Costs, Protect Data
مطالعه در The Wall Street Journal →
[3]Gartnerتحلیلگران صنعت
Gartner Predicts 30% of GenAI Workloads Will Move On-Premises by 2027
مطالعه در Gartner →
[4]TechCrunch
Alibaba reportedly bans employees from using Claude Code
مطالعه در TechCrunch →

همیشه در جریان باشید

هر زاویه. هر روز.

دریافت فناوری اخبار همراه با پوشش کامل منابع و تحلیل دیدگاه‌ها، مستقیم در صندوق ورودی شما.

دریافت خلاصه خبری ←مرور فناوری