شتاب گرفتن انتقال هوش مصنوعی تولیدی به ابر خصوصی توسط شرکتها برای کنترل هزینه و حاکمیت داده
شرکتهای بزرگ به طور فزایندهای در حال خارج کردن حجم کاری هوش مصنوعی از ابرهای عمومی و انتقال آنها به زیرساختهای خصوصی و داخلی (در محل) هستند. این تغییر که ناشی از افزایش هزینههای API، نگرانیهای مربوط به حریم خصوصی دادهها و بلوغ مدلهای متنباز است، نشاندهنده یک عقبگرد قابل توجه از استراتژی «اول ابری» است که بر دوران اولیه رونق هوش مصنوعی مولد حاکم بود.
به قلم تیم سردبیری کوهستان
این خبر را به اشتراک بگذارید
- رهبران فناوری اطلاعات سازمانی
- تمرکز بر بازیابی کنترل بر حاکمیت داده، کاهش هزینههای غیرقابل پیشبینی API و تضمین انطباق با انتقال حجم کاری حیاتی هوش مصنوعی به داخل سازمان.
- تحلیلگران صنعت
- این تغییر را بلوغ طبیعی بازار هوش مصنوعی میدانند و آیندهای ترکیبی را پیشبینی میکنند که در آن استنتاج پایدار در محل اجرا میشود، در حالی که آموزش مدلها در ابر باقی میماند.
- ارائهدهندگان سختافزار
- با ارائه تراشههای استنتاج تخصصی و پشتههای نرمافزاری طراحی شده برای آسانتر کردن استقرار هوش مصنوعی داخلی برای شرکتها، از این روند بهره میبرند.
زوایای پوششدادهنشده
- · ارائهدهندگان ابر عمومی (AWS، گوگل کلود، آژور)
- · توسعهدهندگان هوش مصنوعی متنباز
چرا مهم است
حرکت به سمت زیرساخت خصوصی هوش مصنوعی، کنترل بیشتری بر دادهها به شرکتها میدهد و هزینه اجرای هوش مصنوعی در مقیاس بزرگ را به طور چشمگیری کاهش میدهد. برای مصرفکنندگان، این بدان معناست که کسبوکارهای بیشتری میتوانند هوش مصنوعی را در محصولات خود ادغام کنند، بدون اینکه هزینههای هنگفت محاسبات ابری را به مشتری منتقل کنند یا حریم خصوصی کاربران را به خطر بیندازند.
نکات کلیدی
- شرکتها به طور فزایندهای حجم کاری هوش مصنوعی را از ابرهای عمومی به زیرساختهای خصوصی منتقل میکنند.
- این تغییر ناشی از هزینه بالای APIهای ابری برای استنتاج تولیدی در وضعیت پایدار است.
- نگرانیهای مربوط به حریم خصوصی دادهها و حاکمیت، پذیرش «هوش مصنوعی حاکمیتی» را تسریع میکند.
- مدلهای متنباز بسیار توانمند، اجرای کارآمد هوش مصنوعی را بر روی سختافزارهای کوچکتر امکانپذیر میسازند.
- تحلیلگران آیندهای ترکیبی را پیشبینی میکنند که در آن آموزش در ابر انجام میشود، اما استنتاج تولیدی به صورت داخلی اجرا میگردد.
هجوم اولیه برای پذیرش هوش مصنوعی مولد با یک معماری واحد و غالب تعریف میشد: ارسال دادهها به مدلهای عظیمی که در ابر عمومی میزبانی شده بودند. اما با تبدیل شدن برنامههای آزمایشی به استقرار کامل تولیدی، یک تغییر معماری آرام اما عمیق آغاز شده است. شرکتهای بزرگ به طور فزایندهای درگیر «بازگرداندن هوش مصنوعی» هستند—یعنی خارج کردن مدلهای زبان بزرگ (LLM) خود از محیطهای ابر عمومی و انتقال آنها به زیرساختهای خصوصی و داخلی (در محل) [1][2].[1][2]
این حرکت نشاندهنده یک عقبگرد قابل توجه از دستورالعمل ده ساله «اول ابری» است که بر فناوری اطلاعات سازمانی حاکم بود. نیروهای محرک، ترکیبی از افزایش هزینههای استنتاج (Inference)، الزامات سختگیرانه حاکمیت داده، و بلوغ سریع مدلهای متنباز بسیار توانمندی هستند که میتوانند به طور کارآمد بر روی سختافزارهای کوچکتر اجرا شوند [1][3].[1][3]
اقتصاد استنتاج هوش مصنوعی—فرآیند اجرای یک مدل آموزشدیده برای تولید پاسخ—در مقیاس بزرگ، اساساً با مرحله نمونهسازی متفاوت به نظر میرسد. هنگامی که یک شرکت در حال آزمایش یک قابلیت هوش مصنوعی است، پرداخت چند سنت به ازای هر فراخوانی API به ارائهدهنده ابری، بسیار مقرون به صرفه است. با این حال، زمانی که آن قابلیت برای میلیونها کاربر مستقر میشود، هزینههای API میتواند به سرعت از درآمد حاصل از محصول پیشی بگیرد [6].[6]
شرکت سرمایهگذاری خطرپذیر آندرسن هوروویتز (a16z) اخیراً تحلیلی منتشر کرده که نشان میدهد برای حجم کاری مداوم و پرحجم هوش مصنوعی، اجرای مدلها بر روی زیرساختهای متعلق به خود سازمان میتواند هزینههای استنتاج را ۵۰ تا ۷۰ درصد در مقایسه با اتکای کامل به APIهای ابری مدیریتشده، کاهش دهد [6]. این گزارش خاطرنشان کرد: «ابر برای آموزش و آزمایش عالی است. اما برای استنتاج تولیدی در وضعیت پایدار، حق بیمه دریافت شده توسط ارائهدهندگان ابری به مالیاتی هنگفت بر حاشیه سود تبدیل میشود» [6].[6]
فراتر از هزینه، حاکمیت داده و امنیت نیز روند بازگرداندن هوش مصنوعی را تسریع میکنند. بسیاری از شرکتها، به ویژه در صنایع بسیار قانونگذاری شده مانند مالی، مراقبتهای بهداشتی و دفاعی، اساساً تمایلی به ارسال دادههای اختصاصی یا اطلاعات حساس مشتریان به APIهای ابری خارجی ندارند [2][3].[2][3]
این نگرانی صرفاً تئوری نیست. گزارشهای اخیر نشان میدهند که شرکتهای بزرگ فناوری فعالانه استفاده از ابزارهای هوش مصنوعی خارجی را برای محافظت از مالکیت فکری خود محدود میکنند. به عنوان مثال، علیبابا (Alibaba) اخیراً «کد کلود» (Claude Code) شرکت آنتروپیک (Anthropic) را به عنوان «نرمافزار پرخطر» طبقهبندی کرده و کارکنان خود را از استفاده از آن منع کرده است، که این امر اضطراب فزاینده در مورد نشت دادهها از طریق خدمات هوش مصنوعی شخص ثالث را برجسته میکند [7].[7]
با میزبانی مدلها به صورت داخلی (در محل) یا در ابرهای خصوصی اختصاصی، سازمانها میتوانند اطمینان حاصل کنند که دادههایشان هرگز از محدوده امنیتی آنها خارج نمیشود. این رویکرد «هوش مصنوعی حاکمیتی» به شرکتها اجازه میدهد تا مدلها را بر اساس حساسترین دادههای داخلی خود تنظیم دقیق کنند، بدون اینکه خطر افشا شدن در برابر ارائهدهندگان خارجی یا نقض چارچوبهای انطباق را متحمل شوند [5].[5]
با میزبانی مدلها به صورت داخلی (در محل) یا در ابرهای خصوصی اختصاصی، سازمانها میتوانند اطمینان حاصل کنند که دادههایشان هرگز از محدوده امنیتی آنها خارج نمیشود.
امکانپذیری بازگرداندن هوش مصنوعی به طور چشمگیری با ظهور مدلهای متنباز و مدلهای با وزنهای باز (Open-Weights) بسیار توانمند بهبود یافته است. در روزهای اولیه رونق هوش مصنوعی مولد، تنها راه دسترسی به عملکرد پیشرفته، از طریق APIهای اختصاصی شرکتهایی مانند OpenAI یا Anthropic بود [1].[1]
با این حال، امروزه مدلهایی مانند لاما ۳ (Llama 3) متا، میکسترال (Mixtral) میسترال، و معماریهای مختلف متنباز تخصصی، عملکردی را ارائه میدهند که برای بسیاری از موارد استفاده سازمانی، با مدلهای اختصاصی رقابت کرده یا از آنها پیشی میگیرد [1][6]. نکته حیاتی این است که این مدلها اغلب کوچکتر و کارآمدتر هستند، به این معنی که میتوانند روی یک قفسه سرور واحد اجرا شوند و نیازی به یک مرکز داده عظیم ندارند [6].[1][6]
اکوسیستم سختافزاری نیز در حال تطبیق با این تغییر است. در حالی که انویدیا (NVIDIA) همچنان نیروی غالب در آموزش هوش مصنوعی باقی مانده است، بازار سختافزار استنتاج در حال متنوع شدن است. شرکتها به طور فزایندهای در حال استقرار شتابدهندههای هوش مصنوعی تخصصی و پیکربندیهای سرور بهینهسازی شده هستند که به طور خاص برای اجرای کارآمد مدلها در محل طراحی شدهاند [5].[5]
خود انویدیا این روند را به رسمیت شناخته و به شدت در حال ترویج مجموعه نرمافزاری «NVIDIA AI Enterprise» خود است که برای کمک به شرکتها در استقرار و مدیریت امن حجم کاری هوش مصنوعی در مراکز داده خود طراحی شده است [5]. این شرکت استدلال میکند که هر شرکت بزرگ در نهایت به «کارخانه هوش مصنوعی» خود برای پردازش دادههای اختصاصیاش نیاز خواهد داشت [5].[5]
این انتقال بدون چالش نیست. مدیریت زیرساخت هوش مصنوعی داخلی نیازمند استعدادهای تخصصی است که در حال حاضر کمیاب هستند. شرکتها باید پیچیدگیهای استقرار، نظارت و مقیاسگذاری مدل را مدیریت کنند—وظایفی که توسط خدمات ابری مدیریتشده سادهسازی میشوند [2].[2]
علاوه بر این، هزینههای سرمایهای اولیه مورد نیاز برای خرید سختافزار هوش مصنوعی میتواند قابل توجه باشد، حتی اگر هزینههای عملیاتی بلندمدت کمتر باشد. این پویایی منجر به ظهور معماریهای ترکیبی (هیبریدی) شده است، جایی که شرکتها از زیرساختهای داخلی برای حجم کاری پایدار و دادههای حساس استفاده میکنند، در حالی که در دورههای اوج تقاضا یا هنگام دسترسی به بزرگترین مدلهای پیشرو، به ابر عمومی «جهش» (Bursting) میکنند [3][4].[3][4]
شرکت تحقیقاتی گارتنر (Gartner) پیشبینی میکند که تا سال ۲۰۲۷، ۳۰ درصد از حجم کاری هوش مصنوعی مولد به صورت داخلی یا در ابرهای خصوصی اجرا خواهد شد، که این رقم از کمتر از ۵ درصد در سال ۲۰۲۳ افزایش مییابد [4]. این پیشبینی بر اهمیت و بزرگی تغییر معماری در حال انجام تأکید میکند.[4]
در نهایت، بازگرداندن حجم کاری هوش مصنوعی نشاندهنده بلوغ این فناوری است. همانطور که هوش مصنوعی از یک آزمایش جدید به یک عملکرد اصلی کسبوکار تبدیل میشود، شرکتها همان تحلیل دقیق هزینه-فایده و استانداردهای امنیتی را که برای هر زیرساخت حیاتی فناوری اطلاعات دیگر اعمال میکنند، برای هوش مصنوعی نیز به کار میبرند [1][2]. نتیجه، یک اکوسیستم هوش مصنوعی غیرمتمرکزتر، امنتر و پایدارتر از نظر اقتصادی است.[1][2]
روند رویداد
2023
رونق هوش مصنوعی مولد آغاز میشود که با هجوم گسترده برای استفاده از APIهای ابری اختصاصی شرکتهایی مانند OpenAI مشخص میشود.
Early 2024
شرکتها شروع به انتقال پروژههای هوش مصنوعی از فاز آزمایشی به تولید میکنند، که منجر به افزایش غیرمنتظره هزینههای استنتاج ابری میشود.
Mid 2024
انتشار مدلهای متنباز بسیار توانمند مانند لاما ۳ (Llama 3)، جایگزینهای مناسبی برای مدلهای ابری اختصاصی فراهم میکند.
2025
فروشندگان سختافزار، تراشههای استنتاج تخصصی طراحی شده برای استقرار کارآمد هوش مصنوعی داخلی را منتشر میکنند.
2026
روند «بازگرداندن هوش مصنوعی» با اولویتبندی حاکمیت داده و کنترل هزینه برای حجم کاری تولیدی توسط شرکتهای بزرگ، شتاب میگیرد.
بررسی عمیق دیدگاهها
رهبران فناوری اطلاعات سازمانی
تمرکز بر بازیابی کنترل بر حاکمیت داده، کاهش هزینههای غیرقابل پیشبینی API و تضمین انطباق با انتقال حجم کاری حیاتی هوش مصنوعی به داخل سازمان.
برای مدیران ارشد اطلاعات (CIOs) و رهبران فناوری اطلاعات، حرکت به سمت هوش مصنوعی داخلی اساساً در مورد مدیریت ریسک و اقتصاد واحد است. در حالی که ابر عمومی سریعترین مسیر را برای پذیرش اولیه هوش مصنوعی فراهم کرد، ساختار هزینه متغیر فراخوانیهای API زمانی که برای میلیونها کاربر مستقر میشود، غیرقابل دفاع میشود. علاوه بر این، مقررات سختگیرانه حریم خصوصی دادهها و خطر نشت مالکیت فکری، ارسال دادههای حساس شرکتی به مدلهای شخص ثالث را برای بسیاری از سازمانها غیرممکن میسازد. این رهبران استدلال میکنند که با ساخت «کارخانههای هوش مصنوعی» خصوصی، میتوانند ضمن حفظ کنترل مطلق بر دادههای خود، به هزینههای قابل پیشبینی دست یابند.
تحلیلگران صنعت
این تغییر را بلوغ طبیعی بازار هوش مصنوعی میدانند و آیندهای ترکیبی را پیشبینی میکنند که در آن استنتاج پایدار در محل اجرا میشود، در حالی که آموزش مدلها در ابر باقی میماند.
تحلیلگران بازار، روند بازگرداندن هوش مصنوعی را نه به عنوان رد ابر، بلکه به عنوان بهینهسازی چرخه عمر هوش مصنوعی میبینند. آنها اشاره میکنند که آموزش مدلهای بنیادی عظیم همچنان نیازمند قدرت محاسباتی عظیم و انعطافپذیری است که فقط ارائهدهندگان ابر بزرگ (هایپراسکالرها) میتوانند فراهم کنند. با این حال، هنگامی که یک مدل آموزش داده و بهینهسازی شد، اجرای مداوم آن (استنتاج) یک حجم کاری بسیار قابل پیشبینی است که اغلب اجرای آن بر روی سختافزار متعلق به خود سازمان ارزانتر است. تحلیلگران پیشبینی میکنند که آینده هوش مصنوعی سازمانی ترکیبی خواهد بود: استفاده از ابر برای آموزش و اوج تقاضا، در حالی که برای تولید پایدار به زیرساخت خصوصی متکی است.
ارائهدهندگان سختافزار
با ارائه تراشههای استنتاج تخصصی و پشتههای نرمافزاری طراحی شده برای آسانتر کردن استقرار هوش مصنوعی داخلی برای شرکتها، از این روند بهره میبرند.
شرکتهایی که سختافزار هوش مصنوعی تولید میکنند، روند بازگرداندن هوش مصنوعی را به عنوان گسترش عظیمی از بازار هدف کلی خود میبینند. به جای فروش انحصاری به تعداد انگشتشماری از ارائهدهندگان ابر عظیم، اکنون مستقیماً به شرکتهای فورچون ۵۰۰ میفروشند. برای تسهیل این امر، ارائهدهندگان سختافزار در حال توسعه شتابدهندههای استنتاج تخصصی هستند که کارایی انرژی و هزینههای اولیه پایینتر را نسبت به قدرت خام آموزش در اولویت قرار میدهند. آنها همچنین به شدت در پشتههای نرمافزاری سرمایهگذاری میکنند که برای سادهسازی استقرار و مدیریت مدلهای متنباز در مراکز داده خصوصی طراحی شدهاند.
آنچه نمیدانیم
- ارائهدهندگان بزرگ ابر عمومی تا چه حد قیمتهای API خود را برای حفظ حجم کاری استنتاج سازمانی کاهش خواهند داد.
- آیا کمبود مداوم استعدادهای تخصصی هوش مصنوعی، توانایی شرکتها برای مدیریت زیرساختهای خود را با مشکل مواجه خواهد کرد یا خیر.
- پیشرفتهای آتی در کارایی مدل چگونه ممکن است تحلیل هزینه-فایده استقرار ابری در مقابل داخلی را تغییر دهد.
اصطلاحات کلیدی
- استنتاج هوش مصنوعی
- فرآیند اجرای یک مدل هوش مصنوعی آموزشدیده برای پیشبینی، تولید متن یا تحلیل دادهها بر اساس ورودیهای جدید.
- داخلی (در محل)
- نرمافزار یا سختافزاری که بر روی رایانههای واقع در محل شخص یا سازمان استفادهکننده نصب و اجرا میشود، نه در یک مرکز راه دور مانند مزرعه سرور یا ابر.
- مدل با وزنهای باز
- یک مدل هوش مصنوعی که پارامترهای از پیش آموزشدیده (وزنها) آن به صورت عمومی در دسترس قرار میگیرد و به توسعهدهندگان اجازه میدهد مدل را بر روی سختافزار خود اجرا، اصلاح و تنظیم دقیق کنند.
- هوش مصنوعی حاکمیتی
- مفهومی که در آن یک سازمان یا ملت کنترل کامل بر زیرساخت، مدلها و دادههای هوش مصنوعی خود را حفظ میکند و تضمین میکند که اطلاعات حساس در معرض نهادهای خارجی قرار نگیرند.
پرسشهای متداول
هوش مصنوعی حاکمیتی چیست؟
بازگرداندن هوش مصنوعی فرآیند انتقال حجم کاری هوش مصنوعی، مانند اجرای مدلهای زبان بزرگ، از محیطهای ابر عمومی به سرورهای خصوصی و داخلی (در محل) است.
چرا شرکتها هوش مصنوعی را از ابر خارج میکنند؟
محرکهای اصلی هزینه و امنیت هستند. اجرای استنتاج هوش مصنوعی با حجم بالا در ابر میتواند بسیار گران باشد، و بسیاری از شرکتها تمایلی به ارسال دادههای اختصاصی حساس به APIهای خارجی ندارند.
آیا این بدان معناست که ابر عمومی برای هوش مصنوعی از بین رفته است؟
خیر. ابر عمومی همچنان محیط ترجیحی برای آموزش مدلهای عظیم جدید و آزمایش در مراحل اولیه است. اکثر شرکتها رویکرد ترکیبی را اتخاذ میکنند و از ابر برای آموزش و اوج تقاضا استفاده میکنند، در حالی که استنتاج پایدار را به صورت داخلی نگه میدارند.
چه چیزی هوش مصنوعی داخلی را اکنون ممکن میسازد؟
بهبود سریع مدلهای متنباز، که کوچکتر و کارآمدتر از مدلهای اختصاصی اولیه هستند، اجرای هوش مصنوعی بسیار توانمند را بر روی قفسههای سرور استاندارد سازمانی امکانپذیر کرده است.
منابع
[1]Factlen Editorial Team
Synthesis by Factlen editorial team
مطالعه در Factlen Editorial Team →[2]CIOرهبران فناوری اطلاعات سازمانی
The Great AI Repatriation: Why Enterprises Are Moving LLMs On-Prem
مطالعه در CIO →[3]The Wall Street Journalرهبران فناوری اطلاعات سازمانی
Companies Pull AI From the Cloud to Cut Costs, Protect Data
مطالعه در The Wall Street Journal →[4]Gartnerتحلیلگران صنعت
Gartner Predicts 30% of GenAI Workloads Will Move On-Premises by 2027
مطالعه در Gartner →[5]NVIDIA Blogارائهدهندگان سختافزار
The Shift to Sovereign AI: Why Enterprises are Building Their Own Factories
مطالعه در NVIDIA Blog →[6]a16zتحلیلگران صنعت
The Economics of AI Inference: Cloud vs. On-Prem
مطالعه در a16z →[7]TechCrunch
Alibaba reportedly bans employees from using Claude Code
مطالعه در TechCrunch →
هر زاویه. هر روز.
دریافت فناوری اخبار همراه با پوشش کامل منابع و تحلیل دیدگاهها، مستقیم در صندوق ورودی شما.









