استارتاپ هوش مصنوعی Baseten با جذب ۱.۵ میلیارد دلار سرمایه سری F، زیرساخت استقرار مدلها را توسعه میدهد
شرکت Baseten، ارائهدهنده زیرساخت هوش مصنوعی مستقر در سانفرانسیسکو، ۱.۵ میلیارد دلار سرمایه در دور تأمین مالی سری F جذب کرده تا پلتفرم استقرار مدلهای خود را گسترش دهد. این سرمایهگذاری هنگفت، بر تغییر گستردهتر صنعت به سمت بهینهسازی زیرساختهای فیزیکی و نرمافزاری مورد نیاز برای اجرای مدلهای هوش مصنوعی مولد در مقیاس بزرگ تأکید میکند.
به قلم تیم سردبیری کوهستان
این خبر را به اشتراک بگذارید
- سرمایهگذاران زیرساخت
- لایه استقرار هوش مصنوعی را به عنوان پل عوارضی نهایی و بسیار سودآور برای اقتصاد هوش مصنوعی مولد میبینند.
- تیمهای مهندسی سازمانی
- برای پلتفرمهای مستقلی ارزش قائلند که پیچیدگی سختافزاری را انتزاعی کرده و از قفل شدن توسط ارائهدهندگان ابری بزرگ جلوگیری میکنند.
- منتقدان بازار
- هشدار میدهند که الزامات سرمایهای عظیم زیرساخت هوش مصنوعی میتواند منجر به کالایی شدن (Commoditization) توسط غولهای فناوری ثروتمند شود.
زوایای پوششدادهنشده
- · توسعهدهندگان کوچکتر مدلهای منبع باز
- · تولیدکنندگان سختافزار فراتر از Nvidia و AMD
چرا مهم است
با حرکت هوش مصنوعی مولد از تحقیقات آزمایشگاهی به استفاده روزمره شرکتی، گلوگاه اصلی از آموزش مدلها به اجرای مقرونبهصرفه آنها تغییر یافته است. تزریق سرمایه عظیم به Baseten نشان میدهد که لایه زیرساخت – که هوش مصنوعی را برای عملیات تجاری روزانه سریع، قابل اعتماد و مقرونبهصرفه میسازد – به سرعت در حال بلوغ است و راه را برای پذیرش گستردهتر در سطح سازمانی هموار میکند.
نکات کلیدی
- Baseten ۱.۵ میلیارد دلار در دور سری F با رهبری مشترک Sequoia Capital و Andreessen Horowitz جذب کرد.
- این تأمین مالی ارزشگذاری پس از سرمایهگذاری این استارتاپ زیرساخت هوش مصنوعی را به ۱۲ میلیارد دلار میرساند.
- پلتفرم Baseten به شرکتها کمک میکند تا مدلهای هوش مصنوعی منبع باز را به طور کارآمد مستقر کنند و زمان پاسخدهی (Latency) و هزینههای محاسباتی را کاهش دهند.
- این سرمایه عمدتاً برای تأمین GPUهای نسل بعدی و گسترش عملیات مراکز داده جهانی استفاده خواهد شد.
- این سرمایهگذاری بر تغییر تمرکز صنعت از آموزش مدلهای بنیادی به اجرای مقرونبهصرفه آنها در محیط عملیاتی تأکید میکند.
شرکت Baseten، ارائهدهنده زیرساخت هوش مصنوعی مستقر در سانفرانسیسکو، یک دور تأمین مالی عظیم سری F به ارزش ۱.۵ میلیارد دلار جذب کرده است که ارزش پس از سرمایهگذاری شرکت را به ۱۲ میلیارد دلار میرساند. این دور که یکی از بزرگترین جذب سرمایههای خصوصی سال ۲۰۲۶ محسوب میشود، با رهبری مشترک Sequoia Capital و Andreessen Horowitz و مشارکت قابل توجه NVentures، بازوی سرمایهگذاری Nvidia، انجام شد. این تزریق سرمایه نشاندهنده یک تغییر قطعی در تمرکز صنعت هوش مصنوعی است؛ تمرکزی که از توسعه صرف مدلهای بنیادی عظیم به سمت لجستیک پیچیده استقرار کارآمد آنها در محیطهای سازمانی حرکت کرده است. با گذار شرکتها در سراسر جهان از آزمایش هوش مصنوعی به تولید در مقیاس کامل، تقاضا برای زیرساختهای استقرار قوی و مقیاسپذیر افزایش یافته و Baseten را در مرکز یک گلوگاه حیاتی صنعتی قرار داده است.[1][2]
برای درک اهمیت جذب سرمایه Baseten، تفکیک بین دو مرحله اصلی هوش مصنوعی ضروری است: آموزش (Training) و استنتاج/اجرا (Inference). آموزش فرآیندی است که نیاز به محاسبات فشرده دارد و طی آن مدل هوش مصنوعی با تغذیه حجم عظیمی از دادهها، آموزش میبیند؛ این مرحله در طول سالهای ۲۰۲۳ و ۲۰۲۴ بر سرفصلهای خبری و تأمین مالی سرمایهگذاری خطرپذیر تسلط داشت. در مقابل، استنتاج مرحلهای است که در آن مدل آموزشدیده عملاً به کار گرفته میشود و متن، تصویر یا پیشبینیهایی را در پاسخ به درخواستهای کاربر تولید میکند. در حالی که آموزش به انفجارهای عظیم و متمرکز قدرت محاسباتی نیاز دارد، استنتاج نیازمند زمان پاسخدهی (Latency) پایین، مداوم و پایداری بسیار بالا در سرور است. تحلیلگران صنعت اشاره میکنند که استنتاج اکنون بیش از هشتاد درصد از کل هزینههای محاسباتی مرتبط با هوش مصنوعی را برای برنامههای سازمانی تشکیل میدهد، که بهینهسازی را نه تنها یک مزیت فنی، بلکه یک ضرورت مالی میسازد.[3][4]
Baseten جایگاه خود را در بازار با ارائه یک لایه انتزاعی (Abstraction Layer) ایجاد کرده است که بین مدلهای پیچیده هوش مصنوعی و واحدهای پردازش گرافیکی خام (GPUs) مورد نیاز برای اجرای آنها قرار میگیرد. به طور سنتی، تیمهای مهندسی نرمافزار که تلاش میکردند مدلهای منبع باز مانند Llama 4 شرکت Meta یا جدیدترین معماریهای Mistral را مستقر کنند، با مجموعهای دلهرهآور از چالشهای زیرساختی مواجه بودند. آنها مجبور بودند سرورها را به صورت دستی تأمین کنند، تخصیص حافظه GPU را مدیریت کنند و کدهای سفارشی برای مدیریت افزایش ناگهانی ترافیک کاربران بنویسند. پلتفرم Baseten این فرآیندها را خودکار میکند و به توسعهدهندگان اجازه میدهد مدلها را با چند خط کد مستقر کنند، در حالی که سیستم زیرین به صورت پویا منابع محاسباتی را بر اساس تقاضای لحظهای افزایش یا کاهش میدهد. این قابلیت مقیاسبندی خودکار به ویژه برای جلوگیری از «شروع سرد» (Cold Start) حیاتی است؛ تأخیر آزاردهندهای که هنگام پرسوجوی ناگهانی از یک مدل هوش مصنوعی غیرفعال رخ میدهد.[1][5]
حجم عظیم ۱.۵ میلیارد دلاری دور سری F، ماهیت سرمایهبر رقابت در فضای زیرساخت هوش مصنوعی در سال ۲۰۲۶ را منعکس میکند. برخلاف استارتاپهای سنتی نرمافزار به عنوان سرویس (SaaS) که عمدتاً به سرمایه برای استعدادهای مهندسی و بازاریابی نیاز دارند، پلتفرمهای استقرار هوش مصنوعی باید تخصیصهای عظیمی از سختافزار فیزیکی را تأمین کنند. مدیران Baseten اعلام کردهاند که بخش عمدهای از سرمایه جدید صرف تأمین قراردادهای محاسباتی بلندمدت و خرید سیلیکونهای نسل بعدی، از جمله پردازندههای بسیار مورد تقاضای B100 Blackwell شرکت Nvidia و شتابدهندههای MI400X شرکت AMD خواهد شد. Baseten با تجمیع تقاضا در میان هزاران مشتری سازمانی، میتواند توافقنامههای خرید عمده سختافزار را مذاکره کند که برای شرکتهای منفردی که قصد ساخت رکهای سرور هوش مصنوعی خود را دارند، کاملاً غیرقابل دسترس خواهد بود.[2][6]
چشمانداز رقابتی برای استنتاج هوش مصنوعی در طول دوازده ماه گذشته به شدت تشدید شده و به یک میدان نبرد با ریسک بالا برای سرمایه خطرپذیر تبدیل شده است. Baseten مستقیماً با سایر استارتاپهای زیرساختی با سرمایه بالا مانند Together AI و Anyscale، و همچنین خدمات استقرار اختصاصی ارائه شده توسط غولهای ابری Amazon Web Services، Google Cloud و Microsoft Azure رقابت میکند. با این حال، Baseten با موفقیت خود را به عنوان یک جایگزین مستقل از ابر (Cloud-agnostic) معرفی کرده است. بسیاری از مدیران ارشد اطلاعات سازمانی به طور فزایندهای نگران گرفتار شدن در اکوسیستم هوش مصنوعی یک ارائهدهنده ابری بزرگ هستند. با استفاده از یک پلتفرم استقرار مستقل، شرکتها انعطافپذیری لازم برای هدایت بارهای کاری هوش مصنوعی خود به هر مرکز دادهای که در حال حاضر ارزانترین نرخ محاسباتی یا کمترین زمان پاسخدهی را برای یک منطقه جغرافیایی خاص ارائه میدهد، حفظ میکنند.[3][7]
چشمانداز رقابتی برای استنتاج هوش مصنوعی در طول دوازده ماه گذشته به شدت تشدید شده و به یک میدان نبرد با ریسک بالا برای سرمایه خطرپذیر تبدیل شده است.
یک محرک مهم رشد اخیر Baseten، پذیرش سریع مدلهای منبع باز و تنظیمشده سفارشی توسط بخش سازمانی بوده است. در حالی که رابطهای برنامهنویسی کاربردی اختصاصی (APIs) از شرکتهایی مانند OpenAI و Anthropic بر رونق اولیه هوش مصنوعی مولد تسلط داشتند، سال ۲۰۲۶ شاهد چرخش عظیمی به سمت حاکمیت دادهها (Data Sovereignty) بوده است. مؤسسات مالی، ارائهدهندگان خدمات درمانی و پیمانکاران دفاعی به طور فزایندهای در ارسال دادههای بسیار حساس و اختصاصی خود از طریق APIهای شخص ثالث تردید دارند. در عوض، آنها وزنهای مدلهای منبع باز را دانلود میکنند، آنها را در سرورهای داخلی تنظیم دقیق میکنند و در ابرهای خصوصی مجازی امن مستقر مینمایند. زیرساخت Baseten به طور خاص برای تسهیل این گردش کار طراحی شده است و امنیت و ایزولهسازی مورد نیاز صنایع تحت نظارت شدید را بدون قربانی کردن سرعت عملکردی که معمولاً با محصولات هوش مصنوعی در سطح مصرفکننده مرتبط است، فراهم میکند.[4][8]
فراتر از تأمین محاسبات خام، Baseten به شدت در تکنیکهای بهینهسازی نرمافزاری اختصاصی سرمایهگذاری کرده است که عملکرد بیشتری را از سختافزار موجود استخراج میکند. وبلاگ مهندسی این شرکت اخیراً جزئیاتی از پیشرفتها در دستهبندی پیوسته (Continuous Batching) و رمزگشایی حدسی (Speculative Decoding) را منتشر کرده است – روشهای الگوریتمی پیچیدهای که به یک GPU اجازه میدهد چندین درخواست کاربر را به طور همزمان به جای متوالی پردازش کند. طبق معیارهای داخلی که در طول اعلامیه تأمین مالی ذکر شد، این بهینهسازیهای سطح نرمافزار میتوانند زمان پاسخدهی استنتاج را تا هشتاد و پنج درصد در مقایسه با روشهای استاندارد استقرار کاهش دهند، در حالی که همزمان هزینه هر توکن تولید شده را بیش از نصف کاهش میدهند. برای یک برنامه سازمانی که به میلیونها کاربر روزانه خدمات میدهد، این افزایش کارایی مستقیماً به دهها میلیون دلار صرفهجویی عملیاتی سالانه تبدیل میشود.[1][5]
مشارکت NVentures شرکت Nvidia در این دور سری F، بر رابطه همزیستی بین تولیدکنندگان سختافزار و پلتفرمهای استقرار تأکید میکند. در حالی که Nvidia بر بازار تراشههای هوش مصنوعی تسلط دارد، این شرکت میداند که تقاضای بلندمدت برای سختافزار آن کاملاً به این بستگی دارد که توسعهدهندگان نرمافزار بتوانند به طور کارآمد از آن استفاده کنند. Nvidia با سرمایهگذاری در لایههای زیرساختی مانند Baseten، اطمینان حاصل میکند که اصطکاک استقرار مدلهای هوش مصنوعی تا حد ممکن پایین بماند و در نتیجه شرکتهای بیشتری را تشویق میکند تا هوش مصنوعی مولد را در عملیات روزانه خود ادغام کنند. این همسویی استراتژیک نشان میدهد که Baseten احتمالاً دسترسی اولویتدار به معماریهای سختافزاری جدید را به محض خروج از خطوط مونتاژ دریافت خواهد کرد، که یک مزیت رقابتی حیاتی در بازاری است که همچنان توسط گلوگاههای زنجیره تأمین سیلیکون محدود شده است.[2][6]

در آینده، Baseten قصد دارد بخشی از سرمایه سری F را برای گسترش ردپای جهانی خود، با ایجاد مراکز استنتاج محلی در اروپا و منطقه آسیا-اقیانوسیه استفاده کند. این گسترش ناشی از قوانین سختگیرانهتر محلیسازی دادهها، مانند قانون هوش مصنوعی اتحادیه اروپا، است که حکم میکند انواع خاصی از پردازش الگوریتمی باید در مرزهای جغرافیایی مشخصی انجام شود. Baseten با ایجاد یک شبکه توزیعشده از سرورهای استقرار، قصد دارد راهی یکپارچه برای مشتریان سازمانی فراهم کند تا با مقررات منطقهای مطابقت داشته باشند و در عین حال عملکرد برنامه ثابتی را در سراسر جهان حفظ کنند. این شرکت همچنین فعالانه در حال جذب استعدادهای تخصصی در مهندسی کامپایلر و معماری سیستمها است، که نشاندهنده قصد برای نزدیکتر کردن نرمافزار بهینهسازی خود به سختافزار خام GPUها است.[7][8]
در نهایت، دور تأمین مالی بزرگ Baseten به عنوان یک شاخص برای بلوغ صنعت هوش مصنوعی عمل میکند. دوران صرفاً اثبات اینکه مدلهای زبان بزرگ میتوانند وظایف پیچیده را انجام دهند، به پایان رسیده است؛ دوران کنونی کاملاً بر اقتصاد واحد، قابلیت اطمینان و مقیاس متمرکز است. همانطور که هوش مصنوعی از یک آزمایش تحقیقاتی جدید به زیرساخت اساسی اقتصاد دیجیتال مدرن تبدیل میشود، شرکتهایی که لولهها را میسازند و فشار را مدیریت میکنند، در موقعیتی قرار دارند که ارزش عظیمی را جذب کنند. Baseten با ۱.۵ میلیارد دلار سرمایه تازه و پایگاه مشتریان سازمانی که به سرعت در حال گسترش است، قاطعانه خود را به عنوان یک معمار اصلی این زیرساخت محاسباتی جدید تثبیت کرده است.[3][4]
روند رویداد
اوایل ۲۰۲۳
رونق هوش مصنوعی مولد، علاقه شدید سازمانی به استقرار مدلهای سفارشی را برانگیخت.
مارس ۲۰۲۴
Baseten برای توسعه پلتفرم استقرار مدلهای منبع باز خود، ۴۰ میلیون دلار سرمایه سری B جذب میکند.
اواخر ۲۰۲۵
هزینههای هوش مصنوعی سازمانی به شدت از آموزش مدل به سمت استنتاج و مقیاسبندی عملیاتی تغییر میکند.
جولای ۲۰۲۶
Baseten دور تأمین مالی بزرگ ۱.۵ میلیارد دلاری سری F را برای تأمین سختافزار و گسترش جهانی اعلام میکند.
بررسی عمیق دیدگاهها
سرمایهگذاران زیرساخت
لایه استقرار هوش مصنوعی را به عنوان پل عوارضی نهایی و بسیار سودآور برای اقتصاد هوش مصنوعی مولد میبینند.
سرمایهگذاران خطرپذیر که از شرکتهایی مانند Baseten حمایت میکنند، استدلال میکنند که در حالی که لایه مدل بنیادی بسیار رقابتی است و مستعد کالایی شدن سریع است، لایه زیرساخت یک کسبوکار بادوام و با حاشیه سود بالا است. آنها پلتفرمهای استنتاج را به عنوان «کلنگ و بیل» تب طلای هوش مصنوعی میبینند. از آنجایی که هر برنامه سازمانی در نهایت برای عملکرد به محاسبات قابل اعتماد و با زمان پاسخدهی پایین نیاز دارد، سرمایهگذاران معتقدند پلتفرمهایی که این محاسبات را مدیریت میکنند، سهم نامتناسبی از کل ارزش تولید شده توسط صنعت هوش مصنوعی در دهه آینده را به خود اختصاص خواهند داد.
تیمهای مهندسی سازمانی
برای پلتفرمهای مستقلی ارزش قائلند که پیچیدگی سختافزاری را انتزاعی کرده و از قفل شدن توسط ارائهدهندگان ابری بزرگ جلوگیری میکنند.
برای توسعهدهندگان نرمافزار و رهبران فناوری اطلاعات، جذابیت پلتفرمهایی مانند Baseten در سادگی عملیاتی و انعطافپذیری استراتژیک نهفته است. مدیریت GPUهای خام، رسیدگی به تخصیص حافظه و نوشتن کد مقیاسبندی خودکار سفارشی به طور مشهودی دشوار است و تیمهای مهندسی را از ساخت ویژگیهای واقعی محصول منحرف میکند. علاوه بر این، مدیران ارشد اطلاعات سازمانی به طور فزایندهای در مورد اجتناب از «قفل شدن» با AWS، Google Cloud یا Microsoft Azure صریح هستند. با استفاده از یک لایه استقرار مستقل از ابر، شرکتها اهرم لازم برای مذاکره در مورد نرخهای محاسباتی بهتر و چابکی برای جابجایی بارهای کاری در مراکز داده مختلف را در صورت نیاز حفظ میکنند.
منتقدان بازار
هشدار میدهند که الزامات سرمایهای عظیم زیرساخت هوش مصنوعی میتواند منجر به کالایی شدن توسط غولهای فناوری ثروتمند شود.
تحلیلگران مالی و منتقدان بازار هشدار میدهند که فضای زیرساخت هوش مصنوعی به طور خطرناکی در حال تبدیل شدن به یک حوزه سرمایهبر است. از آنجایی که شرکتهایی مانند Baseten باید میلیاردها دلار سختافزار خریداری کنند تا رقابتی باقی بمانند، اگر غولهای ابری تصمیم بگیرند قیمتهای خدمات استنتاج اختصاصی خود را به شدت کاهش دهند، حاشیه سود آنها ممکن است تحت فشار قرار گیرد. منتقدان استدلال میکنند که در حالی که پلتفرمهای مستقل در حال حاضر تجربیات توسعهدهنده برتری را ارائه میدهند، ارائهدهندگان ابری بزرگ ترازنامههای لازم برای جذب ضرر و در نهایت کالایی کردن لایه استقرار را دارند، که به طور بالقوه استارتاپهای با ارزش بالا را با سختافزارهای گرانقیمت و مستهلک شده به دام میاندازد.
آنچه نمیدانیم
- با توجه به محدودیتهای مداوم زنجیره تأمین جهانی، Baseten با چه سرعتی قادر به تأمین تحویل فیزیکی GPUهای نسل بعدی خواهد بود.
- آیا ارائهدهندگان اصلی خدمات ابری قیمتگذاری استنتاج خود را به شدت کاهش خواهند داد تا پلتفرمهای مستقل را تضعیف کنند.
- مقررات آتی محلیسازی دادهها در اروپا و آسیا چگونه بر هزینه عملیات یک شبکه هوش مصنوعی توزیعشده جهانی تأثیر خواهد گذاشت.
اصطلاحات کلیدی
- استنتاج (Inference)
- مرحلهای از هوش مصنوعی که در آن یک مدل آموزشدیده فعالانه دادههای جدید را برای تولید خروجیهایی مانند پاسخ به یک سؤال یا ایجاد یک تصویر پردازش میکند.
- شروع سرد (Cold Start)
- تأخیری که هنگام پرسوجوی ناگهانی از یک مدل هوش مصنوعی غیرفعال تجربه میشود و سیستم را ملزم میکند تا مدل را قبل از پاسخگویی در حافظه بارگذاری کند.
- لایه انتزاعی (Abstraction Layer)
- نرمافزاری که جزئیات پیچیده سختافزاری زیرین را از توسعهدهندگان پنهان میکند و به آنها اجازه میدهد برنامهها را راحتتر بسازند و مستقر کنند.
- دستهبندی پیوسته (Continuous Batching)
- یک تکنیک بهینهسازی که به سرور اجازه میدهد چندین درخواست ورودی هوش مصنوعی را به طور همزمان پردازش کند و به طور قابل توجهی توان عملیاتی را بهبود بخشیده و هزینهها را کاهش میدهد.
پرسشهای متداول
استنتاج هوش مصنوعی چیست؟
استنتاج فرآیند اجرای یک مدل هوش مصنوعی آموزشدیده برای تولید پاسخها، پیشبینیها یا تصاویر بر اساس درخواستهای کاربر است. این مرحله عملیاتی هوش مصنوعی است که از مرحله اولیه آموزش متمایز است.
چرا Baseten به ۱.۵ میلیارد دلار نیاز دارد؟
زیرساخت هوش مصنوعی به شدت سرمایهبر است. Baseten از این بودجه برای تأمین قراردادهای محاسباتی بلندمدت، خرید GPUهای نسل بعدی مانند B100 انویدیا و گسترش ردپای مرکز داده جهانی خود استفاده خواهد کرد.
رقابت Baseten با AWS یا Google Cloud چگونه است؟
Baseten خود را به عنوان یک پلتفرم مستقل از ابر (Cloud-agnostic) معرفی میکند. این پلتفرم به شرکتها اجازه میدهد مدلها را بدون قفل شدن در اکوسیستم یک ارائهدهنده ابری بزرگ مستقر کنند و انعطافپذیری لازم برای هدایت بارهای کاری بر اساس هزینه و زمان پاسخدهی را فراهم میآورد.
منابع
[1]TechCrunchسرمایهگذاران زیرساخت
Baseten lands $1.5B Series F as AI inference costs take center stage
مطالعه در TechCrunch →[2]Bloombergمنتقدان بازار
AI Startup Baseten Hits $12 Billion Valuation in Mega Funding Round
مطالعه در Bloomberg →[3]The Informationتیمهای مهندسی سازمانی
Baseten Secures $1.5 Billion to Battle Cloud Giants in AI Deployment
مطالعه در The Information →[4]Reutersمنتقدان بازار
AI infrastructure firm Baseten raises $1.5 bln to scale enterprise deployment
مطالعه در Reuters →[5]Forbesسرمایهگذاران زیرساخت
Why Investors Just Poured $1.5 Billion Into Baseten's AI Plumbing
مطالعه در Forbes →[6]Wall Street Journalسرمایهگذاران زیرساخت
Nvidia-Backed Baseten Raises $1.5 Billion to Make AI Cheaper to Run
مطالعه در Wall Street Journal →[7]VentureBeatتیمهای مهندسی سازمانی
Baseten locks in $1.5B to solve the enterprise AI inference bottleneck
مطالعه در VentureBeat →[8]CNBCمنتقدان بازار
AI infrastructure startup Baseten raises $1.5 billion as enterprise adoption surges
مطالعه در CNBC →
هر زاویه. هر روز.
دریافت کسبوکار اخبار همراه با پوشش کامل منابع و تحلیل دیدگاهها، مستقیم در صندوق ورودی شما.












