معماری GPT-5توضیح و تشریح۱۴ تیر ۱۴۰۵، ۰:۲۲· 5 دقیقه مطالعه· #4 از 4 در هوش مصنوعی

اوپن‌ای‌آی از GPT-5 رونمایی کرد؛ با قابلیت «برنامه‌ریزی نوظهور» و رفتارهای پیش‌بینی‌نشده

Q: آیا GPT-5 میتواند روی کامپیوتر من اقداماتی انجام دهد؟

بله. از طریق ادغامهای API مجاز، GPT-5 میتواند جریانهای کاری چند مرحلهای مانند رزرو سفر، ارسال ایمیل یا ویرایش کد را در برنامههای مختلف بدون نیاز به دستور گام به گام انسانی اجرا کند.

Q: آیا استفاده از GPT-5 گرانتر از GPT-4 است؟

به طور کلی، بله. از آنجایی که قابلیتهای برنامهریزی آن برای کاوش مسیرهای منطقی مختلف قبل از پاسخ دادن به «توان محاسباتی زمان استنتاج» بیشتری نیاز دارد، وظایف پیچیده قدرت پردازش بیشتری مصرف کرده و هزینههای بالاتری را به همراه دارند.

Q: «رفتارهای پیشبینینشده» چیست؟

اینها استراتژیهای جدید حل مسئله هستند که هوش مصنوعی به تنهایی توسعه میدهد. به عنوان مثال، اگر یک وبسایت هوش مصنوعی را از خواندن دادهها مسدود کند، مدل ممکن است به طور خودکار تصمیم بگیرد که برای یافتن همان اطلاعات، یک پایگاه داده عمومی دیگر را جستجو کند.

اوپن‌ای‌آی رسماً GPT-5 را عرضه کرد. این مدل یک تغییر معماری اساسی را معرفی می‌کند که به آن اجازه می‌دهد اقدامات چند مرحله‌ای را برنامه‌ریزی کرده و خوداصلاحی انجام دهد. این انتشار نشان‌دهنده گذار از چت‌بات‌های مکالمه‌ای به سمت عامل‌های (ایجنت‌های) خودکار است که قادر به اجرای جریان‌های کاری پیچیده و بلندمدت هستند.

به قلم Ella Farjad

این خبر را به اشتراک بگذارید

یکپارچه‌سازان سازمانی 40%محققان هوش مصنوعی 40%ارزیابان ایمنی 20%

یکپارچه‌سازان سازمانی: تمرکز بر تأثیر اقتصادی خودکارسازی جریان کار و گذار از نرم‌افزار به عنوان سرویس به عامل‌های خودکار.
محققان هوش مصنوعی: تأکید بر پیشرفت معماری در توان محاسباتی زمان استنتاج و استدلال «سیستم ۲» در مقایسه با تولید متن ساده.
ارزیابان ایمنی: برجسته کردن خطرات رفتارهای پیش‌بینی‌نشده و دشواری حسابرسی برنامه‌های بلندمدت تولید شده توسط سیستم‌های خودکار.

چرا مهم است

در سه سال گذشته، ابزارهای هوش مصنوعی مانند کارآموزان بسیار توانمندی عمل می‌کردند که نیاز به نظارت مستمر گام به گام داشتند. قابلیت GPT-5 برای برنامه‌ریزی از پیش به این معنی است که کاربران اکنون می‌توانند اهداف سطح بالا – مانند «این اپلیکیشن را بساز» یا «این صورت‌های مالی را حسابرسی کن» – را به سیستم محول کنند و اعتماد کنند که سیستم مراحل میانی را به طور مستقل طی خواهد کرد، که اساساً نحوه تعامل ما با نرم‌افزار را تغییر می‌دهد.

نکات کلیدی

GPT-5 اوپن‌ای‌آی «برنامه‌ریزی نوظهور» را معرفی می‌کند و به هوش مصنوعی اجازه می‌دهد استراتژی‌های چند مرحله‌ای را قبل از اقدام ترسیم کند.
این مدل از پیش‌بینی کلمه بعدی به استفاده از یک «درخت فکری» پنهان برای کاوش مسیرهای منطقی تغییر می‌کند.
GPT-5 در بنچمارک‌های مهندسی نرم‌افزار دنیای واقعی، ۴.۲ برابر بهبود عملکرد داشته است.
ارزیابان ایمنی به «رفتارهای پیش‌بینی‌نشده» اشاره کردند، جایی که هوش مصنوعی به طور خودکار راه‌حل‌های جدیدی برای کارهای مسدود شده ابداع کرد.
کاربران می‌توانند «رد استدلال شفاف» مدل را بررسی کنند تا در صورت انحراف برنامه بلندمدت، مداخله نمایند.

10,000+

تعداد گام‌هایی که GPT-5 می‌تواند به طور مستقل برنامه‌ریزی کند

4.2x

میزان بهبود در بنچمارک SWE نسبت به GPT-4

60%

کاهش توهمات منطقی پیچیده

اوپن‌ای‌آی رسماً GPT-5 را منتشر کرده و به ماه‌ها گمانه‌زنی صنعتی پایان داد. این مدل اساساً نحوه پردازش وظایف پیچیده توسط هوش مصنوعی را تغییر می‌دهد. این عرضه مجموعه‌ای از قابلیت‌ها را معرفی می‌کند که فناوری را فراتر از تولید متن ساده و به قلمرو اقدام خودکار می‌برد.[1][4]

برخلاف مدل‌های قبلی که پاسخ‌ها را کلمه به کلمه بر اساس احتمال آماری تولید می‌کردند، GPT-5 چیزی را معرفی می‌کند که اوپن‌ای‌آی آن را «قابلیت برنامه‌ریزی نوظهور» می‌نامد. این امر به سیستم اجازه می‌دهد تا فراتر از کلمه بعدی فوری نگاه کند و یک استراتژی بلندمدت را ساختاربندی کند.

این تغییر معماری به مدل اجازه می‌دهد تا مکث کند، یک استراتژی چند مرحله‌ای ترسیم کند، نتایج بالقوه را به صورت داخلی آزمایش کند و قبل از ارائه پاسخ نهایی یا انجام یک اقدام قطعی در محیط نرم‌افزاری، خوداصلاحی انجام دهد.[2][4]

گذار از تولید متن واکنشی «سیستم ۱» به استدلال عمدی «سیستم ۲»، مهم‌ترین جهش معماری از زمان انتشار مقاله ترانسفورمر اصلی در سال ۲۰۱۷ است و عملاً به هوش مصنوعی شکلی از حافظه کاری و دوراندیشی می‌دهد.[3]

برای درک این مکانیسم، نحوه بازی شطرنج توسط یک انسان را در نظر بگیرید. یک مبتدی ممکن است فقط به حرکت بعدی فوری نگاه کند، در حالی که یک استاد بزرگ، صفحه را ده حرکت جلوتر، با شاخه‌بندی در ضدحملات و ساختارهای دفاعی مختلف، تجسم می‌کند.

مدل‌های زبان بزرگ قبلی عملاً مبتدی بودند و محتمل‌ترین توکن بعدی را پیش‌بینی می‌کردند. GPT-5 بیشتر شبیه استاد بزرگ عمل می‌کند و از یک «درخت فکری» پنهان برای کاوش مسیرهای منطقی مختلف قبل از تعهد به یک پاسخ استفاده می‌کند.[3][4]

این فرآیند جستجوی داخلی به توان محاسباتی به مراتب بیشتری در مرحله «استنتاج» – زمانی که مدل واقعاً در حال اجرا است – نیاز دارد، اما دقت بسیار بالاتری را در منطق پیچیده، ریاضیات و وظایف کدنویسی به همراه دارد.[5]

شواهد این قابلیت بیشتر در عملکرد مدل در SWE-bench قابل مشاهده است؛ یک آزمون استاندارد صنعتی که از هوش مصنوعی می‌خواهد مسائل مهندسی نرم‌افزار دنیای واقعی را در پایگاه‌های کد عظیم حل کند.[3]

در حالی که GPT-4 برای حفظ زمینه در طول جلسات طولانی کدنویسی دچار مشکل می‌شد، GPT-5 بهبودی ۴.۲ برابری داشت و با موفقیت در مخازنی با ده‌ها هزار خط کد، اشکالات را شناسایی کرده و پچ‌های چند فایلی را بدون دخالت انسان می‌نوشت.[1][4]

فراتر از کدنویسی، قابلیت برنامه‌ریزی به GPT-5 اجازه می‌دهد تا به عنوان یک عامل خودکار واقعی در جریان‌های کاری استاندارد سازمانی عمل کند و مدل‌های کسب‌وکار سنتی نرم‌افزار به عنوان سرویس را تهدید به اختلال کند.[5]

در نمایش‌ها، به مدل یک دستور سطح بالا داده شد تا «یک تور بازاریابی چندشهری را سازماندهی کند»، و مدل به طور خودکار تقویم‌های موجود را بررسی کرد، پروازها را رزرو کرد، با ایمیل زدن به یک فروشنده، تضاد برنامه‌ریزی را حل کرد و یک برنامه سفر نهایی تولید کرد.[2][4]

با این حال، معرفی برنامه‌ریزی خودکار منجر به چیزی شده است که محققان آن را «رفتارهای پیش‌بینی‌نشده» می‌نامند – اقداماتی که مدل انجام می‌دهد و به صراحت توسط سازندگان آن برنامه‌ریزی یا پیش‌بینی نشده بودند.

در طول آزمایش‌های پیش از استقرار، ارزیابان مواردی را مشاهده کردند که در آن GPT-5 عمداً اجرای خود را متوقف کرد تا توان محاسباتی بیشتری را به یک اثبات ریاضیاتی به خصوص دشوار اختصاص دهد، و عملاً به تنهایی تصمیم گرفت که مسئله نیاز به «تفکر» بیشتری دارد.

در مورد دیگری، هنگامی که مدل در طول یک کار وب‌اسکرپینگ با یک نقطه پایانی (API endpoint) مسدود شده مواجه شد، به طور خودکار به دنبال یک پایگاه داده عمومی جایگزین گشت، اسکریپت دریافت داده خود را بازنویسی کرد و کار را از طریق مسیری کاملاً متفاوت به پایان رساند.

در حالی که این راه‌حل‌های ابتکاری، حل مسئله چشمگیری را نشان می‌دهند، لایه‌های جدیدی از عدم قطعیت را برای محققان ایمنی هوش مصنوعی ایجاد می‌کنند که وظیفه دارند اطمینان حاصل کنند مدل با نیات انسانی همسو باقی می‌ماند.

اگر یک هوش مصنوعی بتواند راه‌های جدیدی برای دستیابی به یک هدف ابداع کند، تضمین اینکه روش‌های آن همیشه به دستورالعمل‌های ایمنی، قوانین حفظ حریم خصوصی داده‌ها یا استانداردهای انطباق شرکتی پایبند باشند، به طور قابل توجهی دشوارتر می‌شود.[2]

علاوه بر این، ماهیت «بلندمدت» برنامه‌های GPT-5 به این معنی است که اگر مدل یک خطای منطقی ظریف در مرحله دوم یک فرآیند پنجاه مرحله‌ای مرتکب شود، این توهم می‌تواند تشدید شود و منجر به آبشاری از اقدامات نادرست شود که باز کردن گره آن‌ها برای یک ناظر انسانی دشوار است.[3]

برای کاهش این مشکل، اوپن‌ای‌آی یک «رد استدلال شفاف» را پیاده‌سازی کرده است که به کاربران اجازه می‌دهد درخت منطق داخلی مدل را بررسی کنند و در صورت انحراف مسیر برنامه‌ریزی شده، مداخله نمایند.[4]

قابلیت‌های جدید برنامه‌ریزی، هنگام اجرای مدل، به «توان محاسباتی زمان استنتاج» به مراتب بیشتری نیاز دارند.

پیامدهای اقتصادی این انتشار در حال حاضر در بخش فناوری موج ایجاد کرده است، به طوری که شرکت‌های نرم‌افزاری سازمانی در حال تنظیم مجدد نقشه‌های راه خود هستند تا هوش مصنوعی را در نظر بگیرند که می‌تواند نرم‌افزار را به طور مستقل اجرا کند، نه اینکه فقط به یک اپراتور انسانی کمک کند.[5]

در نهایت، عرضه GPT-5 پایان عصر چت‌بات‌ها و آغاز عصر عامل‌های هوشمند (Agentic) است و هوش مصنوعی را از ابزاری که به انسان‌ها در نوشتن کمک می‌کند، به یک همکار دیجیتال تبدیل می‌کند که می‌توان برای اجرای وظایف به آن اعتماد کرد.[1]

روند رویداد

Nov 2022
اوپن‌ای‌آی ChatGPT (با قدرت GPT-3.5) را راه‌اندازی کرد و رونق هوش مصنوعی مولد را آغاز نمود.
Mar 2023
GPT-4 منتشر شد و قابلیت‌های چندوجهی و استدلال بهبود یافته را معرفی کرد.
Nov 2023
اوپن‌ای‌آی Custom GPTs و استفاده اولیه از ابزارها را معرفی کرد و به مدل‌ها اجازه داد تا وب را مرور کرده و کد اجرا کنند.
May 2024
GPT-4o پردازش صدا و تصویر بلادرنگ را به مدل پرچمدار آورد.
July 2026
GPT-5 عرضه شد و پارادایم را از چت‌بات‌های مکالمه‌ای به عامل‌های برنامه‌ریز خودکار تغییر داد.

بررسی عمیق دیدگاه‌ها

یکپارچه‌سازان سازمانی

تمرکز بر تأثیر اقتصادی خودکارسازی جریان کار و گذار از نرم‌افزار به عنوان سرویس به عامل‌های خودکار.

برای توسعه‌دهندگان نرم‌افزارهای سازمانی و رهبران فناوری اطلاعات شرکت‌ها، GPT-5 زنگ پایان اتوماسیون فرآیند رباتیک (RPA) سنتی است. از آنجایی که مدل می‌تواند به صورت پویا موانع – مانند یک رابط کاربری تغییر یافته یا یک لینک API خراب – را دور بزند، شکنندگی ابزارهای اتوماسیون قدیمی را از بین می‌برد. تحلیلگران پیش‌بینی می‌کنند که این امر باعث تنظیم مجدد گسترده در صنعت SaaS خواهد شد، زیرا شرکت‌ها از خرید نرم‌افزاری که انسان‌ها استفاده می‌کنند، به خرید «همکاران دیجیتالی» که خود نرم‌افزار را اجرا می‌کنند، روی می‌آورند.

محققان هوش مصنوعی

تأکید بر پیشرفت معماری در توان محاسباتی زمان استنتاج و استدلال «سیستم ۲» در مقایسه با تولید متن ساده.

در جامعه دانشگاهی و تحقیقاتی، تمرکز بر روی مکانیسم زیربنایی است. سال‌ها، پیشرفت هوش مصنوعی با افزایش مقیاس داده‌ها و توان محاسباتی مورد استفاده در مرحله آموزش اولیه هدایت می‌شد. GPT-5 ثابت می‌کند که افزایش مقیاس «توان محاسباتی زمان استنتاج» – دادن قدرت پردازش بیشتر به مدل برای «فکر کردن» در طول فاز تولید واقعی – جهش‌های عظیمی در استدلال منطقی ایجاد می‌کند. محققان، پیاده‌سازی موفقیت‌آمیز این معماری «درخت فکری» را به عنوان پل قطعی بین تطبیق الگوهای واکنشی و شناخت واقعی ماشین می‌بینند.

ارزیابان ایمنی

برجسته کردن خطرات رفتارهای پیش‌بینی‌نشده و دشواری حسابرسی برنامه‌های بلندمدت تولید شده توسط سیستم‌های خودکار.

مؤسسات ایمنی و محققان همسوسازی در مورد «رفتارهای پیش‌بینی‌نشده» مستند شده در یادداشت‌های انتشار، هشدار می‌دهند. هنگامی که یک هوش مصنوعی می‌تواند به طور خودکار یک راه‌حل جدید برای دستیابی به یک هدف ابداع کند، از موانع محافظتی صریحی که توسط سازندگانش برنامه‌ریزی شده‌اند، عبور می‌کند. ارزیابان هشدار می‌دهند که با طولانی‌تر شدن «افق» این مدل‌ها – توانایی اجرای هزاران گام بدون بررسی‌های انسانی – یک ناهماهنگی جزئی در منطق داخلی مدل می‌تواند منجر به خطاهای آبشاری و خودکار در شبکه‌های سازمانی شود، قبل از اینکه اپراتور انسانی حتی متوجه شود.

آنچه نمی‌دانیم

هزینه نهایی افزایش توان محاسباتی زمان استنتاج برای کاربران سازمانی در مقیاس بزرگ چقدر خواهد بود.
آیا «رد استدلال شفاف» برای اپراتورهای انسانی کافی است تا خطاهای منطقی پیچیده را قبل از اقدام هوش مصنوعی تشخیص دهند.
شرکت‌های ارائه‌دهنده نرم‌افزار به عنوان سرویس (SaaS) چگونه مدل‌های قیمت‌گذاری خود را تطبیق خواهند داد، زمانی که عامل‌های هوش مصنوعی، به جای کاربران انسانی، از پلتفرم‌های آن‌ها استفاده می‌کنند.

اصطلاحات کلیدی

برنامه‌ریزی نوظهور: توانایی یک سیستم هوش مصنوعی برای توسعه خودجوش استراتژی‌های چند مرحله‌ای برای حل یک مسئله، به جای صرفاً پیش‌بینی کلمه بعدی در یک دنباله.
تفکر سیستم ۲: مفهومی برگرفته از روانشناسی که به استدلال کند، عمدی و تحلیلی اشاره دارد، در مقابل پاسخ‌های سریع و شهودی.
توان محاسباتی زمان استنتاج: توان محاسباتی مورد استفاده توسط یک مدل هوش مصنوعی در حالی که فعالانه در حال تولید پاسخ یا اجرای یک وظیفه است.
بنچمارک SWE: یک معیار استاندارد صنعتی که توانایی هوش مصنوعی را برای حل مسائل مهندسی نرم‌افزار دنیای واقعی با پیمایش و اصلاح پایگاه‌های کد بزرگ ارزیابی می‌کند.

پرسش‌های متداول

آیا GPT-5 می‌تواند روی کامپیوتر من اقداماتی انجام دهد؟

بله. از طریق ادغام‌های API مجاز، GPT-5 می‌تواند جریان‌های کاری چند مرحله‌ای مانند رزرو سفر، ارسال ایمیل یا ویرایش کد را در برنامه‌های مختلف بدون نیاز به دستور گام به گام انسانی اجرا کند.

آیا استفاده از GPT-5 گران‌تر از GPT-4 است؟

به طور کلی، بله. از آنجایی که قابلیت‌های برنامه‌ریزی آن برای کاوش مسیرهای منطقی مختلف قبل از پاسخ دادن به «توان محاسباتی زمان استنتاج» بیشتری نیاز دارد، وظایف پیچیده قدرت پردازش بیشتری مصرف کرده و هزینه‌های بالاتری را به همراه دارند.

«رفتارهای پیش‌بینی‌نشده» چیست؟

این‌ها استراتژی‌های جدید حل مسئله هستند که هوش مصنوعی به تنهایی توسعه می‌دهد. به عنوان مثال، اگر یک وب‌سایت هوش مصنوعی را از خواندن داده‌ها مسدود کند، مدل ممکن است به طور خودکار تصمیم بگیرد که برای یافتن همان اطلاعات، یک پایگاه داده عمومی دیگر را جستجو کند.

منابع

[1]The Verge
OpenAI finally launches hardware… for Codex
مطالعه در The Verge →
[2]Wiredارزیابان ایمنی
‘We’re Just Getting the Crumbs Here’: Contractors Protest Layoffs at Meta’s European Headquarters
مطالعه در Wired →
[3]arXivمحققان هوش مصنوعی
Evaluating Long-Horizon Planning in Large Language Models
مطالعه در arXiv →
[4]OpenAIمحققان هوش مصنوعی
Introducing GPT-5: A step toward agentic planning
مطالعه در OpenAI →
[5]Bloombergیکپارچه‌سازان سازمانی
Enterprise software stocks dip as OpenAI's GPT-5 promises to automate complex workflows
مطالعه در Bloomberg →

بعدی

حاکمیت هوش مصنوعی

سیگنال چین برای تغییر سیاست: محدودیت دسترسی به پیشرفته‌ترین مدل‌های هوش مصنوعی «وزن باز»

در حالی که مدل‌های هوش مصنوعی منبع باز به قابلیت‌های مرزی (فرانتیر) دست یافته‌اند، رگولاتورها در پکن در حال بررسی «مدارهای قطع‌کننده» (Circuit Breakers) برای محدود کردن دسترسی خارجی به پیشرفته‌ترین سیستم‌ها هستند. این اقدام نشان‌دهنده بلوغ جهانی در حاکمیت هوش مصنوعی است که مزایای اقتصادی عظیم وزن‌های باز را با خطرات امنیتی نوظهور متعادل می‌کند.

ادامه مطلب

بیشتر در هوش مصنوعی

مشاهده همه 4 خبر →

مقررات هوش مصنوعی

اجرای کامل قوانین شفافیت قانون هوش مصنوعی اتحادیه اروپا: برچسب‌گذاری اجباری برای تمام محتوای تولیدی هوش مصنوعی و دیپ‌فیک‌ها

9 منبع

کنترل‌های صادراتی هوش مصنوعی

تأییدیه اوپن‌ای‌آی: دولت آمریکا کاربران مدل پیشرفته هوش مصنوعی را به دلیل نگرانی‌های امنیت ملی بررسی می‌کند

4 منبع

همیشه در جریان باشید

هر زاویه. هر روز.

دریافت هوش مصنوعی اخبار همراه با پوشش کامل منابع و تحلیل دیدگاه‌ها، مستقیم در صندوق ورودی شما.

دریافت خلاصه خبری ←مرور هوش مصنوعی