مدل پیش‌فرض چت‌جی‌پی‌تی عوض شد: GPT-5.5 Instant جای GPT-5.3 رو گرفت

اگه این چند روز یه سوال ساده از چت‌جی‌پی‌تی پرسیده باشی و جوابش یه‌کم کوتاه‌تر و دقیق‌تر از قبل به نظر رسیده، تخیلاتت دروغ نگفته. OpenAI مدل پیش‌فرض Instant رو از GPT-5.3 به GPT-5.5 تغییر داده، و این یعنی برای صدها میلیون کاربری که هر روز بدون انتخاب مدل خاصی فقط سوال می‌پرسند، تجربه‌ی استفاده عوض شده، چه متوجه باشند چه نباشند.

نکته‌ی اصلی که OpenAI روی آن تاکید دارد، کاهش توهم (hallucination) است. طبق اعلام خودشان، روی پرامپت‌های حساس در حوزه‌هایی مثل پزشکی، حقوق و مالی، تعداد ادعاهای اشتباه مدل ۵۲.۵ درصد کمتر از نسخه‌ی قبلی شده. روی مکالماتی که کاربران قبلاً خودشان به‌خاطر اشتباه فکتی فلگ کرده بودند، این عدد ۳۷.۳ درصد است. این چیزی نیست که فقط روی کاغذ خوب به نظر برسد؛ برای کسی که از چت‌جی‌پی‌تی برای کارهای واقعی استفاده می‌کند، یعنی کمتر مجبور است هر جواب را دوباره چک کند.

در آزمون‌های استاندارد هم پیشرفت محسوس است: روی GPQA (سوالات سطح دکترا در علوم) دقت از ۷۸.۵ به ۸۵.۶ درصد رسیده، روی AIME 2025 (مسائل ریاضی سطح مسابقه) از ۶۵.۴ به ۸۱.۲ درصد، و روی MMMU-Pro که استدلال چندوجهی (تصویر + متن) را می‌سنجد، از ۶۹.۲ به ۷۶ درصد. روی OmniDocBench هم که دقت تشخیص اسناد را اندازه می‌گیرد، نرخ خطا کمتر شده، که برای هرکسی که از این مدل برای خواندن عکس یا اسکن سند استفاده می‌کند خبر خوبی است.

یک چیز که توی نمونه‌های منتشرشده جالب بود این بود که مدل جدید همیشه از همان ابتدا درست جواب نمی‌دهد، اما در مسیر حل مسئله خودش را بیشتر چک می‌کند. در یکی از مثال‌های ریاضی که OpenAI منتشر کرده، هر دو مدل ابتدا یک پاسخ نادرست را تایید می‌کنند، اما GPT-5.5 وقتی متوجه می‌شود جواب با معادله‌ی اصلی جور نیست، برمی‌گردد، اشتباه جبری را پیدا می‌کند، و معادله را درست حل می‌کند؛ در حالی که نسخه‌ی قبلی زودتر تسلیم می‌شود و نتیجه می‌گیرد جوابی وجود ندارد. این دقیقاً همان چیزی است که از یک مدل «بهتر» انتظار داری: نه این‌که هیچ‌وقت اشتباه نکند، بلکه این‌که اشتباهش را خودش پیدا کند.

کم‌حرف‌تر شده، نه کم‌محتوا

OpenAI روی این موضوع هم تاکید زیادی دارد که جواب‌ها کوتاه‌تر و کمتر فرمت‌زده شده‌اند؛ یعنی کمتر بولت‌پوینت، کمتر هدر اضافه، کمتر سوال تکمیلی غیرضروری در انتهای جواب. در یکی از مثال‌های منتشرشده (یک سوال ساده درباره‌ی نحوه‌ی صحبت با یک همکار پرحرف)، پاسخ مدل جدید حدود ۳۰ درصد کوتاه‌تر بوده، بدون این‌که چیزی از کاربردی بودن جواب کم شود. اگر تا الان از طولانی‌شدن بی‌دلیل جواب‌های چت‌جی‌پی‌تی خسته شده بودی، این بخش از آپدیت احتمالاً برایت ملموس‌تر از هر بنچمارکی خواهد بود.

شخصی‌سازی بیشتر، با کنترل بیشتر

بخش دیگری از این به‌روزرسانی به نحوه‌ی استفاده از تاریخچه‌ی مکالمات، فایل‌ها، و در صورت اتصال، جیمیل مربوط می‌شود. مدل جدید سریع‌تر تشخیص می‌دهد که چه زمانی شخصی‌سازی به جواب کمک می‌کند و چه زمانی نه، و چه‌بسا لازم نباشد چیزی را که قبلاً گفته‌ای دوباره تکرار کنی.

همراه این تغییر، یک قابلیت به اسم «منابع حافظه» (memory sources) هم به همه‌ی مدل‌ها اضافه شده: می‌توانی ببینی هر پاسخ شخصی‌سازی‌شده دقیقاً از چه چیزی (مکالمه‌ی قبلی، فایل، یا حافظه‌ی ذخیره‌شده) استفاده کرده، و در صورت نیاز آن را حذف یا اصلاح کنی. این یعنی شخصی‌سازی دیگر یک جعبه‌ی سیاه نیست؛ هرچند OpenAI خودش هم گفته این نمایش هنوز کامل نیست و ممکن است همه‌ی منابعی که واقعاً استفاده شده‌اند را نشان ندهد.

از کی در دسترسه

GPT-5.5 Instant از همین حالا به‌عنوان مدل پیش‌فرض برای همه‌ی کاربران چت‌جی‌پی‌تی فعال شده و در API هم با نام chat-latest در دسترس است. کاربرانی که پلن پولی دارند، تا سه ماه دیگر همچنان می‌توانند از طریق تنظیمات مدل به GPT-5.3 Instant دسترسی داشته باشند، قبل از این‌که این نسخه کاملاً بازنشسته شود.

شخصی‌سازی پیشرفته‌تر (با فایل‌ها و جیمیل) فعلاً برای کاربران Plus و Pro روی وب در حال رول‌اوت است و به‌زودی به موبایل و بقیه‌ی پلن‌ها هم می‌رسد. قابلیت منابع حافظه هم به‌مرور برای همه‌ی پلن‌ها فعال می‌شود، با این تفاوت که سرعت دسترسی ممکن است بسته به منطقه‌ی جغرافیایی فرق کند.

مدل پیش‌فرض چت‌جی‌پی‌تی عوض شد: GPT-5.5 Instant جای GPT-5.3 رو گرفت

کم‌حرف‌تر شده، نه کم‌محتوا

شخصی‌سازی بیشتر، با کنترل بیشتر

از کی در دسترسه

مدل پیش‌فرض چت‌جی‌پی‌تی عوض شد: GPT-5.5 Instant جای GPT-5.3 رو گرفت

دولت آمریکا دسترسی به Fable 5 و Mythos 5 را مسدود کرد!

Claude Fable 5 و Claude Mythos 5 منتشر شدند - قدرتمندترین مدل‌های جدید Anthropic

Dreaming در ChatGPT چیست؟ انقلاب جدید OpenAI در حافظه هوش مصنوعی

Claude Opus 4.8: خوب است یا نه؟ بررسی صادقانه از نگاه کاربران

انتروپیک از Claude Opus 4.8 و قابلیت جدید Dynamic Workflows رونمایی کرد

برای ثبت کامنت وارد شوید

نظرات کاربران