انضم إلى النشرات الإخبارية اليومية والأسبوعية للحصول على أحدث التحديثات والمحتوى الحصري على تغطية الذكاء الاصطناعى الرائدة في الصناعة. يتعلم أكثر
لقد كان أسبوعًا كبيرًا لإعلانات الذكاء الاصطناعى بعد الأحداث من Microsoft و Google و Anthropic. لكن Openai ينهي الأمور بأخبار خاصة بها. ولا ، نحن لا نتحدث فقط حوالي 6.5 مليار دولار استحواذها على فريق تصميم Jony Ive لقيادة أ جهد جديد للأجهزة ، “IO” في Openai.
اليوم ، قامت الشركة بترقية مشغلها عامل تصفح الويب المستقل ووكيل التحكم في المؤشر داخل ChatGPT من استخدام نموذج اللغة الكبير GPT-4O السابق إلى أحدث وأكثر قوة نموذج التفكير O3.
يتوفر التحديث ، الذي تم إصداره على مستوى العالم اليوم ، 23 مايو 2025 ، كـ “معاينة بحثية” لدفع المشتركين في خطة ChatGPT Professional التي تبلغ تكلفتها 200 دولار أمريكي.
في الأساس ، هذه هي طريقة Openai للقول إنها ليست منتجًا بالكامل “رمل” أو مثاليًا حتى الآن – ربما لا يزال يحتوي على مكامن وقضايا.
ولكن مع منافس Google تقدم حزمة اشتراك أعلى من طراز AI بسعر حوالي 250 دولارًا أمريكيًا بانتظام بانتظام (تعمل حاليًا على خصم إلى 125 دولارًا للأشهر الثلاثة الأولى) للوصول إلى أحدث طرازات Gemini Multimodal ، وتوليد الصور Imagen ، ونماذج Veo Video Era ، يبدو أن خطة ChatGpt Professional فجأة من Openai أكثر تكلفة بالمقارنة.
ما هو مشغل Openai وما هو؟
ظهر المشغل لأول مرة في يناير 2025 كخطوة أولية لـ Openai في عوامل شبه مستقلة ، خاصة الكمبيوتر باستخدام الوكلاء (CUAs). تتمثل الفكرة في تجاوز واجهة chatbot من chatgpt والسماح لنماذج AI القوية من Openai بالبدء في اتخاذ المزيد من الإجراءات نيابة عن المستخدم.
وهكذا ، تم تصميم المشغل للتوجيه بشكل مستقل والنقر والتمرير والاكتب لإكمال المهام المستندة إلى الويب مثل حجز حجوزات العشاء أو تجميع قوائم التسوق أو طلب تذاكر الأحداث. تتيح هذه القدرة على إكمال مهام المستخدم مباشرة من خلال واجهة المتصفح ، من الحجز إلى جمع البيانات عبر الإنترنت.
لأغراض السلامة والخصوصية والأمان ، لم يستخدم المشغل أي متصفح ويب موجود على جهاز كمبيوتر أو MAC الخاص بالمستخدم. بدلاً من ذلك ، تم تشغيله في متصفح افتراضي يستضيفه السحابة يمكن الوصول إليه عبر موقع مستقل-Operator.Chatgpt.com-حيث يمكن للمستخدمين إدخال الطلبات ومراقبة المهام أداء الوكيل في الوقت الفعلي.
لقد جمعت قدرات الرؤية والتفكير والتفاعل على أساس GPT-4O ، مما يمثل اتجاهًا جديدًا لـ Openai في Aignic AI.
تم إطلاق المنتج كمعاينة بحثية لمشتركي ChatGPT Professional وتدابير أمان مدمجة مثل تأكيدات المستخدم ، ووضع المراقبة ، والقيود على منصات الويب عالية الخطورة.
كما تم اختباره في سياقات المؤسسات ، بما في ذلك تخطيط السفر والخدمات المدنية ، مما يدل على إمكاناته عبر كل من المستهلكين والبيئات التجارية.
يوفر O3 دقة محسنة وبنية ومعدلات نجاح
مع هذا التحديث ، يهدف Openai إلى تعزيز الأداء عبر عدة أبعاد رئيسية. يوضح المشغل الجديد القائم على O3 تحسين الثبات والدقة أثناء تفاعلات المتصفح.
من الناحية العملية ، هذا يعني أنه من المرجح أن يكمل مهام المستخدم بنجاح وبأقل حاجة إلى تصحيح أو تكرار. علاوة على ذلك ، يمكن للمستخدمين توقع ردود أوضح وأكثر تنظيماً وأكثر شمولاً.
في التقييمات المقارنة ، يعرض النموذج الجديد ميزة تفضيل مميزة على سابقتها. تكشف دراسات التفضيلات البشرية أن المستخدمين يفضلون نموذج O3 لأسلوبه وشملته ووضوحه. كما أنه يؤدي بقوة في التعليمات التالية والكفاءة ، على الرغم من أن نتائج الصواب الواقعية أكثر توازناً بين الإصدارات.

يعكس الأداء على معايير تقييم الطرف الثالث هذه التحسينات. على معيار OSWORLD هذا يقيس الانتهاء من المهام القائمة على المتصفح ، ويسجل طراز O3 42.9 مقارنة بـ 38.1 للإصدار السابق.

ومع ذلك ، يلاحظ Openai أنه بسبب القيود في نظام الدرجات الآلي ، يمكن أن يكون مكسب الأداء الفعلي أقرب إلى 20 نقطة مئوية!
على Webarena ، حقق النموذج الجديد درجة 62.9 ، ارتفاعًا من 48.1. يظهر التحسن الأكثر دراماتيكيًا على معايير GAIA ، حيث يحقق طراز O3 62.2 ، يتجاوز بشكل كبير 12.3 النموذج السابق.
توضح مقارنات المهام جنبًا إلى جنب هذه المكاسب. في أحد الأمثلة التي تتضمن طلب حجز المطاعم ، قدم النموذج الجديد قائمة أوضح وأكثر تفصيلاً من الحجوزات المتاحة ، بما في ذلك المواقع ، وتصنيفات ميشلان ، وملاحظات الجلوس ، المقدمة في طاولة جيدة التنسيق. النسخة السابقة ، على الرغم من الوظيفية ، قدمت معلومات أقل بطريقة أقل تنظيما ، وفقا لصورة مضمنة مع ملاحظات إصدار مشغل O3 جديدة:

تبقى الضمانات ، كما تفعل الملاحظات التحذيرية العامة حول الاستخدام على المعاملات المالية الحساسة والوصول إلى الحساب
يرث نموذج O3 أيضًا تدابير السلامة التي يتم تقديمها مع الإصدارات السابقة ، مع مزيد من الضبط لدوره كنظام وكيل.
قامت Openai بدمج التدريب المعزز ضد تنفيذ المهام الضارة ، والضعف في الحقن الفوري ، والأخطاء التي تنطوي على نية المستخدم.
تبين التقييمات أن النموذج يؤكد الآن 94 ٪ من الإجراءات الحساسة قبل تنفيذها ، مع تأكيد 100 ٪ في المعاملات المالية. كما انخفضت قابلية الحقن الفوري من 23 ٪ إلى 20 ٪.
والجدير بالذكر أن مشغل O3 يحافظ على حدود حذرة على تفاعلات ويب عالية الخطورة ، مثل البريد الإلكتروني أو المنصات المالية ، حيث قد يتطلب إشراف المستخدم عبر وضع الساعة أو رفض المتابعة صراحة. هذه التدابير هي جزء من نهج الطبقات في السلامة يجمع بين المتانة على مستوى النموذج والمراقبة في الوقت الفعلي.
في حين أن الترقية إلى المشغل تحسن تقني ، فإنها تعكس أيضًا التزام Openai المستمر بنشر الذكاء الاصطناعي المسؤول.
تقدم قدرة النظام على اتخاذ إجراءات في العالم الحقيقي مخاطر جديدة ، ويستمر فريق التطوير في تحسين بروتوكولات السلامة الخاصة به وفقًا لذلك.
وفق وثائق بطاقة نظام O3 المحدثة من Openai، يظل النموذج أقل من عتبات القدرة عالية الخطورة في فئات مثل سوء الاستخدام البيولوجي والكيميائي وليس له بيئة ترميز محلية أو وصول محطفي ، مما يقلل من ناقلات سوء الاستخدام المحتملة.
لا يزال المشغل بمثابة معاينة بحثية ويمكن الوصول إليها فقط لمستخدمي ChatGpt Professional. ال إصدار API من المشغل سوف تستمر في أن يستند إلى طراز GPT-4O ، على الأقل في الوقت الحالي.
الآثار المترتبة على صانعي القرار الفني للمؤسسات
يقف المشغل الذي تمت ترقيته إلى تعزيز سير عمل المهنيين في هندسة الذكاء الاصطناعي ، والتنسيق ، وإدارة البيانات ، وأمن تكنولوجيا المعلومات.
بالنسبة لأولئك الذين يقومون ببناء أو الحفاظ على نماذج التعلم الآلي ، فإن دقة النموذج المحسنة والمخرجات المهيكلة تقلل من النفقات العامة للتحقق من صحة الاختبار واستكشاف الأخطاء وإصلاحها.
في سياقات التزامن ، يوفر أداة عملية وموثوقة لأتمتة المكونات القائمة على المتصفح لخطوط الأنابيب المعقدة.
يمكن لمهندسي البيانات تفويض تفاعلات الويب اليدوية-مثل التحقق من البيانات والتجاهل-مع المزيد من الثقة ، وتحرير الوقت لأعمال التحسين على المستوى الأعلى.
وفي الوقت نفسه ، يكتسب أخصائيو الأمن طريقة أكثر أمانًا لمحاكاة سلوك المستخدم في عمليات التدقيق وتمارين الاستجابة للحوادث ، وذلك بفضل آليات السلامة ذات الطبقات النموذجية.
عبر هذه التخصصات ، يقدم المشغل المستند إلى O3 ترقية القدرة وإطار تخفيف المخاطر ، مما يجعله إضافة عملية إلى مجموعة الأدوات التقنية الحديثة.