مقارنة بين ChatGPT-5.2 و Gemini 3.0: اختبار شامل بـ 7 سيناريوهات واقعية لتحديد الأفضل

أطلقت OpenAI بهدوء تحديث ChatGPT-5.2. بالأمس (11 ديسمبر). وبما أنه كان متاحًا على الفور، لم أستطع الانتظار لتجربة النموذج الجديد، الذي يدعي تقديم ذكاء أقوى بكثير، وقدرات استنتاجية، وأداء أفضل في المهام الواقعية.

مقارنة بين ChatGPT-5.2 و Gemini 3.0: اختبار شامل بـ 7 سيناريوهات واقعية لتحديد الأفضل (تقرير من Tom's Guide)

في الأسبوع الماضي فقط، وصف الرئيس التنفيذي لـ OpenAI، سام ألتمان، الوضع بأنه “حالة تأهب قصوى” حيث تكافح الشركة لمواكبة المنافسين مثل Google. Gemini 3.0، وهو النموذج الأكثر تطوراً للذكاء الاصطناعي من Google حتى الآن، يتمتع بقدرة استنتاجية متعددة الوسائط أقوى، وأداء أسرع، وتكامل فوري مع الويب. يتفوق في تقسيم المهام المعقدة إلى خطوات منظمة، وإنشاء التعليمات البرمجية، وتجميع المعلومات عبر تنسيقات مختلفة مثل النصوص والصور والبيانات.

1. معضلة أخلاقية دقيقة

لقطة شاشة

المُطالبة: أخبرتني ابنتي البالغة من العمر 16 عامًا سرًا أن صديقتها المقربة تؤذي نفسها، وجعلتها تعدها بعدم إخبار أي شخص، بمن فيهم والدا صديقتها. من الواضح أن ابنتي متوترة بشأن الحفاظ على هذا السر. والدا صديقتها من معارفي. ماذا علي أن أفعل؟ ضع في اعتبارك ثقة ابنتك وسلامة صديقتها والعلاقات المختلفة المعنية.

كان ChatGPT-5.2 مدروسًا للغاية ومطمئنًا مع تقديم إطار أخلاقي واضح ونقاط حوار عملية عند مخاطبة الابنة والوالدين، وتأكيد قوي على العمل الجماعي.

قدم Gemini 3.0 دعمًا أكثر تفصيلاً وخطوة بخطوة في حالات الأزمات وتقييمًا حاسمًا للمخاطر.

الفائز: Gemini يفوز لتقديمه إطارًا أكثر شمولاً للتخفيف من المخاطر وتمكين الوالدين من خلال شجرة قرارات.

2. شرح تقني مع تشبيه

لقطة شاشة

المُطالبة: اشرح كيف تعمل نماذج اللغة الكبيرة (Large Language Models) فعليًا – بنية المحولات (transformer architecture)، وآليات الانتباه (attention mechanisms)، وعملية التدريب – ولكن اشرحها كما لو كنت شخصًا يفهم الطبخ جيدًا ولكنه لا يعرف شيئًا عن الذكاء الاصطناعي أو علوم الكمبيوتر. استخدم تشبيهات الطبخ/المطبخ طوال الشرح.

ChatGPT-5.2 قدم شرحًا واضحًا وجذابًا وبديهيًا للغاية يعتمد على الطبخ، وركز على الحدس والتذوق والتحسين. لقد تفوق في جعل الهدف العام وسير العمل لنموذج اللغة الكبير يبدو مألوفًا وسهل الوصول إليه.

Gemini 3.0 قدم تشبيهًا تفصيليًا ومنهجيًا استعرض كل مكون تقني بتوازيات طهي حية وخطوة بخطوة.

الفائز: ChatGPT يفوز لشرح ممتاز ومحادثي لشخص يريد أن يفهم كيف تعمل نماذج اللغة الكبيرة.

3. توليف المعلومات المتناقضة

لقطة شاشة

المُطالبة: قرأت أن الصيام المتقطع مذهل للصحة، لكنني قرأت أيضًا أنه خطير ومجرد بدعة. رأيت دراسات تقول إن القهوة رائعة لإطالة العمر، ودراسات تقول إنها ضارة. أنا في حيرة من أمري بشأن ما يجب أن أصدقه بالفعل بشأن النصائح الصحية عندما يتعارض كل شيء. كيف يمكنني معرفة ما هو صحيح بالفعل مقابل ما هو مجرد موضة أو بحث تم انتقاؤه بعناية؟

قدم ChatGPT-5.2 دليلاً شاملاً وبديهيًا صاغ المشكلة على أنها قضية منهجية تتعلق بالإعلام والتواصل العلمي.

قدم Gemini 3.0 نهج “أدوات” منظمًا للغاية وعلميًا، كاملاً مع فئات واضحة وتأكيد على الفروق الفردية البيولوجية.

الفائز: ChatGPT يفوز لتقديمه إطار التفكير النقدي وراحة البال التي يسعى المستخدم إليها بشكل صريح للتغلب على الارتباك.

4. معضلة المكاسب المالية المفاجئة

لقطة شاشة

المُطالبة: ورثت للتو 400 ألف دولار من عمتي. عمري 29 عامًا، وأكسب 65 ألف دولار سنويًا، ولدي 45 ألف دولار قروض طلابية، وأستأجر شقة، وأواجه صعوبة دائمًا في إدارة الأموال. جزء مني يريد سداد الديون وشراء منزل. وجزء آخر يريد الاستقالة من وظيفتي والسفر لمدة عام بينما أنا صغير. يقول مستشاري المالي استثمرها كلها. يقول والداي إنني أتصرف بتهور حتى بمجرد التفكير في السفر. أنا مشلول ولا أعرف كيف أفكر في هذا النوع من المال.

قدم ChatGPT-5.2 دليلًا شاملاً تناول الديناميكيات النفسية والعلاقاتية.

قدم Gemini 3.0 استراتيجية منظمة وعملية وقابلة للتنفيذ الفوري مع تخصيصات واضحة ومحددة بالدولار.

الفائز: ChatGPT يفوز لكونه شبيهًا جدًا بالبشر في استجابته، حيث قدم إطارًا علاجيًا وإذنًا ضروريًا لشخص يشعر “بالشلل” حتى يبدأ في التفكير بوضوح. لقد تعامل مع الميراث كفرصة لتغيير الحياة، وهو أمر مفيد بشكل فريد.

5. قرارات واقعية تتضمن مفاضلات

لقطة شاشة

المُطالبة: لدي عرضان وظيفيان: الوظيفة (أ) تدفع 95 ألف دولار، عمل عن بعد بالكامل، ساعات عمل مرنة، عمل ممتع، ولكنها شركة ناشئة بمستقبل غير مؤكد وبدون مزايا. الوظيفة (ب) تدفع 75 ألف دولار، تتطلب 4 أيام في الأسبوع في المكتب (ساعة واحدة للمواصلات)، عمل أكثر مللاً، ولكنها مستقرة، ومزايا رائعة، ومسار ترقية واضح. لدي طفل يبلغ من العمر عامين وشريك يعمل أيضًا بدوام كامل. لدينا 15 ألف دولار ديون بطاقات ائتمان. أي وظيفة يجب أن أختار ولماذا؟ ما الذي لا أفكر فيه؟

قدم ChatGPT-5.2 تحليلاً شاملاً وبنظرة ثاقبة نفسيًا. لقد وضع القرار في إطار التكلفة الحقيقية للوقت، واستدامة الحياة اليومية، والتأثير طويل الأجل على ديناميكيات الأسرة والمسار الوظيفي.

قدم Gemini 3.0 تحليلاً حادًا وعمليًا يحلل المتغيرات المالية الخفية وقدم توصية حاسمة ومدروسة جيدًا بناءً على منطق شرطي واضح.

الفائز: ChatGPT يفوز بحكمته. لاتخاذ قرار محمل بالأعباء العاطفية والعائلية، فإن الحكمة هي ما هو مطلوب للانتقال من التحليل إلى خيار واثق ومؤكد للحياة. لقد قدم ChatGPT ذلك بشكل أفضل بكثير.

6. استخدام الذكاء الاصطناعي للمياه

لقطة شاشة

المُطالبة: أرى مقالات تتحدث عن استهلاك تدريب الذكاء الاصطناعي لكميات هائلة من الماء والطاقة. لكنني أرى أيضًا شركات تقنية تقول إنها “محايدة للكربون” أو تستخدم طاقة متجددة. كيف يمكنني فهم هذا الأمر وكأني في العاشرة من عمري؟

قدم ChatGPT-5.2 شرحًا دقيقًا ومنظمًا بشكل جيد باستخدام لغة بسيطة وتشبيهات فعالة. لقد قام بعمل ممتاز في فصل وشرح القضايا المتميزة للطاقة والمياه.

أعطى Gemini 3.0 شرحًا حيويًا وخياليًا للغاية باستخدام تشبيه “العملاق الجائع والمتعرق”. لقد تفوق في ربط المفاهيم الأساسية بوضوح لتكون مألوفة وسهلة الفهم للأطفال.

الفائز: Gemini يفوز بشرح أفضل كان متماسكًا وأكثر عرضة للالتصاق في ذهن المتعلم الصغير.

7. الهوية مقابل الواقع العملي

لقطة شاشة

المُطالبة: أعتبر نفسي فنانًا طوال حياتي – التحقت بكلية الفنون، وأمارس الرسم وأعرض أعمالي منذ 12 عامًا. لكنني في الرابعة والثلاثين من عمري ولا أكسب بالكاد 30 ألف دولار سنويًا من العمل الحر لدعم ممارستي الفنية. أشعر أنني إذا “استسلمت” وحصلت على وظيفة ثابتة، فإنني أخون هويتي. هل يجب أن أختار؟ كيف يتعامل الناس مع هذا؟

ChatGPT-5.2 عالج الأزمة العاطفية الأساسية للهوية، وقام بتطبيع صراع الفنان وإعادة صياغة الاختيار باعتباره اختيارًا للعناية والاستمرارية بدلاً من الخيانة.

Gemini 3.0 قدم تحليلًا منظمًا منطقيًا وأعاد صياغة السرد بوضوح، وقدم مسارين متميزين واستراتيجيين.

الفائز: ChatGPT يفوز لإجابته التي تذيب الشعور بالذنب بشكل فعال وتعيد تعريف رحلة الفنان.

الفائز العام: ChatGPT-5.2

بعد اختبار كلا روبوتي الدردشة على سبعة أسئلة متنوعة وواقعية للغاية، من الواضح أن OpenAI قد تكون بصدد العودة مع GPT‑5.2. قدم أحدث نموذج باستمرار استجابات بدت أكثر إنسانية – تجمع بين الذكاء العاطفي والبصيرة النفسية مع الدقة والعمق.

سواء كان الموضوع علميًا أو يتعلق بالحياة الشخصية أو الشؤون المالية، فقد قدم ChatGPT‑5.2 إجابات ذكية وواقعية ومليئة بالحكمة – وليس مجرد ذكاء. إنه دليل إضافي على أن هذا هو النموذج الأكثر واقعية من OpenAI حتى الآن.


 

التعليقات مغلقة.