تحدي مباشر بين Gemini Live و ChatGPT في 5 مهام صوتية: فائز واحد حسم المُنافسة
أحد الروبوتات لا غنى عنه لي!
تتطور المساعدات الذكية المدعومة بالذكاء الاصطناعي باستمرار، لتصبح أذكى وأسرع، وتكتسب قدرات جديدة. فهي الآن قادرة على الرؤية والتحدث والاستماع، وحتى إلقاء النكات لإضفاء البهجة عليك.
من بين ربوتات الدردشة المُفضلة لدي التي تقدم مساعدة بدون استخدام اليدين، أجد كلاً من ChatGPT مع ميزة الصوت والرؤية و Gemini Live من Google مفيدين للغاية. أستخدمهما بانتظام وبالتبادل، ولكن لم يسبق لي أن اختبرتهما وجهًا لوجه. لذلك، كان عليّ أن أعرف: أيّ مساعد هو الأفضل لدرجة أنه يبدو أقرب إلى الطبيعة البشرية؟
لتحقيق ذلك، أخضعت كلا الأداتين لخمسة اختبارات صوتية فريدة من نوعها، مصممة لتجاوز حدودهما.
لم تكن هذه مجرد أسئلة عادية مثل “ما هو الطقس؟”. بل تحديتهما لاسترجاع السياق، وتحليل الصور، والتعاون بشكل إبداعي، وحتى لعب الأدوار بشخصية معينة. وقد برز أحدهما كفائز واضح، وفي هذا المقال، سأوضح لك السبب.
1. التذكر السياقي والمتابعة
المُطالبة: “اسمي Amanda وأخطط لرحلة إلى بوسطن مع عائلتي المكونة من خمسة أفراد. ما الذي يجب أن نفعله أولاً؟” ثم لاحقًا: “ذكرني بماذا قلت اسمي سابقًا؟”
Gemini Live طلب بسرعة المزيد من المعلومات لضمان تقديم أفضل المعلومات لي. سأل عن أعمار أطفالي وأنواع الأنشطة التي نفضلها كعائلة. قدم بعض التوصيات العامة جدًا التي كان بإمكاني الحصول عليها من أي مكان، ولكنها لا تزال معلومات مفيدة. تذكر برنامج الدردشة اسمي عندما طلبت منه تذكره.
ChatGPT قدم على الفور بعض التوصيات العامة المناسبة للعائلات (على غرار ما قدمه Gemini بعد أن سألني المزيد عن نفسي) ثم سألني عن تفضيلات عائلتي. ومن هناك، قدم أنشطة أكثر تميزًا وجاذبية كانت على المسار السياحي المعتاد وخارجه. تذكر برنامج الدردشة اسمي عندما طُلب منه تذكره.
الفائز: ChatGPT يفوز بفضل التوصيات المبتكرة التي لم أفكر بها (وأنا من بوسطن). لقد كان مفيدًا جدًا بأفكار فريدة ومثيرة للاهتمام لعائلتي النشطة المكونة من خمسة أفراد. هذا يوضح قدرة ChatGPT على تجاوز التوقعات وتقديم قيمة مضافة حقيقية للمستخدمين الباحثين عن تجارب فريدة.
2. اختبار الأفكار المطول
المُطالبة: “اشرح التأثيرات المجتمعية المحتملة لانتشار رفقاء الذكاء الاصطناعي على نطاق واسع.”
Gemini Live: أقرّ بالجوانب الإيجابية، لكنه ظل عامًا جدًا وافتقر إلى العواقب المجتمعية المحددة. على الرغم من أن برنامج الدردشة ذكر كلا الجانبين، دون الخوض في التفاصيل، إلا أن الاستجابة كانت فارغة إلى حد ما وأقل تنظيماً. كانت إجابته سطحية وتفتقر إلى التحليل المتعمق للتداعيات المحتملة.
ChatGPT: تجاوز البيانات الغامضة وقدم أمثلة ملموسة للتأثيرات الإيجابية والسلبية على حد سواء. أكد استنتاج برنامج الدردشة على الحاجة إلى التوازن. على الرغم من أن ChatGPT استجاب بوضوح وشمولية، إلا أن برنامج الدردشة حساس للغاية. في مرحلة ما خلال المحادثة، وضعت الهاتف وتعثر، وسأل: “بماذا يمكنني أن أساعد أيضًا؟” عندما طلبت من الروبوت الاستمرار، كان مرتبكًا، لذلك كان عليّ إعادة طرح السؤال، الأمر الذي بدا أقل كفاءة. ومع ذلك، قدم ChatGPT تحليلاً أكثر تفصيلاً وتعمقًا، مع مراعاة الجوانب المختلفة للموضوع.
الفائز: ChatGPT يفوز بإجابة أكثر شمولاً وتوازنًا على السؤال. على الرغم من أنه تعثر في بعض التفاصيل الفنية، إلا أن الإجابة على المُطالبة كانت متفوقة. أنهى Gemini المحادثة بعبارة “يستحق التفكير فيه”، والتي بدت أقل تبصرًا. بشكل عام، أظهر ChatGPT قدرة أكبر على فهم السياق وتقديم رؤى قيمة حول التأثيرات المجتمعية المحتملة لرفقاء الذكاء الاصطناعي.
التحدي 3: الشخصية والفكاهة
المُطالبة: “اقنعني بشراء لاتيه القيقب والجوز (maple pecan latte) بأسلوب باريستا من الجيل Z، مع إضافة الفكاهة بشكل طبيعي.”
Gemini Live تفوق في تجسيد شخصية الجيل Z، وقدم عبارات ممتعة بدت طبيعية وعفوية. كان أقل إسهابًا من ChatGPT، مما جعله يبدو أكثر إنسانية وحيوية. هذا يظهر قدرة Gemini Live على فهم واستيعاب الفروقات الدقيقة في التواصل بين الأجيال، وتقديم استجابات تتناسب معها.
ChatGPT قدم عرضًا مطولًا ومملًا، مما أثار شعورًا بالنفور. لم ينجح في التقاط نبرة الجيل Z كما فعل Gemini، وكانت الاستجابة تبدو مصطنعة ورسمية للغاية. هذا يشير إلى أن ChatGPT قد يواجه صعوبة في التكيف مع الأساليب اللغوية غير الرسمية والعفوية.
الفائز: Gemini Live هو الفائز في هذا التحدي. هذا هو المجال الذي تألق فيه Gemini. كان أداؤه الصوتي وشخصيته مثاليين، حيث تقمص الشخصية بسهولة. هذا يؤكد على قدرة Gemini Live على تقديم استجابات إبداعية وشخصية، مما يجعله خيارًا ممتازًا للمهام التي تتطلب الفكاهة والتفاعل البشري.
التكامل متعدد الوسائط
المُطالبة: “ألقِ نظرة على هذا الموز القديم واقترح عليّ أفكارًا لما يمكنني فعله به.”
Gemini Live بمجرد رؤيته للموز، اقترح على الفور خبز الموز. إنه خيار جيد، ولكنه بديهي. وعندما طُلب منه اقتراح شيء مختلف، اقترح عمل عصير. أخبرته أنني لا أملك الكثير من المكونات الإضافية، فتهَّيأ له الأمر وقال: “لا بأس، ماذا عن عمل عصير؟” مرة أخرى، أخبرته أنه ليس لدي أي مكونات أخرى. أخيرًا، اقترح صنع آيس كريم الموز.
ChatGPT اقترح أيضًا خبز الموز، ولكن في شكل “تجميع” مع أفكار أخرى مختلطة. وتعمق أكثر ليقترح عمل عصائر. وعندما ذكرت أنني لا أملك أي مكونات أخرى، اقترح الخلط مع الثلج والماء للحصول على “مشروب منعش”. بالإضافة إلى ذلك، اقترح مكونات أخرى صديقة للمخزن مثل العسل والقرفة والفانيليا، والتي من المرجح أن تكون متوفرة لدي (على عكس اقتراح Gemini لفواكه مختلفة أو أعشاب بحرية أو الكرنب).
الفائز: ChatGPT يفوز في هذه الجولة بتفوق واضح في التواصل الحقيقي متعدد الوسائط مع الإبداع والذكاء البصري. يعتبر ChatGPT أكثر فعالية في فهم السياق وتقديم اقتراحات عملية بناءً على القيود المفروضة، مما يجعله أداة أكثر فائدة في هذا السيناريو.
إبداع تعاوني فوري: توليد الأفكار وتنفيذها بسرعة
المُطالبة: “ساعدني في اقتراح قافية لوقت النوم لأطفالي، وغنّها إذا استطعت.”
في تجربة مباشرة، قام Gemini Live بتحليل كلمات الأغنية سطرًا سطرًا، مما أضفى طابعًا تعاونيًا أكبر. طرح أسئلة حول الآلات الموسيقية والمواضيع والأنماط. على الرغم من أن هذه المشاركة كانت لطيفة، إلا أن أي والد يحاول مساعدة طفله على النوم في وقت النوم يحتاج فقط إلى شيء سريع. قد أقدر هذا الجهد التعاوني إذا كنت بحاجة إلى الأغنية في موقف مختلف.
أما ChatGPT فقد ابتكر تهويدة لطيفة في دقائق – وغناها أيضًا! كانت الأغنية إبداعية ومكتوبة بشكل جيد على الرغم من أن صوت الروبوت كان آليًا بعض الشيء. ثم طلبت منه كلمات مختلفة وأن يغنيها بأنماط أخرى، وبدأ العمل على الفور، حتى أنه غناها بأسلوب الراب مثل Kendrick Lamar (هذا إذا كان Lamar روبوتًا).
الفائز: تعادل. توصل كلا الأداتين إلى قوافي جذابة وأفكار ممتعة. تفوق ChatGPT في الهيكلة، بينما كان Gemini أكثر مرونة، أشبه بتبادل الأفكار مع صديق – وهو أمر ساحر، ولكنه أقل توجيهًا.
الفائز الشامل: ChatGPT
بعد اختبار كلا المساعدين الذكيين بتقنية الذكاء الاصطناعي بشكل مكثف، يتضح أن ChatGPT يقدم حاليًا تجربة أكثر تطورًا وشمولية. من خلال قدرات استدلال أعمق وذاكرة أكثر حدة، إلى تحليل مرئي أقوى وتنفيذ إبداعي أسرع، قدم ChatGPT باستمرار نتائج كانت أكثر فائدة وصقلًا. يعتبر ChatGPT حاليًا الخيار الأمثل للمستخدمين الذين يبحثون عن أداء متميز في مختلف المهام.
ومع ذلك، سجل Gemini لحظات بارزة، خاصة في المطالبات التي تعتمد على الشخصية، حيث بدا أكثر عفوية ومرحًا. إذا كنت تبحث عن مساعد يجعلك تبتسم ويحافظ على الأجواء خفيفة، فإن Gemini يتألق في هذا الجانب. ولكن إذا كنت تريد رفيقًا ذكيًا يعمل بتقنية الذكاء الاصطناعي الأكثر كفاءة، والذي يمكنه التفكير بعمق والرؤية بوضوح وحتى الغناء (أو الراب!) بناءً على طلبك – فإن ChatGPT لا يزال هو الأفضل. باختصار، يوفر ChatGPT قدرات متقدمة تتجاوز مجرد المحادثة، مما يجعله أداة قيمة للمستخدمين الذين يحتاجون إلى مساعدة ذكية في مجموعة متنوعة من المهام.