مقارنة بين Nano Banana و Midjourney في توليد الصور بالذكاء الاصطناعي: نتائج مفاجئة بعد اختبار 9 مُطالبات
عندما يتعلق الأمر بـ مولدات الصور بالذكاء الاصطناعي، لطالما كان Midjourney هو المعيار الذهبي للإبداع والواقعية والتنوع. ولكن Google، يبدو أن لديها منافسًا جديدًا في الساحة، وهو نموذج Nano Banana. هذا النموذج خفيف الوزن وسريع كالبرق، وقد بدأ بالفعل في إحداث ضجة بفضل قدرته على إنتاج صور فيروسية قابلة للمشاركة على نطاق واسع. تطبيق Gemini الآن لديه 23 مليون مستخدم، مما يؤكد شعبيته المتزايدة.
لمعرفة كيف يتنافسان حقًا، قمت بتجربة كليهما باستخدام نفس المطالبات التسعة المصممة لاختبار نقاط قوتهما في الواقعية، والأسلوب، والفكاهة، وعرض النصوص، وسرد القصص. من الصور الواقعية إلى Spider-Man في Times Square، إليك المجالات التي يتألق فيها كل أداة والمجالات التي تتعثر فيها.
1. الواقعية (Photorealism)
المُطالبة:
“صورة واقعية للغاية لامرأة مسنة بتجاعيد عميقة، شعر فضي مرفوع على شكل كعكة، ترتدي وشاحًا أحمر، مضاءة بضوء غروب ذهبي ناعم، نسيج بشرة فائق التفصيل.”
أنتج Nano Banana صورة واحدة التقطت كل عنصر من عناصر الطلب، بما في ذلك “مضاءة بضوء غروب ذهبي ناعم”. الصورة الواقعية مدهشة بشكل ملحوظ.
أنتج Midjourney المزيد من الصور، لكنها فشلت جميعًا في تلبية طلب ضوء الغروب. على الرغم من أن جميع الصور تبدو واقعية، إلا أنها لم تكن بجودة صور Nano Banana ولم تنجح تمامًا في تحقيق المطلوب.
الفائز: Nano Banana يفوز بصورته الواقعية الوحيدة التي التقطت كل عنصر من عناصر الطلب بشكل أفضل.
2. مزيج من الثقافة الشعبية
المُطالبة:“سبايدرمان يتأرجح عبر تايمز سكوير خلال عاصفة ثلجية، مع لوحات إعلانية نيون تعرض شخصيات أنمي، لقطة حركة سينمائية.”
نفذ Nano Banana كل جانب من جوانب الطلب، بما في ذلك الطلب الأخير “لقطة حركة سينمائية”. تبدو الصورة وكأنها لقطة ثابتة من فيلم أفلام Marvel، والإعلانات واضحة ومصقولة ويمكن تمييزها بسهولة على أنها ميدان تايمز.
مرة أخرى، قدم Midjourney أربع صور؛ كل واحدة تعرض وضعية مختلفة لـ Spider-Man. على الرغم من أن الصور التقطت الشخصية أثناء الحركة، إلا أنها كانت أقل سينمائية ووضوحًا.
الفائز: Nano Banana يفوز بصورة واضحة لـ Spider-Man وتفاصيل ميدان تايمز التي تجعل الصورة تبدو وكأنها مأخوذة مباشرة من فيلم.
3. بناء عوالم خيالية
المُطالبة:“قلعة عائمة مصنوعة من الزجاج والكريستال تحوم فوق شلال، مع تنانين تدور حولها وقرويين يشاهدون من الأسفل.”
ابتكر Nano Banana مشهدًا خياليًا آسرًا، بقلعة مضيئة وشلال متدفق يبدو وكأنه مأخوذ مباشرة من كتاب حكايات. لكن الغيوم المثالية بشكل مفرط والطيور المتباعدة بالتساوي جعلت الصورة تبدو مصطنعة بعض الشيء، مما قلل من سحرها.
قدم Midjourney أربع صور مذهلة لم تلتقط كل عنصر من عناصر المطالبة فحسب، بل أضافت أيضًا تفاصيل إضافية رفعت المشهد إلى ما هو أبعد من التوقعات.
الفائز: برنامج Midjourney يفوز لخلقه مشهدًا خياليًا حقًا بعناصر تجاوزت التوقعات مع الاستمرار في اتباع التعليمات بعناية.
4. اختبار الواقعية اليومية
المُطالبة:“مقهى يعج بالحياة في مدينة نيويورك في يوم ممطر، انعكاسات على الأرض، أشخاص يعملون على أجهزة اللابتوب، باريستا يقوم بتبخير الحليب.”
برنامج Nano Banana جعل اليوم الممطر واضحًا بوجود العديد من المظلات المعلقة عالياً، وهو أمر غير واقعي (غالبًا ما تكون بجوار الباب وأقل ارتفاعًا). زبائن المقهى ليسوا متنوعين ومعظمهم متشابهون.
برنامج Midjourney أخذ في الاعتبار تنوع مدينة نيويورك بإضافة مجموعة متنوعة من الأشخاص في المقهى. وجهة النظر مختلفة عما كنت أتوقعه، لكنها تعمل على التقاط صورة للمقهى المزدحم. المطر في الخارج أقل وضوحًا ولكنه واضح أن الطقس سيئ بناءً على ما يرتديه الزبائن.
الفائز: Midjourney
يفوز بصورة أقرب إلى الواقع لمقهى في نيويورك، مع أنه لم يركز على المطر بنفس القدر.
5. الفكاهة والسريالية
المُطالبة:“كلب كورجي يرتدي زي ساموراي ويتزلج في غابة من الخيزران، مرسومة بأسلوب طباعة الأوكييو-إه الخشبية.”
أنتج Nano Banana صورة تجسد كلًا من ساموراي الكورجي والخلفية لإبراز عنصر الطباعة في الطلب بشكل أفضل.
قدم Midjourney صورًا لكلاب كورجي ساموراي أكثر جاذبية، يمكن القول. ولكن على الرغم من وضوح الصور وتنوع وضعيات الكلاب، إلا أن الكتابة غير مقروءة، مما يقلل في النهاية من جودة الصورة.
الفائز: Nano Banana يفوز لأنه التقط أسلوب طباعة الأوكييو-إه الخشبية بدقة أكبر.
6. تحدي عرض النصوص
المُطالبة:“لوحة نيون لمطعم في الليل مكتوب عليها ‘مفتوح 24 ساعة’ مع انعكاسات متوهجة على الرصيف المبلل، مطعم كلاسيكي من الخمسينات في الخلفية.”
نجح Nano Banana في التقاط صورة واقعية لمطعم من الخمسينات من الخارج، مع كتابة الكلمات على اللوحة بشكل صحيح. ومع ذلك، بدت انعكاسات البركة مصطنعة بشكل مفرط، مما قلل من واقعية الصورة.
أظهر Midjourney صورة أفضل للمطعم من الخمسينات من الخارج، مع مراعاة التصميم الداخلي. على الرغم من أن إحدى الصور بها خطأ إملائي في كلمة “ساعات”، إلا أن ثلاث صور أخرى كانت أكثر واقعية من صورة Nano Banana.
الفائز: MidJourney يفوز في هذه الجولة لتقديمه تفسيرًا أكمل وأكثر تصديقًا للطلب.
7. مشهد سينمائي طبيعي
المُطالبة:“لقطة بانورامية ملحمية لشواطئ آيسلندا الرملية السوداء مع أمواج متلاطمة ضخمة، وسماء عاصفة، وشخص واحد يرتدي معطف واق من المطر أحمر يقف على الشاطئ.”
أنتج Nano Banana صورة آسرة تكاد تنبض بالحياة. الأمواج المتلاطمة والسماء الملبدة بالغيوم والإحساس بالعمق جعلك تشعر وكأنك تقف هناك على الشاطئ. كانت الصورة مذهلة بصريًا وتحكي قصة يمكنك أن تعيشها.
أنتج Midjourney صورًا درامية مماثلة، ولكن الأمواج كانت ضخمة للغاية لدرجة أنها كانت ساحقة، وكادت تبتلع المشهد. مع عدم وجود أرض مرئية في المسافة، بدت التكوينات أشبه بمنظر بحري خيالي بدلاً من منظر محيط واقعي.
الفائز: Nano Banana يتفوق هنا في إنشاء صورة أكثر توازناً وواقعية تجسد جمال الطبيعة دون أن تفقد الواقعية.
8. تجريدي / أسلوبي
المُطالبة:“لوحة تكعيبية لفرقة جاز تعزف في نادٍ يعج بالدخان، أشكال مبالغ فيها، ألوان جريئة، مستوحاة من بيكاسو.”
يثبت Nano Banana مرة أخرى أن الأمر لا يتعلق بالكمية، بل بالجودة. الصورة التي تم إنشاؤها، مع الإطار، تعرض قطعة مستوحاة من بيكاسو وكأنها شيء يمكن تخيله معلقًا في معرض فني.
Midjourney التقط الأسلوب بشكل معقول، لكن مخرجاته الأربعة تفتقر إلى العمق والتنوع. بدت كل واحدة متطابقة تقريبًا، ولم تبرز أي منها باعتبارها لا تُنسى أو فريدة من نوعها.
الفائز: Nano Banana يفوز بالإبداع وتقديم صورة تبدو وكأنها فن أصيل.
9. لطيف ومناسب للانتشار السريع
المُطالبة:“فيل صغير في حوض سباحة للأطفال مليء بالبط المطاطي، يرتدي نظارة شمسية كبيرة جدًا، بأسلوب رسوم متحركة باستيل.”
Nano Banana قدم بالضبط ما طلبه الوصف، حيث أنتج صورة تبدو وكأنها مأخوذة مباشرة من كتاب قصص للأطفال أو كتاب تلوين. الخطوط المرحة و “أسلوب الرسوم المتحركة” الزاهي التقطا الإحساس الغريب بشكل مثالي.
Midjourney اتبع نهجًا مختلفًا، حيث مال إلى صور أكثر واقعية. في حين أن النتائج كانت لطيفة بلا شك (وأنا أريد تعليق هذه السلسلة من الصور في حمام أطفالي)، إلا أنها أخطأت الهدف في النهاية. كان المطلوب رسمًا، وليس عرضًا شبه واقعي.
الفائز: Nano Banana يفوز في هذه الجولة لالتزامه بالوصف وإتقان أسلوب الرسوم المتحركة.
الفائز العام: Nano Banana
بعد تسع جولات، هناك شيء واحد واضح: Nano Banana يتفوق على وزنه. لقد برع في الواقعية التصويرية والفكاهة والأوصاف الأسلوبية. وفي الوقت نفسه، أثبت Midjourney قيمته في بناء العوالم والواقعية اليومية، حيث أنتج باستمرار اختلافات متعددة، حتى مع وجود عيوب، غالبًا ما كانت تبدو أكثر ثراءً وتوسعًا.
فاز Nano Banana في هذه المواجهة، حيث قدم صورًا سريعة ودقيقة للوصف بسحر مدهش، كأفضل خيار لإنشاء الصور. ولكن إذا كنت تريد المزيد من الصور للاختيار من بينها بتفاصيل متعددة الطبقات، فلا يزال Midjourney يحتفظ بالأفضلية.