نماذج الذكاء الاصطناعي: قدرات هائلة، ولكنها تعجز في صناعة ألعاب الفيديو

0

مع استمرار تطور أدوات الذكاء الاصطناعي، يتم تشجيعنا باستمرار على تفويض المزيد والمزيد من المهام المعقدة إليها. يمكن لنماذج اللغات الكبيرة (LLMs) كتابة رسائل البريد الإلكتروني الخاصة بنا، وإنشاء العروض التقديمية، وتصميم التطبيقات، وإنشاء مقاطع الفيديو، والبحث في الإنترنت وتلخيص النتائج، وغير ذلك الكثير. ومع ذلك، فإن أحد الأشياء التي لا تزال تواجه صعوبة حقيقية فيها هي ألعاب الفيديو.

حتى الآن هذا العام، حاولت اثنتان من أكبر الشركات في مجال الذكاء الاصطناعي (Microsoft و Anthropic) جعل نماذجها تنشئ أو تلعب الألعاب، والنتائج ربما تكون أكثر محدودية بكثير مما يتوقعه الكثير من الناس. هذا يسلط الضوء على التحديات الحالية في مجال الذكاء الاصطناعي التوليدي، خاصةً في المهام التي تتطلب تخطيطًا استراتيجيًا طويل الأمد واتخاذ قرارات معقدة.

هذا يجعلها عروضًا مثالية لما وصل إليه الذكاء الاصطناعي التوليدي حقًا في الوقت الحالي – باختصار: يمكنه فعل الكثير أكثر من ذي قبل، لكن لا يمكنه فعل كل شيء. هذا يعكس أن الذكاء الاصطناعي التوليدي لا يزال في مرحلة التطور، وأنه على الرغم من قدراته المتزايدة، إلا أنه لا يزال يواجه قيودًا في بعض المجالات.

Microsoft تُنتج لعبة Quake II بالذكاء الاصطناعي

إنتاج ألعاب الفيديو يواجه تحديات مماثلة لتلك الموجودة في إنتاج مقاطع الفيديو، حيث تكون الحركة غريبة ومشوهة، ويبدأ الذكاء الاصطناعي في فقدان الاتصال بـ “الواقع” بعد فترة زمنية معينة. أحدث محاولة من Microsoft، والتي يمكن لأي شخص تجربتها، هي نسخة مُنتَجة بالذكاء الاصطناعي من Quake II.

لقد لعبت اللعبة عدة مرات وكانت تجربة غريبة حقًا، حيث يظهر الأعداء المشوشون من العدم وتتغير البيئة من حولك أثناء الحركة. في مرات عديدة عندما دخلت غرفة جديدة، كان المدخل يختفي عندما أستدير لمواجهته، وعندما أنظر إلى الأمام مرة أخرى، تكون الجدران قد تحركت.

Screenshot from Quake II's Steam page.

تدوم التجربة بضع دقائق فقط قبل أن تتوقف وتطالبك ببدء لعبة جديدة، ولكن إذا كنت غير محظوظ، فقد تتوقف عن الاستجابة لمدخلاتك بشكل صحيح حتى قبل ذلك.

ومع ذلك، فهي تجربة رائعة، وأعتقد أنها ستكون مفيدة لعدد أكبر من الناس لرؤيتها. إنها تتيح لك تجربة ما يتقنه الذكاء الاصطناعي التوليدي بنفسك، وما هي القيود الحالية. على الرغم من أنه من المثير للإعجاب أن نتمكن من إنشاء تجربة لعبة فيديو تفاعلية على الإطلاق، إلا أنه من الصعب تخيل أن أي شخص يمكنه لعب هذا العرض التوضيحي التكنولوجي ويعتقد أن Assassin’s Creed القادمة سيتم إنتاجها بواسطة الذكاء الاصطناعي.

ومع ذلك، توجد هذه الأنواع من الأفكار والافتراضات، ويرجع ذلك إلى حد كبير إلى أن الناس لا يستطيعون الهروب من سماع أخبار الذكاء الاصطناعي في الوقت الحالي. حتى إذا كنت لا تهتم بالذكاء الاصطناعي على الإطلاق، فسيظل يُفرض عليك في كل مكان تذهب إليه. المشكلة هي أن المعلومات التي يحصل عليها الشخص العادي تتكون بالكامل تقريبًا من تعليقات التسويق لكبرى شركات التكنولوجيا وتعليقات المديرين التنفيذيين التي تلتقطها المنشورات الإخبارية.

وهذا يعني أنهم يسمعون ادعاءات مبالغ فيها ومتضاربة مثل هذه:

لديه القدرة على حل بعض أكبر المشاكل في العالم، مثل تغير المناخ والفقر والمرض. (بيل غيتس)

من المحتمل أنه في عام 2025، نحن في Meta، بالإضافة إلى الشركات الأخرى التي تعمل بشكل أساسي على هذا، سنمتلك ذكاءً اصطناعياً يمكن أن يكون بمثابة مهندس متوسط المستوى لديك في شركتك ويمكنه كتابة التعليمات البرمجية بكفاءة. (Mark Zuckerberg)

الاستخدام الفعال للذكاء الاصطناعي أصبح الآن توقّعًا أساسيًا من الجميع في Shopify. إنه أداة لكل المهن اليوم، وسوف يزداد أهميةً مع مرور الوقت. بصراحة، لا أعتقد أنه من الممكن تجنب تعلم مهارة تطبيق الذكاء الاصطناعي في مجال عملك. (توبي لوتكه، الرئيس التنفيذي لـ Shopify)

نحن الآن واثقون من أننا نعرف كيف نبني الذكاء الاصطناعي العام (AGI) كما فهمناه تقليديًا. نعتقد أنه في عام 2025، قد نشهد أول وكلاء ذكاء اصطناعي “ينضمون إلى القوى العاملة” ويغيرون بشكل جوهري إنتاج الشركات. (Sam Altman، الرئيس التنفيذي لـ OpenAI)

الذكاء الاصطناعي أكثر خطورة من، على سبيل المثال، سوء إدارة تصميم الطائرات أو صيانة الإنتاج أو إنتاج السيارات الرديئة، بمعنى أنه يمتلك القدرة – مهما صغر احتمال ذلك، ولكنه ليس تافهاً – على تدمير الحضارة. (Elon Musk)

كل هذا يبدو مبالغًا فيه، أليس كذلك؟ يُفترض أن ينقذنا ويدمرنا في الوقت نفسه، وأنه أداة شاملة للمحترفين وأداة ستحل محلهم – ويبدو أننا قد نحصل على AGI بمستوى الخيال العلمي في أقرب وقت هذا العام. عندما يسمع الناس كل هذا، يبدأون في توقع أشياء مذهلة من هذه الأدوات ويصدقون أن جميع موظفي المكاتب يقضون أيامهم في التحدث مع أجهزة الكمبيوتر الخاصة بهم مثل شخصيات Star Trek.

ومع ذلك، هذا ليس ما يبدو عليه الواقع. الواقع يبدو وكأنه Quake II مهتزة ومشوشة مع أشكال غير مفهومة للأعداء. نماذج LLM بمستوى ChatGPT كانت بالفعل طفرة مثيرة في عام 2022، والكثير من المرح للجميع للعب بها – ولكن بالنسبة لغالبية الاستخدامات التي تدفعها شركات التكنولوجيا الكبرى علينا الآن، فإن الذكاء الاصطناعي ببساطة ليس قادراً بما فيه الكفاية. مستويات الدقة منخفضة للغاية، وقدرات اتباع التعليمات منخفضة للغاية، ونطاقات السياق صغيرة جدًا، ويتم تدريبها فقط على هراء الإنترنت بدلاً من معرفة العالم الحقيقي.

ولكن إنشاء لعبة فيديو هو هدف معقد للغاية – يستغرق الأمر فرقًا كاملة من البشر سنوات لصنع هذه الأشياء، بعد كل شيء. ماذا عن لعب ألعاب الفيديو بدلاً من ذلك؟

Claude “يلعب” Pokémon Red

لقطة شاشة لكلود يلعب بوكيمون.

حسنًا، اتضح أن الناس يقومون بتجارب في هذا المجال أيضًا. أحدث نموذج من Anthropic، وهو Claude 3.7 Sonnet ، يلعب Pokémon Red على Twitch منذ حوالي شهرين حتى الآن، ويقوم بأفضل عمل قام به نموذج لغوي كبير (LLM) على الإطلاق في لعب Pokémon. ومع ذلك، هناك تحذير بسيط، وهو أنه لا يزال متخلفًا بأميال عن متوسط مستوى طفل بشري يبلغ من العمر 10 سنوات.

إحدى المشكلات هي السرعة – يستغرق Claude آلاف الإجراءات على مدى أيام متعددة للقيام بأشياء مثل المرور عبر Viridian Forest. هذا يعكس تحديات الذكاء الاصطناعي في معالجة المهام المعقدة.

رسم بياني لتقدم كلود في بوكيمون.

لماذا يستغرق الأمر وقتًا طويلاً؟ ليس لأنه لا يستطيع معرفة كيفية الفوز بمعارك Pokémon بشكل استراتيجي – هذا في الواقع هو الجزء الذي يجيده. من ناحية أخرى، فإن التنقل عبر البيئة وتجنب الأشجار والمباني – ليس جيدًا جدًا. لم يتم تدريب Claude مطلقًا على لعب Pokémon، وليس من السهل عليه فهم فن البكسل وما يمثله. هذه الصعوبات تسلط الضوء على الفجوة بين القدرة على معالجة البيانات والقدرة على التفاعل مع بيئات معقدة.

يعد المرور عبر المناطق الشبيهة بالمتاهة مثل Mt. Moon أمرًا صعبًا بشكل خاص بالنسبة له، حيث يكافح لتشكيل خريطة للمنطقة وتجنب تتبع خطواته. في إحدى المرات، علق نفسه في زاوية لدرجة أنه استنتج أن اللعبة معطلة وأصدر طلبًا رسميًا لإعادة تعيين اللعبة. هذا يوضح كيف أن الذكاء الاصطناعي، على الرغم من قدراته المتقدمة، لا يزال يفتقر إلى الفهم البديهي الذي يمتلكه البشر.

لم تخلُ هذه المحاولات المبكرة من لحظات طريفة أيضًا.

في إحدى المرات، عَلِق Claude في زاوية، ومقتنعًا بوجود عطل ما، كتب طلبًا رسميًا لإعادة ضبط اللعبة. pic.twitter.com/5RIiCJdxCM— Anthropic (@AnthropicAI) February 25, 2025

كما أنه ليس بارعًا في تذكر أهدافه، أو الأشياء التي جربها بالفعل، أو الأماكن التي زارها من قبل.

هناك سبب مباشر جدًا لذلك – نماذج اللغات الكبيرة (LLMs) لديها “نافذة سياق” محدودة تعمل كذاكرة لها. يمكنها فقط الاحتفاظ بقدر معين من المعلومات، وبمجرد أن يصل Claude إلى الحد الأقصى، فإنه يضغط ما لديه لإفساح المجال للمزيد. لذلك قد يتم ضغط معلومة مثل “زار Viridian City، ودخل كل مبنى، وتحدث إلى كل شخصية غير قابلة للعب (NPC)” إلى مجرد “زار Viridian City” – مما يدفع Claude للعودة والتحقق مما إذا كان هناك المزيد لفعله في المدينة.

باختصار: لا يستطيع Claude معرفة إلى أين هو ذاهب، ويسير في الجدران، ويخلط بين الأشياء العشوائية والشخصيات غير القابلة للعب (NPCs)، وينسى أين كان وما الذي يحاول القيام به، وكل قرار يتخذه يتطلب فقرات وفقرات من التفكير. هذا ليس انتقادًا – هذه تجارب مثيرة تدفع نماذج اللغات الكبيرة (LLMs) إلى أقصى حد ممكن.

ولكن مع كل الضجيج حول الذكاء الاصطناعي (AI)، من المهم أن يرى الناس عروضًا تجريبية مثل هذه وأن يكونوا آراءهم الخاصة حول الذكاء الاصطناعي (AI). تحاول بعض الشخصيات الترويج لفكرة أننا على وشك الوصول إلى الذروة – وأنه في غضون سنوات، سيتجاوز الذكاء الاصطناعي (AI) حتى أذكى البشر – لكنني لا أعتقد أنهم صادقون، إنهم مجرد بائعين. نحن لسنا قريبين من الذروة، هذا الشيء برمته قد بدأ للتو.

اترك رد

لن يتم نشر عنوان بريدك الإلكتروني.