أهم 5 أخبار في عالم الذكاء الاصطناعي قد فاتتك هذا الأسبوع: تحديثات ChatGPT وأحدث خطوات Google
شهد هذا الأسبوع مفاجآت عديدة من شركات الذكاء الاصطناعي التي لم تكن في الواجهة. يبدو أنَّ Google’s Gemini في طريقه ليُصبح المفضل لدى الجمهور، بينما Grok تصدّر قائمة أفضل روبوتات الدردشة أداءً. كما أنَّ هناك نموذج ذكاء اصطناعي طبي جديد يساعد الأطباء على اكتشاف أكثر من 1000 مرض، بما في ذلك السرطان.
في غضون ذلك، تتخذ ChatGPT خطوات حثيثة لزيادة الأمان بين أصغر مستخدميها من خلال طرح إجراءات وقائية للمستخدمين الذين تقل أعمارهم عن 18 عامًا. إليك أهم أخبار الذكاء الاصطناعي التي تحتاج إلى معرفتها هذا الأسبوع.
Gemini هو المفضل لدى الجمهور من بين 27 نموذجًا مختلفًا للذكاء الاصطناعي
في واحدة من أكبر الاستطلاعات العامة من نوعها، قام أكثر من 21000 مشارك في جميع أنحاء الولايات المتحدة والمملكة المتحدة بتقييم 27 نموذجًا مختلفًا للذكاء الاصطناعي – و Gemini 2.5 Pro تصدر القائمة. الدراسة، التي أُجريت باستخدام نظام Humaine التابع لـ Prolific، قيّمت النماذج بناءً على معايير مثل أسلوب التواصل، والقدرة على الاستنتاج، ومستوى الثقة، وتجربة المستخدم بشكل عام.
تفوق Gemini على منافسيه، بمن فيهم ChatGPT و Claude، في معظم الفئات الفرعية، مما يعزز مكانته كأكثر نماذج Google تطوراً في مجال الاستنتاج حتى الآن. بينما حل ChatGPT في المرتبة الثامنة بشكل عام.
أهم النقاط:
- Gemini 2.5 Pro تصدر المرتبة الأولى في استطلاع رأي عام شمل 27 نموذجًا في الولايات المتحدة والمملكة المتحدة.
- شارك 21,352 شخصًا من مختلف الفئات الديموغرافية في هذه النتائج.
- معايير التقييم: التواصل، والمرونة، والاستنتاج، والثقة، وتجربة المستخدم بشكل عام.
- حل ChatGPT في المرتبة الثامنة بشكل عام؛ بينما احتلت إصدارات Claude المرتبتين 11 و 12.
ChatGPT يبتكر ميزات خاصة بالمراهقين
أخيرًا، OpenAI تطلق قواعد أمان جديدة للمراهقين. تتضمن التحديثات نظامًا للتنبؤ بالعمر للكشف عن المستخدمين الذين تقل أعمارهم عن 18 عامًا، مع توخي الحذر من خلال تطبيق الضوابط الوقائية إذا كان العمر غير معروف. وعود بفرض مرشحات أكثر صرامة على الموضوعات الحساسة (المحتوى الجنسي وإيذاء النفس، وما إلى ذلك) بالإضافة إلى أدوات الرقابة الأبوية مثل ساعات الحظر والقدرة على ربط الحسابات.
هذه التغييرات هي مجرد بداية، لكنها تثير أسئلة صعبة حول كيف سيتم تحديد العمر، وعدد المرات التي ستؤثر فيها الأخطاء على الثقة، وما إذا كان المراهقون يشعرون بالأمان عند الانفتاح إذا كانوا يخشون المراقبة أو الحكم عليهم.
ما يجب معرفته
- قاعدة جديدة للكشف عن العمر: ستقوم OpenAI بتوجيه المستخدمين الذين تحدد أنهم أقل من 18 عامًا إلى نسخة من ChatGPT مع قواعد أمان أكثر صرامة.
- الوضع الافتراضي لمن هم دون السن القانونية: إذا تعذر تأكيد العمر، فإن النظام يتوخى الحذر من خلال تطبيق قيود القاصرين على أي حال.
- تقديم أدوات الرقابة الأبوية: يمكن للوالدين الارتباط بحساب المراهق الخاص بهم، وتعطيل الميزات أو تقييدها (مثل الذاكرة أو السجل)، وتحديد ساعات آمنة (ساعات الحظر) وتلقي تنبيهات إذا اكتشف الذكاء الاصطناعي علامات تدل على الضيق.
- قيود المحادثة للمراهقين: يتم تقييد المحتوى الجنسي الصريح، والدردشة الغزلية، ومناقشات إيذاء النفس. في الحالات القصوى التي تنطوي على ضرر وشيك، من المحتمل الاتصال بجهات إنفاذ القانون إذا تعذر الوصول إلى الوالدين.
أصبح الآن بالإمكان مشاركة إبداعات Gemini المخصصة
تقوم Google بتوسيع نطاق وصول Gemini، من خلال منح المستخدمين القدرة الآن على مشاركة مساعديهم المخصصين، Gems. بالنسبة لأولئك الأكثر دراية بـ ChatGPT، هذه هي أساسًا نماذج GPT مخصصة. قبل الآن، كانت Gemini Gems محصورة في الاستخدام الشخصي الخاص، ولكن يمكن الآن مشاركتها بسهولة مثل مستندات Google، مما يسمح لزملاء العمل والطلاب وأي شخص آخر بالتعاون مع ذكاء اصطناعي مصمم خصيصًا، دون الحاجة إلى بنائه من الصفر.
تؤكد هذه الخطوة على سعي Google لجعل Gemini منصة أكثر مرونة وسهولة في الاستخدام.
ما يجب معرفته:
- Gems قابلة للتخصيص وهي عبارة عن مساعدين يعملون بالذكاء الاصطناعي يمكنك تصميمهم لمهام محددة مثل البرمجة أو التحرير أو تبادل الأفكار.
- تتم مشاركة Gems بنفس طريقة مشاركة أي شيء آخر على Google Drive. عند التعاون، يمكن للآخرين عرض Gem أو تعديله.
- متاحة الآن لمشتركي Gemini Advanced و Business و Enterprise في أكثر من 150 دولة.
Grok يتصدر قائمة ARC-AGI
يبدو أن إيلون ماسك و Grok 4 قد تصدروا سباق الذكاء الاصطناعي، حيث يتصدر قائمة ARC-AGI، وهو معيار يقيس عدد المشاكل التي يمكن للذكاء الاصطناعي حلها وكفاءة النموذج. في الاختبارات الأخيرة، تفوق Grok 4 على منافسيه مثل ChatGPT و Gemini في هذا المقياس الصعب، مما يسلط الضوء على قدرته الفائقة على حل المشكلات الواقعية وسرعته.
على الرغم من سرعته واستخدامه للبحث المباشر على الويب ومعالجته الرائعة للمطالبات الهندسية المعقدة، لا يزال لدى المستخدمين مخاوف بشأن دقة Grok والإشراف على المحتوى والتحيز.
ما يجب معرفته:
- متصدر قائمة ARC-AGI: يدعي Grok 4 أنه يحتل المرتبة الأولى، مما يعني أنه يحل المزيد من تحديات الذكاء الاصطناعي القياسية لكل وحدة موارد مقارنة بالمنافسين.
- نقاط القوة: بحث فوري تقريبًا على الويب، ومعالجة محسنة للمهام الهندسية والمنطقية المعقدة، وتحسينات في الأداء مقارنة بإصدارات Grok السابقة.
- نقاط الضعف والمخاوف
: مشكلات تتعلق بدقة المحتوى (بعض الادعاءات غير الصحيحة)، وقضايا التحيز، والتحدي المتمثل في الحفاظ على الاعتدال والموثوقية في ظل الاستخدام المكثف. - الخلاصة: يوضح أن الكفاءة والجودة يحصلان على مكافأة متزايدة في معايير الذكاء الاصطناعي.
نموذج ذكاء اصطناعي جديد يتنبأ بخطر إصابتك بأكثر من 1000 مرض، بما في ذلك السرطان
يمثل نموذج ذكاء اصطناعي جديد يسمى Delphi-2M قفزة نوعية في مجال الذكاء الاصطناعي الطبي. تم تدريبه على بيانات صحية مجهولة المصدر لما يقرب من 2.3 مليون شخص في المملكة المتحدة والدنمارك، ويمكنه التنبؤ بخطر إصابتك بأكثر من 1000 مرض وتقدير متى قد تحدث.
على عكس نماذج الذكاء الاصطناعي الأخرى، يمنحك Delphi-2M درجة خطر لـ 1000 حالة، باستخدام سجلات الأمراض وعوامل نمط الحياة والعمر والجنس لمحاكاة المسارات الصحية على مدى عقود. يمكن للنموذج التنبؤ ليس فقط بالمرض الذي قد يأتي، ولكن متى.
في التجارب، حقق النظام متوسط مساحة تحت المنحنى (AUC) بلغ 0.76 عبر مئات الأمراض في مجموعات بيانات المملكة المتحدة، على الرغم من انخفاض الدقة في التجمعات السكانية الدنماركية. يجب التأكيد على أن هذا النموذج ليس أداة تشخيصية ولا يغني عن الأطباء البشريين.
لكن الأداة واعدة كأداة للتنبؤ، مفيدة في رصد الاتجاهات العامة للمخاطر، والتخطيط للوقاية، وتسليط الضوء على إمكانات الذكاء الاصطناعي في الصحة الشخصية.
أهم النقاط:
- مجموعة بيانات ضخمة: تم تدريبه على ما يقرب من 2.3 مليون شخص من بنك UK Biobank + السجلات الدنماركية.
- نمذجة شاملة وزمنية: يستخدم مدخلات تفصيلية (العمر، الجنس، نمط الحياة، التشخيصات السابقة) ويتوقع كلاً من المرض التالي ومتى سيحدث.
- تنبؤ وليس تشخيص: يهدف إلى توجيه الوقاية، وليس استبدال المشورة الطبية.
الخلاصة
في غضون أسبوع واحد فقط، تسلط هذه التحديثات الضوء على تحول واضح في مشهد الذكاء الاصطناعي نحو التكامل الواقعي والاختراقات الأكبر.