مغرس : الذكاء الاصطناعي يقترب من تحقيق العلامة الكاملة في «الامتحان الأخير للبشرية»

نشرة إنذارية.. هبات رياح قوية وزخات رعدية وتساقطات ثلجية من الخميس إلى الأحد المقبل وزارة الداخلية تنفي إصدار أي بلاغ بشأن تدبير واستغلال رخص سيارات الأجرة كينيا تصطف إلى جانب المغرب: دعم صريح يعزز زخم الحكم الذاتي ويعيد توجيه بوصلة المواقف الإفريقية الانخفاض ينهي تداولات بورصة الدار البيضاء طرد 22 طالباً يجر الميداوي للمساءلة كينيا تعلن دعم الحكم الذاتي بالصحراء وتتحرك لتوسيع دائرة المؤيدين دوليًا لوديي يجري مباحثات مع وفد بولوني المغرب وكينيا يوقعان 11 اتفاقية تشمل الفلاحة والصحة والتعليم المجلس الاقتصادي ينبه لمخاطر دمج "الكنوبس" مع "الضمان الاجتماعي" ويوصي باعتماد تغطية صحية للطلبة وتقنين النفقات الطبية تفاصيل اختتام الملتقى الروائي الأمازيغي بالرباط ماراطون الرمال: مرحلة ال100 كلم تخلط الأوراق الأمن يوقف شخصا حرض على قتل المعتنقين لديانات مختلفة الرئيس الإيراني: استمرار الغارات الإسرائيلية على لبنان يجعل المفاوضات مع واشنطن "بلا معنى" اختبار المصداقية يضع "الكاف" بين الدبلوماسية الرياضية والعدالة القانونية البنتاغون يتنازع مع "أنثروبيك" للذكاء الاصطناعي منخفض بارد يسيطر على الأجواء المغربية .. أمطار ورياح وانخفاض للحرارة موتسيبي يشيد بعلاقات المغرب و"الكاف" .. ويعترف بخيبة "نهائي الكان" اليونسكو تختار الرباط عاصمة عالمية للكتاب انطلاق عرض "نوستالجيا: صدى الأسوار" في ليكسوس بالعرائش "ليكيب": حكيمي يفرض نفسه من جديد كظهير لا يُستغنى عنه في تشكيلة باريس رئيس "لاليغا" يرحب بفكرة إجراء مباريات من الدوري الإسباني في المغرب رغم إعلان الهدنة.. هذه تداعيات المجزرة الإسرائيلية الجديدة على لبنان الحذر يسود أسواق العملات مع ترقب وقف هش لإطلاق النار بين أمريكا وإيران بينها علامات تدخل لأول مرة.. "هيلتون" تستعد لرفع محفظتها إلى 27 فندقا في المغرب إحباط محاولة تهريب 181 كيلوغرام من مخدر الشيرا بميناء طنجة المتوسط إيران: 3 آلاف قتيل على الأقل جراء الهجمات الأمريكية – الإسرائيلية الجزائري سعيد خطيبي يتوج بجائزة "البوكر العربية" عن روايته "أغالب مجرى النهر" إسبانيا تندد بهجوم إسرائيل على لبنان وتفتح سفارتها في طهران ارتفاع أسعار النفط وسط مخاوف من عدم استئناف إمدادات الشرق الأوسط "حماة المستهلك" يطالبون بمنع بيع مشروبات الطاقة للقاصرين وفي محيط المدارس الصين تعلن عن سياسات مالية جديدة لدعم الزراعة والتنمية القروية في أفق 2026 إسرائيل تعلن قتل مسؤول في حزب الله إطلاق طلب إبداء الاهتمام ببرنامج "تحفيز نسوة" لتمكين النساء اقتصادياً في ثلاث جهات بروفايل l حكيم زياش.. سيرة لاعب صنعته القيم قبل الملاعب أثناء معاينة حادثة سير.. دركي يتعرض لدهس خطير على مشارف طنجة أنفوغرافيك | ⁨المغرب خارج سباق المدن الذكية لسنة 2026⁩ الماء مقطوع والفواتير مستمرة.. سكان دواوير بالقصر الصغير يعودون إلى الآبار وزان تحتضن المهرجان الدولي للسينما الأفروآسيوية "متحف بيكاسو مالقة" ينعى كريستين عن 97 سنة "بين جوج قبور" يعرض في مونتريال الكشف عن مخطوطة تاريخية نادرة تعود للقرن الرابع الهجري بالسعودية عقار فلوفوكسامين المضاد للاكتئاب يحدّ من إجهاد كوفيد طويل الأمد الوكالة المغربية للأدوية تحذر من مكملات شائعة للتنحيف قد تسبب اضطرابات خطيرة المدرسة العتيقة تافراوت المولود تنظم ندوة علمية وطنية تحت عنوان " السيرة النبوية منهج متكامل لبناء الإنسان وتشييد العمران " دراسة: الذكاء الاصطناعي يشخص سرطان الحنجرة في يومها العالمي : الرياضة .. تُنقذ الأجساد وتُهذّب الإنسان فتح فترة استثنائية جديدة لاستخلاص المبلغ الزائد من مصاريف الحج لموسم 1447 ه من 06 إلى 16 أبريل فتح فترة استثنائية جديدة لاستخلاص المبلغ الزائد من مصاريف الحج لموسم 1447 فتح فترة استثنائية جديدة لاستخلاص المبلغ الزائد من مصاريف الحج

شكرا على الإبلاغ!

سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.

الذكاء الاصطناعي يقترب من تحقيق العلامة الكاملة في «الامتحان الأخير للبشرية»

الاتحاد الاشتراكي نشر في الاتحاد الاشتراكي يوم 07 - 04 - 2026

يتوقع مطورون أن تتمكن أنظمة الذكاء الاصطناعي خلال بضعة أشهر فقط من تحقيق العلامة الكاملة في أحد أصعب الاختبارات المعرفية في العالم، المعروف باسم «الامتحان الأخير للبشرية» (HLE).
وأفاد تقرير نشرته صحيفة «ديلي ميل» أن هذا الاختبار صممه مسؤولون في قطاع التكنولوجيا لقياس مستوى ذكاء الأنظمة، ويتكون من 2500 سؤال مختارة بعناية، تغطي نحو مائة موضوع مختلف، من بينها علوم الصواريخ والأساطير وعلم وظائف الأعضاء.
ويتطلب كل سؤال مستوى فهم لا يقل عن درجة الدكتوراه، ويعد أي شخص يحصل على نتيجة قريبة من 100 بالمئة «خبيرا عالميا».
وأظهرت النتائج قبل عامين أن نظام «جي بي تي» من شركة «أوبن أي آي» حصل على 3 بالمئة فقط في هذا الاختبار، كما لم تكن نتائج أنظمة «غوغل» و»أنثروبك» أفضل بكثير، وهو ما ساهم حينها في تقليل المخاوف بشأن تفوق الذكاء الاصطناعي، عبر إبراز الفجوة بين نماذج اللغة الكبيرة وأبرز الأكاديميين في العالم.
وتشير المعطيات الحديثة إلى تغير هذا الوضع بشكل سريع، إذ سجل نظام «جيميني» التابع ل»غوغل» نسبة 45.9 بالمئة الشهر الماضي، بعد أن كان قد حقق 18.8 بالمئة فقط قبل أشهر قليلة من محاولته الأولى.
وقال كالفن تشانغ، رئيس الأبحاث في شركة Scale المسؤولة عن الاختبار: «أردنا إنشاء اختبار أكاديمي بمستوى خبراء بشر، لا يستطيع حله سوى حفنة من الناس على وجه الأرض، لكننا رأينا تقدما مذهلا في نماذج اللغة خلال السنوات الماضية، والمطورون يقومون بعمل رائع في تحسين قدرات هذه النماذج على التفكير».
وأوضحت كيت أولشيفسكا، مديرة المنتج في Google DeepMind: «إذا كان هذا هو هدفنا الوحيد في الحياة، أعتقد أننا سنصل إليه بسرعة كبيرة»، فيما حققت شركة Anthropic، المطورة لنظام Claude AI، نسبة 34.2 بالمئة مع تحسن مستمر في الأداء.
ويمثل الوصول إلى نسبة 100 بالمئة في هذا الاختبار تحولا مهما، إذ يشير مبتكروه إلى أنه «مصمم ليكون آخر اختبار أكاديمي مغلق من نوعه»، ما يعني أن تجاوز الذكاء الاصطناعي له سيفرض مستقبلا اختبارات بأسئلة لا يعرف أي إنسان إجاباتها.
وتم تطوير الاختبار بالتعاون مع «مركز سلامة الذكاء الاصطناعي»، وهو منظمة غير ربحية، بهدف قياس مدى المعرفة وعمق التفكير لدى الأنظمة الذكية.
وأطلق القائمون على الاختبار في أيلول/ سبتمبر 2024 دعوة عالمية لتقديم الأسئلة، مع رصد جائزة قدرها 500 ألف دولار، حيث استجاب خبراء من نحو 50 دولة وقدموا 70 ألف سؤال، بشرط أن تكون الإجابات قصيرة وواضحة وغير متاحة بسهولة على الإنترنت.
وجرى استبعاد الأسئلة التي تمكنت نماذج الذكاء الاصطناعي الحالية من الإجابة عليها، ما خفض العدد إلى 13 ألف سؤال، قبل اختيار 2500 سؤال نهائي، مع إجراء تعديلات لاحقة بناء على ملاحظات المستخدمين، فيما لا يزال عدد كبير من الأسئلة سريا لمنع الأنظمة من الاستفادة من الإجابات المتداولة.
ويعيد هذا التقدم إلى الأذهان فوز حاسوب IBM «ديب بلو» على بطل العالم في الشطرنج غاري كاسباروف عام 1997، وهو الحدث الذي خالف توقعات العديد من الخبراء، كما جرى لاحقا تجاوز اختبارات بارزة في مجال الذكاء الاصطناعي، من بينها اختبار «المهام المتعددة الضخمة لفهم اللغة» (MMLU) الذي أطلق عام 2020، قبل أن يتم إيقافه بعد أن أصبحت الأنظمة تحقق فيه نتائج تتجاوز 90 بالمئة.
وترى أولشيفسكا أن اقتراب الذكاء الاصطناعي من إتقان الاختبارات البشرية يدفع المطورين للتركيز على تجاوز حدود المعرفة البشرية الحالية، بينما يعتقد تشانغ أن هناك مجالات ستبقى عصية على الإتقان الكامل، مثل الجراحة والمهارات القائمة على اتخاذ القرار والحكم السليم والإبداع.

انقر هنا لقراءة الخبر من مصدره.