في تطور جديد بمجال الذكاء الاصطناعي، كشفت تقارير متداولة على منصة X عن تحقيق نموذج Grok 4.20 قفزة ملحوظة في ما يُعرف بمعدل "عدم الهلوسة" (Non-Hallucination Rate)، ليصل إلى 83%، متجاوزًا رقمه القياسي السابق الذي بلغ 78% قبل أيام قليلة فقط.
ويُعد هذا المؤشر من أهم المعايير الحديثة لقياس دقة نماذج الذكاء الاصطناعي، حيث يشير إلى قدرة النموذج على تجنب اختلاق المعلومات أو تقديم إجابات غير دقيقة، وهي إحدى أبرز التحديات التي تواجه تقنيات الذكاء الاصطناعي التوليدي.
تفوق على المنافسين في دقة الإجابات
بحسب المنشورات المتداولة، تفوق نموذج Grok 4.20، التابع لشركة xAI، على عدد من أبرز النماذج المنافسة، من بينها Claude Opus 4.6 وGemini 3.1 وGPT-5.4، في معيار تقليل “الهلوسة”، وهو ما يعكس توجهًا متزايدًا نحو تحسين موثوقية الإجابات بدلًا من التركيز فقط على السرعة أو الإبداع.
ويشير مصطلح “الهلوسة” في الذكاء الاصطناعي إلى قيام النموذج بإنتاج معلومات غير صحيحة أو غير مدعومة بمصادر، مع تقديمها بثقة عالية، وهو ما قد يسبب مشكلات في الاستخدامات المهنية والتعليمية.
استراتيجية "لا أعرف" بدلًا من التخمين
أحد أبرز ملامح التحسين في Grok 4.20 هو تبنيه نهجًا أكثر تحفظًا، حيث يُفضل الاعتراف بعدم المعرفة بدلًا من تقديم إجابات غير دقيقة. هذا التوجه يُعد تحولًا مهمًا في تصميم النماذج، إذ يعزز من ثقة المستخدمين ويقلل من مخاطر التضليل.
ويأتي ذلك في وقت تتعرض فيه نماذج الذكاء الاصطناعي لانتقادات متزايدة بسبب تقديمها معلومات خاطئة في بعض الأحيان، خاصة في المجالات الحساسة مثل الطب والقانون.
سباق عالمي نحو الموثوقية
يعكس هذا التقدم اشتداد المنافسة بين شركات الذكاء الاصطناعي الكبرى، حيث لم يعد التفوق يعتمد فقط على قوة النموذج أو حجمه، بل على مدى دقته وموثوقيته. وتسعى الشركات المطورة إلى تحسين جودة البيانات، وتعزيز آليات التحقق، وتطوير أنظمة تقلل من احتمالات الخطأ.
ورغم أهمية هذه الأرقام، يشير خبراء إلى ضرورة التعامل معها بحذر، نظرًا لاختلاف طرق القياس والمعايير المستخدمة بين شركة وأخرى.

















0 تعليق