الذكاء الاصطناعي يواجه صعوبة في التاريخ

أظهرت دراسة حديثة أن الذكاء الاصطناعي، رغم تفوقه في مجالات مثل البرمجة وإنشاء البث الصوتي، لا يزال يواجه صعوبة في فهم التاريخ بشكل دقيق.
تم اختبار ثلاثة من أفضل نماذج الذكاء الاصطناعي مثل GPT-4 من OpenAI وLlama من Meta وGemini من Google على أسئلة تاريخية، وكانت النتيجة مخيبة للآمال.
النموذج الأفضل أداءً، GPT-4 Turbo، حقق دقة لا تتجاوز 46% في الإجابة على الأسئلة التاريخية، وهي نسبة منخفضة بشكل غير مبرر بالنسبة للمستوى المتوقع من هذه التكنولوجيا.
وتشمل المشاكل التي تم تحديدها أن النماذج الكبيرة لا تستطيع استرجاع المعرفة التاريخية الدقيقة، إذ تميل إلى الاستناد إلى معلومات تاريخية عامة ومشهورة.
على سبيل المثال، فشل GPT-4 في تحديد الوقت الصحيح لظهور الدرع القشري في مصر القديمة، حيث قال إن هذه التكنولوجيا كانت موجودة في فترة غير دقيقة زمنياً.
كما أظهر ضعفاً في الإجابة على الأسئلة المتعلقة بوجود جيش محترف في مصر القديمة.
على الرغم من هذه النتائج المخيبة، يرى الباحثون أن هناك إمكانيات كبيرة لهذه النماذج في مساعدة المؤرخين في المستقبل.
لذا، يواصل الفريق البحثي العمل على تحسين الأداء في هذا المجال عبر إضافة بيانات تاريخية أكثر تنوعًا وتطوير معايير أكثر صرامة.