ملخص المقال:
قام فريق دولي من الباحثين في مجال الذكاء الاصطناعي وعلماء الرياضيات بتطوير مقياس رياضي جديد يهدف إلى اختبار قدرات أنظمة الذكاء الاصطناعي في حل المسائل الرياضية الصعبة. وقد أظهرت نتائج الدراسة، التي نُشرت على منصة “أركيف بريبرنت”، أن الأنظمة التي حققت درجات جيدة في مقاييس تقليدية لم تتمكن من تجاوز 2% في تقديم حلول لهذه المسائل المعقدة. على الرغم من التطور الكبير الذي شهدته برامج الذكاء الاصطناعي مثل “شات جي بي تي”، إلا أن هناك فشلاً واضحاً في معالجة الرياضيات الصعبة، مما يستدعي تطوير مقاييس جديدة لتقييم هذه القدرات.
استجابةً لذلك، قام الباحثون بإنشاء مقياس جديد يسمى “FrontierMath”، الذي يهدف إلى قياس التقدم في التفكير الرياضي المعقد للذكاء الاصطناعي. وقد تواصل الفريق مع عدد من خبراء الرياضيات للحصول على مسائل صعبة تتطلب مستوى عميق من الفهم، حيث تلقت المجموعة المئات من هذه المسائل. وقد أظهرت النتائج أن نماذج الذكاء الاصطناعي نجحت في حل أقل من 2% من هذه المسائل، مما يكشف عن فجوة كبيرة بين قدراتها وقدرات العلماء والباحثين في هذا المجال. يوضح الباحثون أن “FrontierMath” يوفر اختبارات صارمة تقيس مدى تقدم أنظمة الذكاء الاصطناعي في الرياضيات، مما يعكس التحديات المستمرة التي تواجهها هذه الأنظمة في الوصول إلى مستوى الخبراء.
انقر الرابط لقراءة كامل المقال علي موقع Aawsat | الشرق الأوسط.