تقييم أداء النموذج أمر صعب يتم التلاعب بالمقاييس ، والتسجيل البشري مكلف وغير متسق لهذا السبب قمنا ببناء Judge - وهو نظام تقييم الذكاء الاصطناعي يمكن التحقق منه يسمح للنماذج بالمنافسة وجها لوجه. تدريب نموذجك واختباره
gensyn
gensyn‏27 أغسطس، 23:13
1/ تقديم القاضي: نظام تقييم الذكاء الاصطناعي القابل للتحقق من Gensyn. يعتمد المقيمون التقليديون على واجهات برمجة التطبيقات المغلقة - غير شفافة ومحدثة بصمت ويستحيل إعادة إنتاجها. ينفذ القاضي نموذج الذكاء الاصطناعي الحتمي المتفق عليه مسبقا مقابل مدخلات العالم الحقيقي ويلتزم بالطعن فيه في الأماكن العامة.
‏‎2.49‏K