Dark Mode
OpenAI का GPT-5 टेस्ट में उतरा खरा, विशेषज्ञों जिती दक्षता साबित की

OpenAI का GPT-5 टेस्ट में उतरा खरा, विशेषज्ञों जिती दक्षता साबित की

नई दिल्‍ली। ओपनएआई ने हाल ही में अपने जीपीटी-5 एआई मॉडल का परीक्षण करने वाला नया बेंचमार्क GDPval पेश किया है। यह टेस्ट यह जांचता है कि एआई मॉडल विभिन्न उद्योगों और नौकरियों में पेशेवर मानवों के मुकाबले कितना बेहतर या समान प्रदर्शन कर सकता है। GDPval का उद्देश्य यह समझना है कि ओपनएआई के सिस्टम आर्थिक रूप से महत्वपूर्ण कामों में मानव विशेषज्ञों के स्तर तक पहुँच चुके हैं या नहीं।


ओपनएआई का क्या कहना है ?
ओपनएआई के अनुसार, जीपीटी-5 और एंथ्रोपिक का क्लाउड ओपस 4.1 मॉडल अब उद्योग विशेषज्ञों द्वारा किए जाने वाले काम के करीब हैं। जीपीटी-5-हाई संस्करण 44 नौकरियों में 40.6% कार्यों में विशेषज्ञों के बराबर या उनसे बेहतर पाया गया। क्लाउड ओपस 4.1 लगभग 49% कार्यों में मानव विशेषज्ञों के बराबर था।


बेंचमार्क मॉडल GDPval का दायरा
GDPval अमेरिका के उन नौ प्रमुख उद्योगों में एआई मॉडल का परीक्षण करता है, जो देश के कुल जीडीपी में सबसे ज्यादा योगदान देते हैं। इनमें हेल्थकेयर, वित्त, मैन्युफैक्चरिंग और सरकारी सेवाएँ शामिल हैं। बेंचमार्क में सॉफ्टवेयर इंजीनियर्स, नर्सेज, पत्रकार और अन्य पेशेवरों के कार्यों की तुलना एआई द्वारा किए गए काम से की जाती है। ओपनएआई ने इस बेंचमार्क में पेशेवरों से एआई-जनित रिपोर्ट की तुलना मानव-जनित रिपोर्ट से करने को कहा। एआई के प्रदर्शन का औसत निकालकर यह पता लगाया गया कि वह कितनी बार इंसानों के बराबर या उनसे बेहतर है।


इस टेस्ट के क्या महत्व हैं?
हालांकि जीपीटी-5 का प्रदर्शन प्रभावशाली है, लेकिन यह टेस्ट केवल कुछ विशेष कार्यों का मूल्यांकन करता है। वास्तविक पेशेवर कार्यों में रिपोर्टिंग के अलावा कई और जटिलताएँ होती हैं। ओपनएआई ने कहा है कि भविष्य में वह अधिक उद्योगों और इंटरैक्टिव वर्कफ्लो को शामिल कर परीक्षण को और विस्तारित करेंगे।


एक्सपर्ट का क्या कहना है ?
ओपनएआई के मुख्य अर्थशास्त्री डॉ. आरोन चटर्जी का कहना है कि एआई मॉडल के इस स्तर पर पहुंचने से पेशेवर अपने समय को अधिक महत्वपूर्ण कार्यों पर केंद्रित कर सकते हैं और कुछ कार्य एआई को सौंप सकते हैं। जीपीटी-4o मॉडल 15 महीने पहले केवल 13.7% मामलों में मानव विशेषज्ञों के बराबर था, जबकि जीपीटी-5 ने यह आंकड़ा लगभग तीन गुना बढ़ा दिया है। यह एआई की तेजी से हो रही प्रगति का संकेत है।


निष्कर्ष
GDPval जैसे बेंचमार्क एआई मॉडल की वास्तविक दुनिया की नौकरियों में दक्षता को मापने का एक महत्वपूर्ण तरीका बन सकते हैं। हालांकि, यह निश्चित रूप से कहने के लिए कि एआई मानवों से बेहतर प्रदर्शन कर सकता है, ओपनएआई को और व्यापक परीक्षण करने की आवश्यकता होगी।

Comment / Reply From

Newsletter

Subscribe to our mailing list to get the new updates!