OpenAI का GPT-5 टेस्ट में उतरा खरा, विशेषज्ञों जिती दक्षता साबित की

September 27, 2025

नई दिल्‍ली। ओपनएआई ने हाल ही में अपने जीपीटी-5 एआई मॉडल का परीक्षण करने वाला नया बेंचमार्क GDPval पेश किया है। यह टेस्ट यह जांचता है कि एआई मॉडल विभिन्न उद्योगों और नौकरियों में पेशेवर मानवों के मुकाबले कितना बेहतर या समान प्रदर्शन कर सकता है। GDPval का उद्देश्य यह समझना है कि ओपनएआई के सिस्टम आर्थिक रूप से महत्वपूर्ण कामों में मानव विशेषज्ञों के स्तर तक पहुँच चुके हैं या नहीं।

ओपनएआई का क्या कहना है ?
ओपनएआई के अनुसार, जीपीटी-5 और एंथ्रोपिक का क्लाउड ओपस 4.1 मॉडल अब उद्योग विशेषज्ञों द्वारा किए जाने वाले काम के करीब हैं। जीपीटी-5-हाई संस्करण 44 नौकरियों में 40.6% कार्यों में विशेषज्ञों के बराबर या उनसे बेहतर पाया गया। क्लाउड ओपस 4.1 लगभग 49% कार्यों में मानव विशेषज्ञों के बराबर था।

बेंचमार्क मॉडल GDPval का दायरा
GDPval अमेरिका के उन नौ प्रमुख उद्योगों में एआई मॉडल का परीक्षण करता है, जो देश के कुल जीडीपी में सबसे ज्यादा योगदान देते हैं। इनमें हेल्थकेयर, वित्त, मैन्युफैक्चरिंग और सरकारी सेवाएँ शामिल हैं। बेंचमार्क में सॉफ्टवेयर इंजीनियर्स, नर्सेज, पत्रकार और अन्य पेशेवरों के कार्यों की तुलना एआई द्वारा किए गए काम से की जाती है। ओपनएआई ने इस बेंचमार्क में पेशेवरों से एआई-जनित रिपोर्ट की तुलना मानव-जनित रिपोर्ट से करने को कहा। एआई के प्रदर्शन का औसत निकालकर यह पता लगाया गया कि वह कितनी बार इंसानों के बराबर या उनसे बेहतर है।

इस टेस्ट के क्या महत्व हैं?
हालांकि जीपीटी-5 का प्रदर्शन प्रभावशाली है, लेकिन यह टेस्ट केवल कुछ विशेष कार्यों का मूल्यांकन करता है। वास्तविक पेशेवर कार्यों में रिपोर्टिंग के अलावा कई और जटिलताएँ होती हैं। ओपनएआई ने कहा है कि भविष्य में वह अधिक उद्योगों और इंटरैक्टिव वर्कफ्लो को शामिल कर परीक्षण को और विस्तारित करेंगे।

एक्सपर्ट का क्या कहना है ?
ओपनएआई के मुख्य अर्थशास्त्री डॉ. आरोन चटर्जी का कहना है कि एआई मॉडल के इस स्तर पर पहुंचने से पेशेवर अपने समय को अधिक महत्वपूर्ण कार्यों पर केंद्रित कर सकते हैं और कुछ कार्य एआई को सौंप सकते हैं। जीपीटी-4o मॉडल 15 महीने पहले केवल 13.7% मामलों में मानव विशेषज्ञों के बराबर था, जबकि जीपीटी-5 ने यह आंकड़ा लगभग तीन गुना बढ़ा दिया है। यह एआई की तेजी से हो रही प्रगति का संकेत है।

निष्कर्ष
GDPval जैसे बेंचमार्क एआई मॉडल की वास्तविक दुनिया की नौकरियों में दक्षता को मापने का एक महत्वपूर्ण तरीका बन सकते हैं। हालांकि, यह निश्चित रूप से कहने के लिए कि एआई मानवों से बेहतर प्रदर्शन कर सकता है, ओपनएआई को और व्यापक परीक्षण करने की आवश्यकता होगी।

OpenAI का GPT-5 टेस्ट में उतरा खरा, विशेषज्ञों जिती दक्षता साबित की

Comment / Reply From

You May Also Like

Galaxy Unpacked से पहले सैमसंग ने दिखाया नए फोल्डेबल्स का टीज़र

7200mAh बैटरी वाला Vivo Y6a 5G लॉन्च, 6 साल तक बैटरी हेल्थ का दावा

15 हजार से कम में Realme का दमदार 5G फोन, बैटरी देख रह जाएंगे हैरान

30 नवंबर के बाद इन iPhone में बंद हो सकता है WhatsApp, अभी कर लें ये जरूरी अपडेट

20 हजार से कम में OnePlus! नई N सीरीज की एंट्री की चर्चा तेज

11,999 रुपये में आया Infinix का नया स्लिम फोन, 5200mAh बैटरी बनी बड़ी ताकत

Vivo का नया 5G फोन लॉन्च, 6500mAh बैटरी और 90W चार्जिंग ने खींचा ध्यान

Xiaomi 18 Pro Max में कैमरा क्रांति! मिल सकते हैं दो 200MP सेंसर

Newsletter

महत्वपूर्ण खबर

Newsletter

Social Links

OpenAI का GPT-5 टेस्ट में उतरा खरा, विशेषज्ञों जिती दक्षता साबित की

Comment / Reply From

You May Also Like

Stay Connected

Newsletter

महत्वपूर्ण खबर

Newsletter

Social Links