प्रतिक्रियाओं का उपयोग करने वाले डेवलपर्स एपीआई उसी मॉडल का उपयोग कर सकते हैं जो पावर चैट की खोज करते हैं: GPT-4O खोज और GPT-4O मिनी खोज। ये मॉडल कर सकते हैं वेब ब्राउज़ करो सवालों के जवाब देने के लिए और उनकी प्रतिक्रियाओं में स्रोतों का हवाला देते हैं।
यह उल्लेखनीय है क्योंकि Openai का कहना है कि अतिरिक्त वेब खोज क्षमता नाटकीय रूप से अपने AI मॉडल की तथ्यात्मक सटीकता में सुधार करती है। ओपनई पर SIMPLQA बेंचमार्कजिसका उद्देश्य कन्फैब्यूलेशन दर को मापना है, GPT-4O खोज ने 90 प्रतिशत स्कोर किया, जबकि GPT-4O मिनी सर्च ने 88 प्रतिशत हासिल किया-दोनों ने खोज के बिना बड़े GPT-4.5 मॉडल को काफी हद तक बेहतर बनाया, जिसमें 63 प्रतिशत स्कोर किया गया।
इन सुधारों के बावजूद, प्रौद्योगिकी की अभी भी महत्वपूर्ण सीमाएं हैं। CUA के साथ मुद्दों को ठीक से नेविगेट करने वाली वेबसाइटों के साथ, बेहतर खोज क्षमता AI कंफब्यूलेशन की समस्या को पूरी तरह से हल नहीं करती है, GPT-4O खोज के साथ अभी भी तथ्यात्मक गलतियों को 10 प्रतिशत समय में 10 प्रतिशत कर रहा है।
एपीआई की प्रतिक्रियाओं के साथ, ओपनई ने ओपन सोर्स जारी किया एजेंट एसडीकेआंतरिक प्रणालियों के साथ मॉडल को एकीकृत करने, सुरक्षा उपायों को लागू करने और एजेंट गतिविधियों की निगरानी करने के लिए मुफ्त उपकरण के साथ डेवलपर्स प्रदान करना। यह टूलकिट ओपनई के पहले रिलीज की रिलीज़ का अनुसरण करता है झुंडकई एजेंटों को ऑर्केस्ट्रेट करने के लिए एक रूपरेखा।
ये अभी भी एआई एजेंट फील्ड में शुरुआती दिन हैं, और चीजों में तेजी से सुधार होगा। हालांकि, फिलहाल, एआई एजेंट आंदोलन अवास्तविक दावों के लिए असुरक्षित है, जैसा कि इस सप्ताह के शुरू में प्रदर्शित किया गया था उपयोगकर्ताओं ने खोजा वह चीनी स्टार्टअप तितली प्रभाव है मानुस एआई एजेंट प्लेटफ़ॉर्म अपने कई वादों को पूरा करने में विफल रहा, इस उभरती हुई प्रौद्योगिकी श्रेणी में प्रचार दावों और व्यावहारिक कार्यक्षमता के बीच लगातार अंतर को उजागर किया।
Leave a Reply