Microsoft का सबसे सक्षम नया PHI 4 AI मॉडल प्रतिद्वंद्वी दूर बड़े सिस्टम का प्रदर्शन प्रतिद्वंद्वी करता है

माइक्रोसॉफ्ट कई नए “ओपन” एआई मॉडल लॉन्च किए बुधवार को, जिसमें सबसे अधिक सक्षम है, कम से कम एक बेंचमार्क पर Openai के O3-Mini के साथ प्रतिस्पर्धी है।

सभी नए पेमिसली लाइसेंस प्राप्त मॉडल-PHI 4 मिनी रीज़निंग, PHI 4 रीजनिंग, और Phi 4 रीजनिंग प्लस-“रीजनिंग” मॉडल हैं, जिसका अर्थ है कि वे जटिल समस्याओं के लिए अधिक समय-तथ्य-जाँच समाधान खर्च करने में सक्षम हैं। वे Microsoft के PHI “स्मॉल मॉडल” परिवार का विस्तार करते हैं, जिसे कंपनी ने एक साल पहले लॉन्च किया था ताकि एआई डेवलपर्स बिल्डिंग ऐप्स को किनारे पर एक फाउंडेशन दिया जा सके।

PHI 4 मिनी तर्क को चीनी AI स्टार्टअप दीपसेक के R1 रीज़निंग मॉडल द्वारा उत्पन्न लगभग 1 मिलियन सिंथेटिक गणित की समस्याओं पर प्रशिक्षित किया गया था। आकार में लगभग 3.8 बिलियन पैरामीटर, PHI 4 मिनी रीज़निंग को शैक्षिक अनुप्रयोगों के लिए डिज़ाइन किया गया है, Microsoft कहते हैं, जैसे हल्के उपकरणों पर “एम्बेडेड ट्यूशन”।

पैरामीटर मोटे तौर पर एक मॉडल की समस्या-समाधान कौशल के अनुरूप हैं, और अधिक मापदंडों वाले मॉडल आमतौर पर कम मापदंडों वाले लोगों की तुलना में बेहतर प्रदर्शन करते हैं।

PHI 4 रीजनिंग, एक 14 बिलियन-पैरामीटर मॉडल, को “उच्च-गुणवत्ता” वेब डेटा के साथ-साथ Openai के पूर्वोक्त O3-Mini से “क्यूरेट किए गए प्रदर्शनों” का उपयोग करके प्रशिक्षित किया गया था। Microsoft के अनुसार, यह गणित, विज्ञान और कोडिंग अनुप्रयोगों के लिए सबसे अच्छा है।

PHI 4 रीजनिंग प्लस के लिए, यह Microsoft का पहले से जारी PHI-4 मॉडल है जो विशेष कार्यों पर बेहतर सटीकता प्राप्त करने के लिए एक तर्क मॉडल में अनुकूलित है। Microsoft का दावा है कि PHI 4 रीज़निंग प्लस R1 के प्रदर्शन स्तरों के पास पहुंचता है, जो काफी अधिक मापदंडों (671 बिलियन) के साथ एक मॉडल है। कंपनी के आंतरिक बेंचमार्किंग में एक गणित कौशल परीक्षण ओमनीमथ पर PHI 4 रीज़निंग प्लस ओ 3-मिनी है।

PHI 4 मिनी रीज़निंग, PHI 4 रीज़निंग, और PHI 4 रीजनिंग प्लस उपलब्ध हैं ऐ देव प्लेटफॉर्म गले लगना चेहरा विस्तृत तकनीकी रिपोर्टों के साथ।

TechCrunch घटना

बर्कले, सीए
|
5 जून

अभी बुक करें

“आसवन, सुदृढीकरण सीखने और उच्च गुणवत्ता वाले डेटा का उपयोग करते हुए, ये (नए) मॉडल संतुलन आकार और प्रदर्शन,” Microsoft में लिखा है ब्लॉग भेजा। “वे कम-विलंबता वातावरण के लिए काफी छोटे हैं, फिर भी मजबूत तर्क क्षमताओं को बनाए रखते हैं जो बहुत बड़े मॉडल को प्रतिद्वंद्वी करते हैं। यह मिश्रण भी संसाधन-सीमित उपकरणों को जटिल तर्क कार्यों को कुशलता से करने की अनुमति देता है।”

Source link