ओपनएआई ने अपने नए मॉडल जीपीटी-4ओ के बारे में क्या कहा

Photo of author

By siva.k9211

ओपनएआई ने अपने नवीनतम मल्टीमॉडल एआई मॉडल जीपीटी-4ओ के लॉन्च की घोषणा की है, जिसे अपने उपयोगकर्ताओं को मुफ्त में उपलब्ध कराया जाएगा। पाठ, ऑडियो और छवि के किसी भी संयोजन के इनपुट को स्वीकार करने और पाठ, ऑडियो और छवि आउटपुट के किसी भी संयोजन को उत्पन्न करने की क्षमता के कारण मॉडल अद्वितीय है। ओपनएआई का दावा है कि उसके पास जीपीटी-4 स्तर की बुद्धिमत्ता है लेकिन “बहुत तेज है और पाठ, आवाज और दृष्टि में अपनी क्षमताओं में सुधार करता है”। इसके अलावा, ओपनएआई का यह भी दावा है कि इसका ऑडियो प्रतिक्रिया समय मानव प्रतिक्रिया समय के समान है।

जीपीटी-4ओ एपीआई में डेवलपर्स के लिए भी उपलब्ध होगा और कथित तौर पर जीपीटी-4 टर्बो की तुलना में दोगुना तेज और आधा मूल्य है। जबकि जीपीटी-4ओ की क्षमताएं मुफ्त में उपलब्ध हैं, यह भुगतान किए गए उपयोगकर्ताओं के लिए क्षमता सीमा का पांच गुना होने से अलग है।

टेक्स्ट और इमेज क्षमताओं को आज चैटजीपीटी-4ओ में रोल आउट करना शुरू कर दिया गया है, जबकि बाकी क्षमताओं को बार-बार रोल आउट किया जाएगा। ओपनएआई आने वाले हफ्तों में “एपीआई में विश्वसनीय भागीदारों के एक छोटे समूह” के लिए जीपीटी-4ओ की नई ऑडियो और वीडियो क्षमताओं को लॉन्च करने की योजना बना रहा है।

ओपनएआई ने अपने नए मॉडल जीपीटी-4ओ के बारे में क्या कहा

ओपनएआई ने अपने नए मॉडल जीपीटी-4ओ के बारे में क्या कहा

जीपीटी-4ओ क्या कर सकता है?
[हम इसे अपडेट करेंगे क्योंकि अधिक क्षमताओं का खुलासा किया गया है]

पाठ क्षमताएँ
भाषाओं में सुधार

ओपनएआई के अनुसार, 4ओ “गैर-अंग्रेजी भाषाओं में पाठ पर महत्वपूर्ण सुधार के साथ अंग्रेजी और कोड में पाठ पर जीपीटी-4 टर्बो प्रदर्शन से मेल खाता है।” चैटजीपीटी 50 से अधिक भाषाओं का समर्थन करता है। भारतीय भाषाओं, गुजराती, तेलुगु, तमिल, मराठी और उर्दू के लिए दक्षता में उल्लेखनीय सुधार हुआ है।

मॉडल पाठ इनपुट के आधार पर एक दृश्य कथा को दर्शाने वाली कई छवियां बनाने और कैरिकेचर बनाने में सक्षम है। इसके अलावा, यह पाठ्य इनपुट को वांछित टाइपोग्राफी में बदल सकता है।

ऑडियो क्षमताएँ

जीपीटी-4ओ कथित तौर पर ऑडियो आउटपुट में उल्लेखनीय सुधार करता है। के पिछले पुनरावृत्तियों में वॉयस मोड था, लेकिन यह काफी धीमा था क्योंकि इसमें आउटपुट प्रदान करने के लिए 3 अलग-अलग मॉडल का उपयोग किया गया था। यह स्वर, कई वक्ताओं या पृष्ठभूमि की आवाज़ों को देखने में भी असमर्थ था, और यह हंसी, गायन या भावनाओं को व्यक्त नहीं कर सकता था। “यह अनुभव में बहुत अधिक विलंब भी लाता है, और यह वास्तव में चैटजीपीटी के साथ सहयोग में उस विसर्जन को तोड़ता है। लेकिन अब, जीपीटी-40 के साथ, यह सब मूल रूप से होता है “, ओपनएआई की मुख्य प्रौद्योगिकी अधिकारी मीरा मुराती ने एक लाइव प्रदर्शन के दौरान कहा।

ओपनएआई ने अपने लाइवस्ट्रीम में बताया कि जीपीटी-4ओ में बाधित होने, वास्तविक समय में प्रतिक्रिया देने और भावनाओं को उठाने की क्षमता थी और यह प्रदर्शित किया कि कैसे 4ओ का ऑडियो आउटपुट विभिन्न भावनात्मक शैलियों में आवाज उत्पन्न करने में सक्षम था। ओपनएआई ने 4ओ का एक वीडियो साझा किया है जिसमें वह वास्तविक समय में बातचीत करने में सक्षम है, आदेशों के आधार पर अपनी आवाज बदल रहा है और वास्तविक समय में अनुवाद प्रदान कर रहा है। ओपनएआई ने चैटजीपीटी वॉयस ऐप का भी प्रदर्शन किया जो कोडिंग में सहायता करते हुए डेस्कटॉप ऐप पर सहायक के रूप में कार्य करता है। अपने ब्लॉगपोस्ट में, इसने उपयोग के मामलों के उदाहरण के रूप में व्याख्यानों और बैठकों का सारांश भी साझा किया।

ओपनएआई ने अपने नए मॉडल जीपीटी-4ओ के बारे में क्या कहा

दृश्य क्षमताएँ
मॉडल में कथित तौर पर दृश्य क्षमताओं में भी सुधार हुआ है, जिससे उपयोगकर्ता वीडियो पर बातचीत कर सकते हैं। लाइव प्रदर्शन के दौरान ओपनएआई ने समीकरणों को हल करते समय उपयोगकर्ताओं का मार्गदर्शन करने के लिए मॉडल की क्षमताओं को प्रदर्शित किया। इसने यह भी दावा किया कि 4o में वस्तुओं की पहचान करने और जानकारी प्रदान करने या उनके साथ बातचीत करने की क्षमता है, जैसा कि GPT-40 के इस वीडियो में वस्तुओं की पहचान करने और वास्तविक समय में स्पेनिश अनुवाद प्रदान करने में प्रदर्शित किया गया है। ओपनएआई ने यह भी प्रदर्शित किया कि डेस्कटॉप ऐप पर 4ओ डेस्कटॉप ऐप पर डेटा का विश्लेषण करने में सक्षम था।

जीपीटी-4ओ कितना सुरक्षित है?
मुराती ने कहा, “जब सुरक्षा की बात आती है तो जीपीटी-40 हमारे लिए नई चुनौतियां पेश करता है, क्योंकि हम वास्तविक समय ऑडियो, वास्तविक समय दृष्टि के साथ काम कर रहे हैं।” ओपनएआई ने दावा किया कि उसके तैयारी ढांचे के आधार पर उसके मूल्यांकन के अनुसार जीपीटी-4ओ साइबर सुरक्षा, रासायनिक, जैविक, रेडियोलॉजिकल और परमाणु (सीबीआरएन) जानकारी, अनुनय और मॉडल स्वायत्तता के लिए मध्यम जोखिम से ऊपर स्कोर नहीं करता है। उन्होंने स्वीकार किया कि जी. पी. टी.-4ओ की ऑडियो क्षमताएँ अद्वितीय जोखिम प्रस्तुत करती हैं। इस प्रकार, ऑडियो आउटपुट लॉन्च के समय पूर्व निर्धारित आवाजों के चयन तक सीमित होंगे।

ओपनएआई ने पिछले महीने में कई सुविधाएँ पेश की हैं, जिनमें चैटजीपीटी प्लस उपयोगकर्ताओं के लिए एक ‘मेमोरी’ सुविधा शामिल है, जो एआई मॉडल को उपयोगकर्ताओं द्वारा प्रदान की गई जानकारी को याद रखने की अनुमति देता है। यह सुविधा वैयक्तिकरण सेटिंग्स में चालू या बंद की जा सकती है और रिकॉर्ड की गई यादों को उसी वैयक्तिकरण सेटिंग्स टैब से हटाकर ‘भुला’ दिया जा सकता है।

फरवरी में, कंपनी ने घोषणा की कि वे DALL · E3 का उपयोग करके वेब और अन्य ओपनएआई एपीआई सेवाओं पर चैटजीपीटी उत्पन्न सभी छवियों के लिए कोएलिशन फॉर कंटेंट प्रोवेनेंस एंड ऑथेंटिसिटी (सी2पीए) मेटाडेटा सहित उनके द्वारा उत्पन्न सभी सिंथेटिक छवियों को वाटरमार्क करेंगे। यह उपयोगकर्ताओं को यह जांचने की अनुमति देगा कि क्या छवि ओपनएआई टूल का उपयोग करके कंटेंट क्रेडेंशियल्स वेरिफाई जैसी वेबसाइटों के माध्यम से बनाई गई थी।

इससे पहले, जनवरी में, इसने जी. पी. टी. स्टोर भी लॉन्च किया था, जहाँ उपयोगकर्ता विशिष्ट उपयोग मामलों के अनुरूप चैट जी. पी. टी. के कस्टम संस्करणों को साझा कर सकते थे।