[ad_1]

मायक्रोसॉफ्टची नवीनतम एआय चॅटबॉट आवृत्ती मूलभूत मजकूर प्रॉम्प्टमधून व्हिडिओ तयार करू शकते.
OpenAI च्या GPT मालिका आणि Google च्या LaMDA सारख्या प्रगत भाषा मॉडेल्सनी मानव आणि AI यांना नवीन आणि रोमांचक मार्गांनी एकत्र काम करणे शक्य केले आहे. उदाहरणार्थ, हे मॉडेल मानवाने लिहिलेला दिसत असलेला मजकूर तयार करू शकतात. हे भाषांचे भाषांतर करणे आणि प्रश्नांची उत्तरे देणे यासारख्या कार्यांमध्ये मदत करू शकते. परंतु तरीही ते लोकांना विज्ञान आणि तेथील अज्ञात गोष्टींबद्दल अधिक जाणून घेण्यासाठी किती मदत करू शकतात हे आम्हाला शोधण्याची गरज आहे.
आपल्या सर्वांना माहित आहे की ChatGPT वापरल्यानंतर आणि त्याच्या क्षमतेने आश्चर्यचकित झाल्यानंतर GPT-3x हे एक मोठे पाऊल होते. GPT-2 च्या तुलनेत, हे मॉडेल अधिक प्रगत होते आणि चांगले प्रवाहित होणारे परिच्छेद तयार करू शकतात. तथापि, ChatGPT लाँच झाल्यापासून, “पुढील मोठी गोष्ट” बद्दलची चर्चा काही काळासाठी कमी झाली होती कारण नेटिझन्सना छेडछाड आणि त्याची क्षमता तपासण्याचे वेड लागले होते. आता GPT-4 येत आहे हे आम्हाला माहीत आहे, ChatGPT ने लोकांना AI च्या “प्राथमिक” क्षमतांचा कसा आस्वाद दिला आहे हे पाहता, काहीतरी मोठी अपेक्षा करणे हा एक तर्कशुद्ध विचार आहे.
मायक्रोसॉफ्ट पुन्हा वाह
अँड्रियास ब्रॉन, मायक्रोसॉफ्ट जर्मनीच्या सीटीओने 9 मार्च रोजी सांगितले की GPT-4 एका आठवड्यात रिलीज होईल आणि ते मल्टीमोडल असेल. GPT-4 बद्दलच्या बातम्यांमधला बहुविधता ही खरोखरच सर्वात रोमांचक बाब आहे.
“मोडॅलिटी” मोठ्या भाषेच्या मॉडेलद्वारे प्रक्रिया केलेल्या इनपुटचा संदर्भ देते. मजकूर, भाषण, चित्रे आणि व्हिडिओ हे सर्व मल्टीमोडलचा भाग असू शकतात. म्हणून, उदाहरणार्थ, GPT-4 साध्या टेक्स्ट प्रॉम्प्टवरून AI वापरून व्हिडिओ बनवू शकते. हे वैशिष्ट्य मोठ्या भाषेतील मॉडेलना अधिक प्रकारची सामग्री बनविण्यास अनुमती देईल आणि विविध सामग्री निर्माण करणार्या उद्योगांमध्ये व्हिडिओ कसा बनवला जातो ते देखील बदलू शकेल.
GPT-3 आणि GPT-3.5 फक्त मजकूरासाठी वापरले जाऊ शकते. तथापि, एका जर्मन बातम्यांनुसार, GPT-4 किमान चार प्रकारे कार्य करते: प्रतिमा, ध्वनी, मजकूर आणि व्हिडिओसह. शिवाय, ChatGPT, एक लोकप्रिय संभाषणात्मक AI साधन, GPT-3.5 द्वारे चालवले जाते परंतु केवळ मजकुराच्या मर्यादेत प्रतिसाद देऊ शकते. परंतु GPT-4 चे मल्टीमोडल मॉडेल हे बदलू शकतात आणि अधिक स्मार्ट आणि अधिक वैविध्यपूर्ण सामग्री शक्य करतात.
GPT-4 साठी केसेस वापरा
क्लेमेन्स सिबलर (वरिष्ठ एआय स्पेशलिस्ट, मायक्रोसॉफ्ट जर्मनी) आणि होल्गर केन (चीफ टेक्नॉलॉजिस्ट, बिझनेस डेव्हलपमेंट, एआय आणि इमर्जिंग टेक्नॉलॉजीज, मायक्रोसॉफ्ट जर्मनी) यांनी त्यांच्या टीम्स सक्रियपणे विकसित करत असलेल्या व्यावहारिक एआय वापर आणि वापर प्रकरणांवर अंतर्दृष्टी शेअर केली.
सिबलरने सध्या काय साध्य करता येईल यावर प्रकाश टाकला: उदाहरणार्थ, दूरध्वनी कॉल रेकॉर्ड केले जाऊ शकतात आणि कॉल-सेंटर एजंट्सना यापुढे सारांश आणि मॅन्युअली टाइप करण्याची आवश्यकता नाही. सिबलरचा अंदाज आहे की यामुळे मायक्रोसॉफ्टच्या मोठ्या ग्राहकाची बचत होऊ शकते ज्यांना दररोज 30,000 कॉल्स येतात, सुमारे 500 मनुष्य तास.
GPT-4 एकाधिक भाषांशी सुसंगत असू शकते: उदाहरणार्थ, इंग्रजी प्रश्न प्राप्त करण्याची आणि फ्रेंचमध्ये उत्तर देण्याची क्षमता. शिवाय, संशोधकांना असे वाटते की सर्व भाषांमधून ज्ञान काढण्याच्या मॉडेलच्या क्षमतेमध्ये या प्रगतीचे महत्त्व आहे.
भविष्यात, GPT-4 किंवा भविष्यातील पुनरावृत्ती एक मजकूर पटकथा देखील तयार करू शकतात आणि त्या ओळींवर अभिनय करणारे आवाज आणि व्हिडिओ बाहेर टाकू शकतात. पण आत्ता, बेअर हाडांच्या कार्यक्षमतेची अपेक्षा करा.
नवीन वैशिष्ट्ये जोडली जात असताना, ऑपरेशनल विश्वासार्हता आणि वास्तविक निष्ठा यांचे जुने मुद्दे प्रगतीपथावर आहेत. मायक्रोसॉफ्टच्या सिबलरने वापरकर्त्यांनी डेटा प्रमाणित करण्याचा आग्रह धरला कारण एआयच्या अचूकतेची हमी दिली जाऊ शकत नाही. फीडबॅक लूपद्वारे AI ला योग्य प्रतिसाद देण्यासाठी प्रशिक्षण देण्याचे कार्य, स्पष्टपणे, जगभरातील सर्व शीर्ष AI कंपन्यांसाठी उच्च प्राधान्य आहे.
स्पर्धा
या महिन्याच्या सुरुवातीला मायक्रोसॉफ्टने कॉसमॉस-1 नावाचे मल्टीमॉडल लँग्वेज मॉडेल विकसित केले आहे. कॉसमॉस-1 हे ए मल्टीमोडल प्रणाली जी मजकूर आणि चित्रे दोन्ही वापरते. पण GPT-4 Kosmos-1 पेक्षा पुढे जातो कारण त्यात व्हिडिओ आणि ध्वनी मोड आहेत.
कॉसमॉस-1 कार्यक्षमतेमध्ये समान असू शकते Google चे MUM, आणखी एक मल्टीमोडल AI. उदाहरणार्थ, AI उत्साही असे दर्शवितात की मम इंग्रजीमध्ये प्रश्नांची उत्तरे देऊ शकतात ज्यांची उत्तरे जपानी भाषेप्रमाणेच एका भाषेत दिली जाऊ शकतात.
गुगल पकडण्याचा प्रयत्न करत आहे मायक्रोसॉफ्ट सोबत. Google साठी दुर्दैवाने, यामुळे ग्राहकांना अधिक चांगले AI प्रदान करण्यासाठी अजून बराच पल्ला गाठायचा आहे ही धारणा आणखी दृढ होते.
Google आधीच Google लेन्स, Google नकाशे इत्यादी उत्पादनांमध्ये AI वापरत आहे. छोट्या छोट्या कामांमध्ये AI लागू करणे ही या तुकड्यामागची कल्पना होती परंतु मायक्रोसॉफ्टने AI ला त्याच्या समोर आणि मध्यभागी ठेवण्याचा दृष्टीकोन दिल्याने हे कदाचित चांगले व्यवसाय धोरण ठरले नसेल. शोध इंजिन, बिंग.
गुगलला आणखी चकित केले आहे, कदाचित, मायक्रोसॉफ्टला त्याच्या बिग बँग एआय लाँचनंतर महत्त्व प्राप्त झाले आहे. मायक्रोसॉफ्ट निश्चितच लक्ष वेधून घेत आहे आणि गुगल मागे पडत आहे आणि पकडण्याचा खूप प्रयत्न करत आहे. पण शेवटचा शब्द बोलला नाही. शेवटचे हसणार कोण?
निवास जीवनानंदम भारत आणि जगभरातील एआय लँडस्केपबद्दल कथा लिहितात, व्यक्ती आणि समाजावर दीर्घकालीन प्रभावावर लक्ष केंद्रित करतात. दृश्ये वैयक्तिक आहेत आणि या प्रकाशनाच्या भूमिकेचे प्रतिनिधित्व करत नाहीत.