टेंन्सेन्टने मंगळवारी एक नवीन कृत्रिम बुद्धिमत्ता (एआय) मॉडेल रिलीज केले जे अद्याप प्रतिमांचे चित्रण करू शकते. डब ह्युयुआनपोरट्रेट, द लार्ज लँग्वेज मॉडेल (एलएलएम) डिफ्यूजन आर्किटेक्चरवर आधारित आहे आणि संदर्भ प्रतिमेवर आणि मार्गदर्शक व्हिडिओवर आधारित वास्तववादी अॅनिमेशनसह व्हिडिओ व्युत्पन्न करू शकते. या प्रकल्पामागील संशोधकांनी हायलाइट केले की मॉडेल संदर्भ प्रतिमेमध्ये अचूकपणे समक्रमित करण्यासाठी चेहर्याचा डेटा आणि स्थानिक हालचाली दोन्ही दोन्ही कॅप्चर करू शकतो. टेंन्सेन्टने आता हनुआनपोर्रेट एआय मॉडेल ओपन-सोर्स केले आहे आणि ते लोकप्रिय रेपॉजिटरीजमधून डाउनलोड केले जाऊ शकते आणि स्थानिक पातळीवर चालविले जाऊ शकते.
टेंन्सेन्टचे ह्युयुआनपोरट्रेट अजूनही पोर्ट्रेट जीवनात आणू शकते
मध्ये मध्ये पोस्ट एक्स वर (पूर्वी ट्विटर म्हणून ओळखले जाते), टेंन्सेन्ट हनीयुआनच्या अधिकृत हँडलने घोषित केले की हूनयुआनपोरट्रेट मॉडेल आता खुल्या समुदायासाठी उपलब्ध आहे. एआय मॉडेल टेंन्सेन्टच्या डाउनलोड केले जाऊ शकते गीथब आणि मिठी मारणारा चेहरा सूची. याव्यतिरिक्त, प्री-प्रिंट कागद मॉडेलचे तपशील देखील आर्क्सिव्हवर होस्ट केले जात आहे. उल्लेखनीय म्हणजे, एआय मॉडेल शैक्षणिक आणि संशोधन-आधारित वापर प्रकरणांसाठी उपलब्ध आहे, परंतु व्यावसायिक वापरासाठी नाही.
ह्युयुआनपोरट्रेट संदर्भ प्रतिमा आणि ड्रायव्हिंग व्हिडिओ वापरुन लाइफलीक अॅनिमेटेड व्हिडिओ व्युत्पन्न करू शकते. हे चेहर्याचा डेटा कॅप्चर करते आणि व्हिडिओमधून पोझेस करते आणि त्यांना स्थिर पोर्ट्रेट प्रतिमेवर इंटरपोलेट करते. कंपनीचा असा दावा आहे की चळवळीचे संकालन अचूक आहे आणि अगदी सूक्ष्म चेहर्यावरील अभिव्यक्ती बदलांची प्रतिकृती देखील आहे.
हूनियुआनपोर्रेट आर्किटेक्चर
फोटो क्रेडिट: टेंन्सेन्ट
त्याच्या मॉडेलवर पृष्ठटेंन्सेन्ट संशोधकांनी हनीयुआनपोरट्रेटच्या आर्किटेक्चरचे तपशीलवार वर्णन केले. हे कंडिशन कंट्रोल एन्कोडरसह स्थिर डिफ्यूजन मॉडेलच्या आर्किटेक्चरवर तयार केले गेले आहे. हे प्री-प्रशिक्षित एन्कोडर व्हिडिओंमध्ये मोशन माहिती आणि ओळख डीकूपल करतात. डेटा कंट्रोल सिग्नल म्हणून कॅप्चर केला जातो, जो नंतर स्टील पोर्ट्रेटमध्ये इंजेक्शनने डेनोइझिंग युनिटद्वारे इंजेक्शन दिला जातो. कंपनीचा असा दावा आहे की यामुळे स्थानिक अचूकता तसेच आउटपुटमध्ये ऐहिक सुसंगतता दोन्ही मिळते.
टेंन्सेन्टचा असा दावा आहे की एआय मॉडेल ऐहिक सुसंगतता आणि नियंत्रिततेच्या पॅरामीटर्सवर विद्यमान ओपन-सोर्स पर्यायांना मागे टाकते, परंतु हे मेट्रिक्स स्वतंत्रपणे सत्यापित केले गेले नाहीत.
अशी मॉडेल्स फिल्ममेकिंग आणि अॅनिमेशन उद्योगांमध्ये उपयुक्त ठरू शकतात. पारंपारिकपणे, अॅनिमेटर व्यक्तिचलितपणे कीफ्रेम चेहर्यावरील अभिव्यक्ती किंवा पात्रांना वास्तविकपणे सजीव करण्यासाठी महागड्या मोशन कॅप्चर सिस्टमचा वापर करतात. हनीयुआनपोरट्रेट सारख्या मॉडेल्सना त्यांना फक्त वर्ण डिझाइन आणि लक्ष्य हालचाली आणि चेहर्यावरील अभिव्यक्ती फीड करण्यास अनुमती देईल आणि ते आउटपुट व्युत्पन्न करण्यास सक्षम असेल. अशा एलएलएममध्ये लहान स्टुडिओ आणि स्वतंत्र निर्मात्यांसाठी उच्च-गुणवत्तेचे अॅनिमेशन प्रवेशयोग्य बनविण्याची क्षमता देखील आहे.
नवीनतम तंत्रज्ञानाच्या बातम्या आणि पुनरावलोकनांसाठी, गॅझेट्स 360 वर अनुसरण करा एक्स, फेसबुक, व्हाट्सएप, धागे आणि गूगल न्यूज? गॅझेट्स आणि टेकवरील नवीनतम व्हिडिओंसाठी, आमच्या सदस्यता घ्या YouTube चॅनेल? आपण शीर्ष प्रभावकांबद्दल सर्व काही जाणून घेऊ इच्छित असल्यास, आमच्या घरातील अनुसरण करा कोण आहे That360 चालू इन्स्टाग्राम आणि YouTube?
मेडियाटेक डायमेंसिटी 9400 ई एसओसीसह रिअलमे निओ 7 टर्बो, 7,200 एमएएच बॅटरी सुरू केली: किंमत, वैशिष्ट्ये























