अलिबाबाच्या क्वेन टीमने गेल्या आठवड्यात एक नवीन प्रतिमा निर्मिती कृत्रिम बुद्धिमत्ता (एआय) मॉडेल प्रसिद्ध केली. डब केलेले क्वेन व्हीएलओ, हे क्वेन 2.5 व्हिजन भाषेच्या मॉडेलचा उत्तराधिकारी आहे आणि जुन्या मॉडेल्सच्या तुलनेत अनेक अपग्रेडसह येतो. नवीनतम एआय प्रतिमा मॉडेल मजकूर-टू-इमेज आणि इमेज-टू-इमेज जनरेशन दोन्हीचे समर्थन करते. हे इंग्रजी आणि चीनी यासह एकाधिक भाषांमध्ये मजकूर इनपुटला देखील समर्थन देते. प्रतिमा निर्मिती व्यतिरिक्त, एआय मॉडेल व्युत्पन्न केलेल्या प्रतिमांवर तसेच इनपुट प्रतिमांवर इनलाइन संपादने करण्यास सक्षम आहे.
क्वेन व्हीएलओ एकाधिक भाषांमध्ये प्रॉम्प्ट स्वीकारतो
मध्ये मध्ये पोस्ट एक्स वर (पूर्वी ट्विटर म्हणून ओळखले जाते), क्वेन टीमच्या अधिकृत हँडलने नवीन मॉडेलच्या प्रकाशनाची घोषणा केली. मॉडेलचे तांत्रिक नाव क्वेन 3-235 बी-ए 22 बी आहे आणि ते येथे कंपनीच्या चॅट इंटरफेसवर विनामूल्य उपलब्ध आहे. लॉग इन केल्याशिवाय वापरकर्ते मॉडेल देखील वापरू शकतात.
गॅझेट्स Staff 360० स्टाफ सदस्यांनी एआय मॉडेलची चाचणी घेतली आणि त्याची प्रतिमा निर्मितीची क्षमता Google च्या इमेजन २ च्या बरोबरीची असल्याचे आढळले. इंजेन -3 आणि ओपनईच्या जीपीटी -4 ओ-शक्तीच्या प्रतिमा निर्मितीच्या वैशिष्ट्यापेक्षा खालील सूचना आणि प्रतिमा आउटपुट गुणवत्ता थोडी कमी आहे. तथापि, त्याची पिढी वेळ या दोघांपेक्षा वेगवान आहे आणि त्यापेक्षा जास्त दर मर्यादा आहे.
त्याच्या गीथब वर पृष्ठकंपनीने म्हटले आहे की क्वेन व्हीएलओ सुधारित प्रतिमा समजण्यासह येते, जे इनपुट प्रतिमेची स्ट्रक्चरल अखंडता विकृत न करता चांगले इनलाइन संपादने बनविण्यास सक्षम करते. हे आउटपुटची एकूण गुणवत्ता देखील सुधारते. मॉडेल देखील अस्पष्ट आणि ओपन-एन्ड प्रॉम्प्ट्स अधिक चांगल्या प्रकारे समजते आणि वापरकर्त्याच्या अपेक्षांसह संरेखित केलेल्या प्रतिमा व्युत्पन्न करू शकते.
प्रतिमा निर्मिती आणि संपादन व्यतिरिक्त, क्यूएन व्हीएलओ एज डिटेक्शन, सेगमेंटेशन, भविष्यवाणी मॅपिंग आणि बरेच काही यासारख्या प्रतिमा भाष्य-संबंधित कार्ये देखील करू शकते. कंपनीने म्हटले आहे की मॉडेलची भविष्यातील आवृत्ती एकाधिक इनपुट प्रतिमा स्वीकारण्यास आणि वापरकर्त्याच्या विनंत्यांच्या आधारे एकत्रित करण्यास सक्षम असेल.
नवीनतम एआय प्रतिमा जनरेटरसह मजकूर प्रस्तुतीकरण देखील सुधारले गेले आहे. आमच्या मॉडेलच्या चाचणीमध्ये आम्ही वेगवेगळ्या फॉन्टमध्ये अचूक मजकूर व्युत्पन्न करण्यास सक्षम होतो. अखेरीस, क्वेन व्हीएलओ इनपुट म्हणून डायनॅमिक आस्पेक्ट रेशोसह प्रतिमांना देखील समर्थन देते, ज्यात 4: 1 आणि 1: 3 सारख्या अत्यंत गुणोत्तरांचा समावेश आहे. कंपनीने लवकरच वेगवेगळ्या पैलू गुणोत्तरांमध्ये प्रतिमा व्युत्पन्न करण्यासाठी वैशिष्ट्य जोडण्याची योजना आखली आहे.























