बाईडू यांनी बुधवारी नवीन कृत्रिम बुद्धिमत्ता (एआय) व्हिडिओ निर्मितीचे मॉडेल प्रसिद्ध केले. अहवालानुसार, म्यूसेस्ट्रॅमर एआय मॉडेल व्युत्पन्न केलेल्या व्हिडिओंमध्ये चीनी ऑडिओ देखील समाकलित करू शकते, जे Google च्या व्हीओ 3 नंतर असे दुसरे मॉडेल बनवते. टेक जायंटचा असा दावा आहे की मूळ चीनी ऑडिओ जनरेशन समर्थनासह जगातील प्रथम एआय मॉडेल आहे. लार्ज लँग्वेज मॉडेल (एलएलएम) च्या परिचयासह, कंपनीने ह्यक्सियांग डब केलेले एक नवीन व्हिडिओ सामग्री क्रिएशन प्लॅटफॉर्म देखील लाँच केले. उल्लेखनीय म्हणजे, मुसरेस्ट्रीमर किंवा ह्यक्सियांग दोघेही सध्या चीनच्या बाहेर उपलब्ध नाहीत.
बाईडूचा म्यूसेस्ट्रीमर चिनी ऑडिओ व्युत्पन्न करू शकतो
गेल्या दोन वर्षांत एआय व्हिडिओ जनरेशन मॉडेलचे जग लक्षणीय विकसित झाले आहे. आम्ही अशा मॉडेल्समधून गेलो आहोत ज्याने एलएलएमकडे निश्चित संख्या बोटांनी तयार करण्यासाठी संघर्ष केला आहे जे आता वास्तववादी भौतिकशास्त्र आणि गती अचूकपणे चित्रित करू शकते. तथापि, बहुतेक एआय खेळाडूंनी प्रविष्ट करण्यापासून परावृत्त केले आहे असे व्हिडिओ म्हणजे ऑडिओला मुळात देखील समर्थित होते.
गूगल I/O 2025 मध्ये, टेक जायंट ही व्होओ 3 सह ही क्षमता ऑफर करणारी पहिली कंपनी बनली, जी ताबडतोब शहराची चर्चा झाली आणि आपला सर्वात मोठा प्रतिस्पर्धी, ओपनईचा सोरा मागे ठेवला. माउंटन व्ह्यू-आधारित टेक राक्षसने अलीकडेच सर्व 154 देशांमध्ये व्हीईओ 3 विस्तारित केले जेथे मिथुन अॅप उपलब्ध आहे, या साधनासाठी कंपनीच्या आक्रमक धक्क्यावर प्रकाश टाकला.
तथापि, आशियातील तंत्रज्ञानानुसार अहवाल (मार्गे मार्गे एआय बेस), चायनीज टेक राक्षस बाडू यांनीही आपल्या म्यूझस्ट्रीम एआय मॉडेलसह शर्यतीत प्रवेश केला आहे. असे म्हटले जाते की चीनी ऑडिओसह व्हिडिओ व्युत्पन्न करणे आणि तसे करण्याची क्षमता असलेले एकमेव मॉडेल. उल्लेखनीय म्हणजे, VEO 3 केवळ इंग्रजी भाषेत ऑडिओ व्युत्पन्न करू शकते.
म्यूसेस्ट्रीमर केवळ व्हिडिओंसह संकालित केलेले संवाद व्युत्पन्न करू शकत नाही तर व्हिडिओमध्ये ध्वनी प्रभाव आणि सभोवतालच्या आवाज देखील जोडू शकते. बाईडू यांनी असा दावा केला आहे की मॉडेलने व्हीबेंच आय 2 व्ही बेंचमार्कवर 89.38 टक्के गुण मिळविला आहे. टेक राक्षस ग्राहकांसाठी सामग्री निर्मिती साधन म्हणून एलएलएमला पिच करीत आहे.
एआय मॉडेलच्या बरोबरच, बाईडू यांनी ह्यक्सियांग डब केलेले एक नवीन व्हिडिओ सामग्री प्लॅटफॉर्म देखील लाँच केले आहे. ह्यूक्सियांग एआय मॉडेलसाठी फ्रंट-एंड म्हणून काम करेल असे म्हणतात, जेथे वापरकर्ते प्रॉम्प्ट सामायिक करू शकतात आणि व्हिडिओ व्युत्पन्न करू शकतात. प्लॅटफॉर्म सध्या 1080 पी रेझोल्यूशनवर 10-सेकंद-लांबीच्या व्हिडिओ पिढ्यांना समर्थन देतो, असे अहवालात नमूद केले आहे. त्या तुलनेत, व्हीईओ 3 केवळ आठ-सेकंद-लांबीचे व्हिडिओ व्युत्पन्न करू शकतात. व्हिडिओच्या डीफॉल्ट आस्पेक्ट रेशोवर कोणतेही स्पष्टता नाही आणि जर वापरकर्ते वेगवेगळ्या पैलू गुणोत्तरात व्हिडिओ व्युत्पन्न करू शकतात.























