Google ने साइनजेम्मा, एक नवीन कृत्रिम बुद्धिमत्ता (एआय) मॉडेल जाहीर केले आहे जे सांकेतिक भाषेचे स्पोकन मजकूरामध्ये भाषांतर करू शकते. मॉडेलच्या जेम्मा मालिकेचा भाग असणारे हे मॉडेल सध्या माउंटन व्ह्यू-आधारित टेक जायंटद्वारे चाचणी घेत आहे आणि या वर्षाच्या शेवटी सुरू होईल अशी अपेक्षा आहे. इतर सर्व जेम्मा मॉडेल्स प्रमाणेच, साइनजेम्मा एक मुक्त-स्त्रोत एआय मॉडेल देखील असेल, जे व्यक्ती आणि व्यवसायांसाठी उपलब्ध आहे. हे प्रथम Google I/O 2025 मुख्य मुख्य दरम्यान प्रदर्शित केले गेले होते आणि हे भाषण आणि श्रवण अपंग लोकांना मदत करण्यासाठी डिझाइन केले गेले आहे ज्यांना सांकेतिक भाषा समजत नाही अशा लोकांशीही प्रभावीपणे संवाद साधता येईल.
साइनजेम्मा हाताच्या हालचाली आणि चेहर्यावरील अभिव्यक्तींचा मागोवा घेऊ शकते
मध्ये मध्ये पोस्ट एक्स वर (पूर्वी ट्विटर म्हणून ओळखले जाते), Google दीपमाइंडच्या अधिकृत हँडलने एआय मॉडेलचा डेमो आणि त्याच्या रिलीझच्या तारखेबद्दल काही तपशील सामायिक केले. तथापि, आम्ही साइनजेम्मा पाहिण्याची ही पहिली वेळ नाही. हे दीपमिंड येथील जेम्मा प्रॉडक्ट मॅनेजर गुस मार्टिन यांनी Google I/O कार्यक्रमात थोडक्यात प्रदर्शित केले.
साइनजम्मा, स्पोकन टेक्स्टमध्ये सांकेतिक भाषेचे भाषांतर करण्यासाठी आमचे सर्वात सक्षम मॉडेल साइनजेम्मा घोषित करण्यास आम्हाला आनंद झाला आहे. 🧏
हे ओपन मॉडेल या वर्षाच्या शेवटी जेम्मा मॉडेल कुटुंबात येत आहे, सर्वसमावेशक तंत्रज्ञानासाठी नवीन शक्यता उघडत आहे.
आपला अभिप्राय आणि रुची लवकर सामायिक करा… pic.twitter.com/nhl9g5y8ta
– Google depimind (@googledepmind) 27 मे, 2025
शोकेस दरम्यान, मार्टिन्सने हायलाइट केला की एआय मॉडेल रिअल-टाइममध्ये साइन भाषेतून मजकूर भाषांतर प्रदान करण्यास सक्षम आहे, समोरासमोर संप्रेषण अखंड बनते. मॉडेलला साइन भाषांच्या वेगवेगळ्या शैलींच्या डेटासेटवर देखील प्रशिक्षण दिले गेले होते, तथापि, इंग्रजी भाषेत भाषांतरित करताना ते अमेरिकन सांकेतिक भाषा (एएसएल) सह सर्वोत्कृष्ट कामगिरी करते.
त्यानुसार बहुभाषिक ते, हे ओपन-सोर्स मॉडेल असल्याने, साइनजेम्मा इंटरनेटशी कनेक्ट करण्याची आवश्यकता न घेता कार्य करू शकते. हे मर्यादित कनेक्टिव्हिटी असलेल्या क्षेत्रांमध्ये वापरणे योग्य करते. हे मिथुन नॅनो फ्रेमवर्कवर तयार केले जाते असे म्हणतात आणि हाताच्या हालचाली, आकार आणि चेहर्यावरील अभिव्यक्तींचा मागोवा घेण्यासाठी आणि त्यांचे विश्लेषण करण्यासाठी व्हिजन ट्रान्सफॉर्मरचा वापर केला जातो. विकसकांना ते उपलब्ध करण्यापलीकडे, Google मॉडेलला त्याच्या विद्यमान एआय साधनांमध्ये, जसे की मिथुन लाइव्ह सारख्या समाकलित करू शकते.
याला “सांकेतिक भाषेचे भाषांतर करण्यासाठी आमचे सर्वात सक्षम मॉडेल” असे म्हणणे, दीपमिंडने हायलाइट केले की या वर्षाच्या शेवटी ते प्रसिद्ध होईल. प्रवेशयोग्यता-केंद्रित मोठ्या भाषेचे मॉडेल सध्या त्याच्या सुरुवातीच्या चाचणी टप्प्यात आहे आणि टेक राक्षसने एक प्रकाशित केले आहे व्याज फॉर्म व्यक्तींना हे करून पहाण्यासाठी आणि अभिप्राय प्रदान करण्यासाठी आमंत्रित करणे.























