अब इंजीनियरों ने बधिरों की फायदे के लिए तकनीक बनायी
-
रियल टाइम में संकेतों की व्याख्या करता है
-
इस विधि ने 98.2 फीसद सटीकता हासिल की
-
पहले की समस्याओँ को दूर करती है यह विधि
राष्ट्रीय खबर
रांचीः हम जानते हैं कि बधिरों से संवाद के लिए हम हस्त संकेतों का उपयोग करते हैं। इसमें हर शब्द और वर्ण के लिए अलग अलग संकेत होते हैं, जिनकी मदद से उनसे बात चीत की जाती है। अब इसी तकनीक को ए आई से जोड़ा गया है जो तात्कालिनक तौर पर इन संकेतों को जीवंत बना देते हैं।
पारंपरिक समाधान, जैसे सांकेतिक भाषा दुभाषिए, अक्सर दुर्लभ, महंगे और मानव उपलब्धता पर निर्भर होते हैं। तेजी से डिजिटल होती दुनिया में, स्मार्ट, सहायक तकनीकों की मांग बढ़ रही है जो वास्तविक समय, सटीक और सुलभ संचार समाधान प्रदान करती हैं, जिसका उद्देश्य इस महत्वपूर्ण अंतर को पाटना है।
देखें इससे संबंधित वीडियो
अमेरिकी सांकेतिक भाषा सबसे व्यापक रूप से इस्तेमाल की जाने वाली सांकेतिक भाषाओं में से एक है, जिसमें अक्षरों, शब्दों और वाक्यांशों का प्रतिनिधित्व करने वाले अलग-अलग हाथ के इशारे शामिल हैं।
मौजूदा एएसएल पहचान प्रणालियाँ अक्सर विविध वातावरणों में वास्तविक समय के प्रदर्शन, सटीकता और मजबूती के साथ संघर्ष करती हैं। लेकिन इसमें भी एक बड़ी चुनौती कई अक्षरों के लिए दिखने में समान इशारों को अलग करना है, जो अक्सर गलत वर्गीकरण की ओर ले जाता है।
इसके अतिरिक्त, डेटासेट की गुणवत्ता महत्वपूर्ण बाधाएँ प्रस्तुत करती है, जिसमें खराब छवि रिज़ॉल्यूशन, गति धुंधलापन, असंगत प्रकाश व्यवस्था और हाथ के आकार, त्वचा के रंग और पृष्ठभूमि में भिन्नताएँ शामिल हैं। ये कारक पूर्वाग्रह का परिचय देते हैं और विभिन्न उपयोगकर्ताओं और वातावरणों में मॉडल की सामान्यीकरण की क्षमता को कम करते हैं।
इन चुनौतियों से निपटने के लिए, फ्लोरिडा अटलांटिक विश्वविद्यालय में कॉलेज ऑफ इंजीनियरिंग और कंप्यूटर साइंस के शोधकर्ताओं ने एक अभिनव वास्तविक समय ए एसएळ व्याख्या प्रणाली विकसित की है।
योलोव 11 की ऑब्जेक्ट डिटेक्शन पावर को मीडियापेज की सटीक हैंड ट्रैकिंग के साथ जोड़कर, सिस्टम वास्तविक समय में ए एसएल वर्णमाला अक्षरों को सटीक रूप से पहचान सकता है।
उन्नत डीप लर्निंग और की हैंड पॉइंट ट्रैकिंग का उपयोग करके, यह एएसएल इशारों को टेक्स्ट में अनुवाद करता है, जिससे उपयोगकर्ता नाम, स्थान और बहुत कुछ उल्लेखनीय सटीकता के साथ इंटरेक्टिव रूप से लिख सकते हैं।
इसके मूल में, एक अंतर्निहित वेबकैम एक संपर्क-मुक्त सेंसर के रूप में कार्य करता है, जो लाइव विज़ुअल डेटा कैप्चर करता है जिसे जेस्चर विश्लेषण के लिए डिजिटल फ़्रेम में परिवर्तित किया जाता है।
मीडियापेज एक ढांचाई मानचित्र बनाने के लिए प्रत्येक हाथ पर 21 कीपॉइंट की पहचान करता है, जबकि योलोव 11 इन बिंदुओं का उपयोग उच्च परिशुद्धता के साथ एएसएल अक्षरों का पता लगाने और उन्हें वर्गीकृत करने के लिए करता है।
इस सिस्टम को खास तौर पर उल्लेखनीय बनाने वाली बात यह है कि संपूर्ण पहचान पाइपलाइन — हाव-भाव को कैप्चर करने से लेकर उसे वर्गीकृत करने तक — बदलती प्रकाश स्थितियों या पृष्ठभूमि की परवाह किए बिना, वास्तविक समय में निर्बाध रूप से संचालित होती है, एफएयू के इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान विभाग में प्रथम लेखक और पीएचडी उम्मीदवार बेडर अलशरीफ ने कहा।
और यह सब मानक, ऑफ-द-शेल्फ हार्डवेयर का उपयोग करके प्राप्त किया जाता है। यह अत्यधिक सुलभ और स्केलेबल सहायक तकनीक के रूप में सिस्टम की व्यावहारिक क्षमता को रेखांकित करता है, जो इसे वास्तविक दुनिया के अनुप्रयोगों के लिए एक व्यवहार्य समाधान बनाता है।
जर्नल सेंसर्स में प्रकाशित अध्ययन के परिणाम सिस्टम की प्रभावशीलता की पुष्टि करते हैं, जिसने न्यूनतम विलंबता के साथ 98.2 फीसद सटीकता हासिल की। यह खोज वास्तविक समय में उच्च परिशुद्धता प्रदान करने की सिस्टम की क्षमता को उजागर करती है, जो इसे ऐसे अनुप्रयोगों के लिए एक आदर्श समाधान बनाती है, जिन्हें तेज़ और विश्वसनीय प्रदर्शन की आवश्यकता होती है, जैसे कि लाइव वीडियो प्रोसेसिंग और इंटरैक्टिव तकनीकें।