कृत्रिम बुद्धिमत्ता का चिकित्सीय प्रयोग की दिशा में पहल
-
प्रारंभिक परीक्षण सफल रहा है
-
इससे बेहतर वैक्सिन बन सकेंगे
-
जीनोम को पढ़ने में ए आई सहारा
राष्ट्रीय खबर
रांचीःचिकित्सा जगत में कृत्रिम बुद्धिमत्ता का प्रयोग सफलता के कई नये द्वार खोल सकता है। एक एमआरएनए को डिकोड करने के बाद जीनोम को पूरी तरह पढ़ने में सक्षम ए आई के लिए एक भाषा मॉडल के विकास की तैयारी चल रही है।
इससे पहले भी कृत्रिम बुद्धिमत्ता का वही वर्ग जिसने सॉफ्टवेयर कोडिंग और बार परीक्षा पास करके सुर्खियां बटोरीं, उसने एक अलग तरह का पाठ पढ़ना सीख लिया है वह है आनुवंशिक कोड। उस कोड में जीवन के सभी कार्यों के लिए निर्देश शामिल हैं और यह उन नियमों के विपरीत नहीं है जो मानव भाषाओं को नियंत्रित करते हैं।
जीनोम में प्रत्येक अनुक्रम एक जटिल व्याकरण और वाक्यविन्यास का पालन करता है, संरचनाएं जो अर्थ को जन्म देती हैं। जिस प्रकार कुछ शब्दों को बदलने से एक वाक्य के प्रभाव में आमूल-चूल परिवर्तन आ सकता है, उसी प्रकार जैविक अनुक्रम में छोटे-छोटे बदलाव अनुक्रम द्वारा एन्कोड किए गए रूपों में बड़ा अंतर ला सकते हैं।
अब मशीन लर्निंग विशेषज्ञ मेंगडी वांग के नेतृत्व में प्रिंसटन विश्वविद्यालय के शोधकर्ता आंशिक जीनोम अनुक्रमों को समझने और जीव विज्ञान का अध्ययन करने और चिकित्सा में सुधार करने के लिए उन अनुक्रमों को अनुकूलित करने के लिए भाषा मॉडल का उपयोग कर रहे हैं। वैज्ञानिकों के पास आनुवंशिक जानकारी के प्रवाह को संक्षेप में प्रस्तुत करने का एक सरल तरीका है। वे इसे जीव विज्ञान की केंद्रीय हठधर्मिता कहते हैं। सूचना डीएनए से आरएनए और प्रोटीन तक जाती है। प्रोटीन जीवित कोशिकाओं की संरचना और कार्यों का निर्माण करते हैं।
प्रोटीन उत्पादन की दक्षता को नियंत्रित करना एक प्रमुख तंत्र है जिसके द्वारा एमआरएनए टीके काम करते हैं। शोधकर्ताओं ने अपने भाषा मॉडल को गैर अनुवादित क्षेत्र पर केंद्रित किया, यह देखने के लिए कि वे दक्षता को कैसे अनुकूलित कर सकते हैं और टीकों में सुधार कर सकते हैं।
छोटी किस्म की प्रजातियों पर मॉडल को प्रशिक्षित करने के बाद, शोधकर्ताओं ने सैकड़ों नए अनुकूलित अनुक्रम तैयार किए और प्रयोगशाला प्रयोगों के माध्यम से उन परिणामों को मान्य किया। सर्वोत्तम अनुक्रमों ने वैक्सीन विकास के लिए कई प्रमुख बेंचमार्क को पीछे छोड़ दिया, जिसमें प्रोटीन उत्पादन की समग्र दक्षता में 33 प्रतिशत की वृद्धि भी शामिल है। शोधकर्ताओं के अनुसार, थोड़ी मात्रा में भी प्रोटीन उत्पादन क्षमता बढ़ाने से उभरते उपचार विज्ञान को बड़ा बढ़ावा मिलता है। कोविड-19 के अलावा, एमआरएनए टीके कई संक्रामक बीमारियों और कैंसर से बचाने का वादा करते हैं।
प्रमुख अन्वेषक वांग ने कहा कि मॉडल की सफलता ने एक अधिक मौलिक संभावना की ओर भी इशारा किया है। मुट्ठी भर प्रजातियों से एमआरएनए पर प्रशिक्षित, यह न्यूक्लियोटाइड अनुक्रमों को डिकोड करने और जीन विनियमन के बारे में कुछ नया प्रकट करने में सक्षम था। वैज्ञानिकों का मानना है कि जीन विनियमन, जीवन के सबसे बुनियादी कार्यों में से एक, बीमारी और विकार की उत्पत्ति को खोलने की कुंजी रखता है।
अनुसंधान टीम ने 211 नए अनुक्रमों की लाइब्रेरी बनाने के लिए प्रशिक्षित मॉडल का उपयोग किया। प्रत्येक को वांछित फ़ंक्शन के लिए अनुकूलित किया गया था, मुख्य रूप से अनुवाद की दक्षता में वृद्धि। वे प्रोटीन, जैसे कि COVID-19 टीकों द्वारा लक्षित स्पाइक प्रोटीन, संक्रामक रोग के प्रति प्रतिरक्षा प्रतिक्रिया को संचालित करते हैं।
वांग ने कहा कि इस भाषा मॉडल को बनाने में वास्तविक चुनौती उपलब्ध डेटा के पूर्ण संदर्भ को समझने में थी। किसी मॉडल को प्रशिक्षित करने के लिए न केवल उसकी सभी विशेषताओं के साथ कच्चे डेटा की आवश्यकता होती है, बल्कि उन सुविधाओं के डाउनस्ट्रीम परिणामों की भी आवश्यकता होती है। वांग ने कहा, हमने कई संसाधनों से अघोषित डेटा भी एकत्र किया। उन हिस्सों को एक सुसंगत और मजबूत पूरे में व्यवस्थित करना, एक बड़ी चुनौती थी। एक मॉडल को प्रशिक्षित करना न केवल उन सभी अनुक्रमों को एक साथ रखने के बारे में है, बल्कि उन लेबलों के साथ अनुक्रमों को एक साथ रखना भी है जो अब तक एकत्र किए गए हैं। ऐसा पहले कभी नहीं किया गया था।