कृत्रिम बुद्धिमत्ता का एक और इस्तेमाल की तकनीक विकसित
-
नये ए आई को विकसित किया गया
-
अब जिनोम कोड को शब्दों में बदलता है
-
व्यक्तिगत चिकित्सा में भी मदद मिलेगी
राष्ट्रीय खबर
रांचीः जीवन के रहस्यों का सबसे बड़ा खजाना डीएनए कोड में छिपा होता है। अब इसी कोड को समझने के लिए कृत्रिम बुद्धिमत्ता का प्रयोग किया जा रहा है। हम जानते हैं कि डीएनए में जीवन को बनाए रखने के लिए आवश्यक मूलभूत जानकारी होती है।
यह समझना कि यह जानकारी कैसे संग्रहीत और व्यवस्थित की जाती है, पिछली सदी की सबसे बड़ी वैज्ञानिक चुनौतियों में से एक रही हैमानव डीएनए पर प्रशिक्षित एक नए बड़े भाषा मॉडल के साथ, शोधकर्ता अब हमारे जीनोम में छिपी जटिल जानकारी को डिकोड करने का प्रयास कर सकते हैं।
ड्रेसडेन यूनिवर्सिटी ऑफ़ टेक्नोलॉजी के बायोटेक्नोलॉजी सेंटर की एक टीम द्वारा विकसित, यह विधि जिसे ग्रोवर नाम दिया गया है, मानव डीएनए को एक टेक्स्ट के रूप में मानता है, डीएनए अनुक्रमों के बारे में कार्यात्मक जानकारी निकालने के लिए इसके नियमों और संदर्भ को सीखता है।
देखें इससे संबंधित वीडियो
डबल हेलिक्स की खोज के बाद से, वैज्ञानिक डीएनए में एनकोड की गई जानकारी को समझने की कोशिश कर रहे हैं। 70 साल बाद, यह स्पष्ट है कि डीएनए में छिपी जानकारी बहुस्तरीय है। जीनोम का केवल 1-2 फीसद हिस्सा जीन से बना होता है, जो प्रोटीन के लिए कोड करने वाले अनुक्रम होते हैं।
बायोटेक में अनुसंधान समूह की नेता डॉ अन्ना पोएट्श कहती हैं, डीएनए में प्रोटीन के लिए कोडिंग के अलावा भी कई कार्य हैं। कुछ अनुक्रम जीन को नियंत्रित करते हैं, अन्य संरचनात्मक उद्देश्यों की पूर्ति करते हैं, अधिकांश अनुक्रम एक साथ कई कार्य करते हैं। वर्तमान में, हम डीएनए के अधिकांश भाग का अर्थ नहीं समझते हैं। जब डीएनए के गैर-कोडिंग क्षेत्रों को समझने की बात आती है, तो ऐसा लगता है कि हमने केवल सतह को खरोंचना शुरू किया है। यहीं पर एआई और बड़े भाषा मॉडल मदद कर सकते हैं।
जीपीटी जैसे बड़े भाषा मॉडल ने भाषा के बारे में हमारी समझ को बदल दिया है। विशेष रूप से पाठ पर प्रशिक्षित, बड़े भाषा मॉडल ने कई संदर्भों में भाषा का उपयोग करने की क्षमता विकसित की। डॉ पोएट्श कहती हैं, डीएनए जीवन का कोड है। इसे भाषा की तरह क्यों न माना जाए? पोएट्श टीम ने एक संदर्भ मानव जीनोम पर एक बड़े भाषा मॉडल को प्रशिक्षित किया। परिणामी उपकरण जिसका नाम ग्रोवर है, का उपयोग डीएनए से जैविक अर्थ निकालने के लिए किया जा सकता है।
ग्रोवर ने डीएनए के नियमों को सीखा। भाषा के संदर्भ में, हम व्याकरण, वाक्यविन्यास और शब्दार्थ के बारे में बात कर रहे हैं। डीएनए के लिए इसका मतलब है अनुक्रमों को नियंत्रित करने वाले नियम, न्यूक्लियोटाइड और अनुक्रमों का क्रम और अनुक्रमों का अर्थ सीखना। मानव भाषाओं को सीखने वाले जीपीटी मॉडल की तरह, ग्रोवर ने मूल रूप से डीएनए को बोलना सीख लिया है, परियोजना के पीछे शोधकर्ता डॉ मेलिसा सनाब्रिया बताती हैं।
टीम ने दिखाया कि ग्रोवर न केवल निम्नलिखित डीएनए अनुक्रमों की सटीक भविष्यवाणी कर सकता है, बल्कि इसका उपयोग प्रासंगिक जानकारी निकालने के लिए भी किया जा सकता है जिसका जैविक अर्थ है, उदाहरण के लिए, डीएनए पर जीन प्रमोटर या प्रोटीन बाइंडिंग साइट्स की पहचान करना। ग्रोवर उन प्रक्रियाओं को भी सीखता है जिन्हें आम तौर पर “एपिजेनेटिक” माना जाता है, यानी, नियामक प्रक्रियाएं जो एन्कोड होने के बजाय डीएनए के ऊपर होती हैं।
इस ग्रोवर को प्रशिक्षित करने के लिए, टीम को पहले एक डीएनए शब्दकोश बनाना पड़ा। उन्होंने संपीड़न एल्गोरिदम से एक तरकीब का इस्तेमाल किया। डॉ पोएट्श कहते हैं, यह कदम महत्वपूर्ण है और हमारे डीएनए भाषा मॉडल को पिछले प्रयासों से अलग करता है। हमने पूरे जीनोम का विश्लेषण किया और उन अक्षरों के संयोजनों की तलाश की जो सबसे अधिक बार होते हैं। हमने दो अक्षरों से शुरुआत की और डीएनए पर बार-बार काम किया, ताकि इसे सबसे आम बहु-अक्षर संयोजनों तक बनाया जा सके। इस तरह, लगभग 600 चक्रों में, हमने डीएनए को शब्दों में विभाजित कर दिया है, जिससे ग्रोवर अगले अनुक्रम की भविष्यवाणी करने में सबसे अच्छा प्रदर्शन कर सके।
डॉ पोट्श कहते हैं, ग्रोवर आनुवंशिक कोड की विभिन्न परतों को अनलॉक करने का वादा करता है। डीएनए में हमें मानव बनाने वाली चीज़ों, हमारी बीमारी की प्रवृत्ति और उपचारों के प्रति हमारी प्रतिक्रियाओं के बारे में महत्वपूर्ण जानकारी होती है। हमारा मानना है कि भाषा मॉडल के माध्यम से डीएनए के नियमों को समझना हमें डीएनए में छिपे जैविक अर्थ की गहराई को उजागर करने में मदद करेगा, जिससे जीनोमिक्स और व्यक्तिगत चिकित्सा दोनों को बढ़ावा मिलेगा।