Breaking News in Hindi
ब्रेकिंग
Ujjain-Jhalawar Fourlane: सिंहस्थ-2028 से पहले बदलेगी उज्जैन-राजस्थान की राह; 2721 करोड़ के फोरलेन प... Bhopal Fraud News: पुराने नोट बेचने के चक्कर में महिला ने गंवाए 1.91 लाख रुपये; जानें कैसे ठगों ने ब... Ujjain Development News: महाकाल महालोक के बाद बदली उज्जैन की तस्वीर; आध्यात्मिक राजधानी से अब 'विकास... MP Tax Evasion: कर चोरी और फर्जी बिलिंग पर लगाम; एमपी सरकार का नया डिजिटल मॉड्यूल, अब नागरिक सीधे कर... Tvisha Sharma Death Case: भोपाल में एक्ट्रेस ट्विशा शर्मा की संदिग्ध मौत की गुत्थी; सीबीआई क्राइम सी... Morena News: हाथ बांधकर नदी में कूदा प्रेमी युगल; सोशल मीडिया पर वायरल हुआ वीडियो, जानें क्या है पूर... MP Transport News: मध्यप्रदेश में अब 7 क्षेत्रों में होगा बस संचालन; मुख्यमंत्री सुगम परिवहन सेवा की... Jabalpur Water Tank Scam: जल जीवन मिशन की खुली पोल; 3 करोड़ की टंकी पहली बार भरते ही हुई छलनी, ग्राम... Agra Crime News: आगरा के फाइव स्टार होटल में रईसजादों का 'फिल्मी' कारनामा; 41 हजार का डिनर कर बिल दि... Himachal Election Results: नगर निगम चुनाव में बीजेपी का दबदबा; 4 में से 3 सीटों पर जीत, कांग्रेस को ...

भावी ए आई अनंत लूप में फंस सकता है, देखें वीडियो

इंटरनेट की दुनिया में कृत्रिम बुद्धिमत्ता का नया खतरा


  • इसके कई मॉडलों पर हुआ परीक्षण

  • अभी उपलब्ध मॉडलों में खामियां है

  • नये आंकड़ों से खुद को समृद्ध करेगा

राष्ट्रीय खबर


 

रांचीः ओपन ए आई के चैट जीपीटी 4 या कुछ अन्य जनरेटिव आर्टिफिशियल इंटेलिजेंस मॉडल आश्चर्यजनक रूप से नए टेक्स्ट, कोड, इमेज और वीडियो बनाने में सक्षम हैं। हालाँकि, उन्हें प्रशिक्षित करने के लिए इतनी बड़ी मात्रा में डेटा की आवश्यकता होती है कि डेवलपर्स पहले से ही आपूर्ति सीमाओं के खिलाफ चल रहे हैं और जल्द ही प्रशिक्षण संसाधनों को पूरी तरह से समाप्त कर सकते हैं।

डेटा की कमी की इस पृष्ठभूमि के खिलाफ, ए आई मॉडल की भावी पीढ़ियों को प्रशिक्षित करने के लिए सिंथेटिक डेटा का उपयोग करना कई कारणों से बड़ी तकनीक के लिए एक आकर्षक विकल्प की तरह लग सकता है, जिनमें शामिल हैं: ए आई-संश्लेषित डेटा वास्तविक दुनिया के डेटा की तुलना में सस्ता है और आपूर्ति के मामले में लगभग असीमित है; यह कम गोपनीयता जोखिम पैदा करता है जैसा कि चिकित्सा डेटा के मामले में होता है और कुछ मामलों में, सिंथेटिक डेटा ए आई प्रदर्शन को बेहतर भी बना सकता है।

हालांकि, राइस यूनिवर्सिटी में डिजिटल सिग्नल प्रोसेसिंग समूह द्वारा हाल ही में किए गए काम में पाया गया है कि सिंथेटिक डेटा का आहार जनरेटिव ए आई मॉडल के भविष्य के पुनरावृत्तियों पर महत्वपूर्ण नकारात्मक प्रभाव डाल सकता है। राइस के सी. सिडनी बुरस इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग के प्रोफेसर रिचर्ड बारानियुक ने कहा, समस्या तब उत्पन्न होती है जब यह सिंथेटिक डेटा प्रशिक्षण, अनिवार्य रूप से, दोहराया जाता है, जिससे एक तरह का फीडबैक लूप बनता है – जिसे हम स्व-उपभोग लूप कहते हैं।

मैड काउ रोग एक घातक न्यूरोडीजेनेरेटिव बीमारी है जो गायों को प्रभावित करती है और संक्रमित मांस खाने से होने वाली मानव समतुल्य बीमारी है। 1980-90 के दशक में एक बड़े प्रकोप ने इस तथ्य की ओर ध्यान आकर्षित किया कि गायों को उनके वध किए गए साथियों के संसाधित बचे हुए भोजन को खिलाने की प्रथा के परिणामस्वरूप पागल गाय रोग का प्रसार हुआ – इसलिए ऑटोफैगी शब्द ग्रीक ऑटो- से लिया गया है, जिसका अर्थ है स्वयं, और फेगी – खाना।

इसी तरह स्व-उपभोग करने वाले जनरेटिव मॉडल पागल हो जाते हैं शीर्षक वाला अध्ययन ए आई ऑटोफैगी पर पहला सहकर्मी-समीक्षित कार्य है और लोकप्रिय डीएएलएल-ई 3, मिडजर्नी और स्टेबल डिफ्यूजन जैसे जनरेटिव इमेज मॉडल पर केंद्रित है।

 

हमने ऑटोफैगस प्रशिक्षण की कमियों को बेहतर ढंग से उजागर करने के लिए विज़ुअल ए आई मॉडल पर काम करना चुना, लेकिन एसएसएम के साथ भी वही पागल गाय के मुद्दे होते हैं, जैसा कि अन्य समूहों ने बताया है, बरनियुक ने कहा।
इंटरनेट आमतौर पर जनरेटिव ए आई मॉडल के प्रशिक्षण डेटासेट का स्रोत होता है, इसलिए जैसे-जैसे सिंथेटिक डेटा ऑनलाइन बढ़ता है, मॉडल की प्रत्येक नई पीढ़ी के साथ स्व-उपभोग करने वाले लूप उभरने की संभावना होती है। यह कैसे हो सकता है, इसके विभिन्न परिदृश्यों में अंतर्दृष्टि प्राप्त करने के लिए, बरनियुक और उनकी टीम ने स्व-उपभोग करने वाले प्रशिक्षण लूप के तीन रूपों का अध्ययन किया, जो वास्तविक और सिंथेटिक डेटा को जनरेटिव मॉडल के लिए प्रशिक्षण डेटासेट में कैसे जोड़ा जाता है, इसका यथार्थवादी प्रतिनिधित्व प्रदान करने के लिए डिज़ाइन किए गए हैं।
एक जनरेटिव मॉडल की लगातार पीढ़ियों को पिछली पीढ़ियों के आउटपुट से सैंपल किए गए पूरी तरह से सिंथेटिक डेटा डाइट उपलब्ध कराया गया।

मॉडल की प्रत्येक पीढ़ी के लिए प्रशिक्षण डेटासेट में पिछली पीढ़ियों से सैंपल किए गए सिंथेटिक डेटा और वास्तविक प्रशिक्षण डेटा के एक निश्चित सेट का संयोजन शामिल था। मॉडल की प्रत्येक पीढ़ी को पिछली पीढ़ियों के सिंथेटिक डेटा और वास्तविक प्रशिक्षण डेटा के एक नए सेट के मिश्रण पर प्रशिक्षित किया जाता है।

लूप के प्रगतिशील पुनरावृत्तियों से पता चला कि, समय के साथ और पर्याप्त ताजा वास्तविक डेटा की अनुपस्थिति में, मॉडल गुणवत्ता, विविधता या दोनों की कमी वाले तेजी से विकृत आउटपुट उत्पन्न करेंगे। दूसरे शब्दों में, जितना अधिक ताजा डेटा होगा, ए आई उतना ही स्वस्थ होगा।

मॉडल की क्रमिक पीढ़ियों से उत्पन्न छवि डेटासेट की साथ-साथ तुलना संभावित ए आई भविष्य की एक भयावह तस्वीर पेश करती है।

मानव चेहरों वाले डेटासेट में ग्रिड जैसे निशान अधिकाधिक दिखाई देने लगते हैं — जिसे लेखक जनरेटिव आर्टिफैक्ट कहते हैं या वे अधिकाधिक एक ही व्यक्ति जैसे दिखाई देने लगते हैं।

संख्याओं वाले डेटासेट समझ से परे स्क्रिबल्स में बदल जाते हैं। इसे सुधारने और पूरी तरह दोषमुक्त कर लेने के बाद यह इंसान से शायद बेहतर तरीके से काम कर पायेगा। तब तक इसके पूरे इस्तेमाल से इंटरनेट पूरी तरह बाधित हो सकता है।

देखें इससे संबंधित वीडियो