Breaking News in Hindi
ब्रेकिंग
अत्यधिक ताप सहने वाला नया चिप तैयार Bengal Election 2026: ममता बनर्जी को बड़ा झटका, इस सीट से TMC उम्मीदवार का नामांकन रद्द; जानें अब कि... Mathura Boat Accident Video: मौत से चंद लम्हे पहले 'राधे-राधे' का जाप कर रहे थे श्रद्धालु, सामने आया... पाकिस्तान: इस्लामाबाद में अघोषित कर्फ्यू! ईरान-यूएस पीस टॉक के चलते सुरक्षा सख्त, आम जनता के लिए बुन... Anant Ambani Guruvayur Visit: अनंत अंबानी ने गुरुवायुर मंदिर में किया करोड़ों का दान, हाथियों के लिए... पश्चिम बंगाल चुनाव: बीजेपी का बड़ा दांव! जेल से रिहा होते ही मैदान में उतरा दिग्गज नेता, समर्थकों ने... Nashik News: नासिक की आईटी कंपनी में महिलाओं से दरिंदगी, 'लेडी सिंघम' ने भेष बदलकर किया बड़े गिरोह क... EVM Probe: बॉम्बे हाई कोर्ट का ऐतिहासिक फैसला, पहली बार दिया EVM जांच का आदेश; जानें मुंबई विधानसभा ... Rajnath Singh on Gen Z: 'आप लेटेस्ट और बेस्ट हैं', रक्षा मंत्री राजनाथ सिंह ने Gen Z की तारीफ में पढ... SC on Caste Census: जाति जनगणना पर रोक लगाने से सुप्रीम कोर्ट का इनकार, याचिकाकर्ता को फटकार लगा CJI...

भावी ए आई अनंत लूप में फंस सकता है, देखें वीडियो

इंटरनेट की दुनिया में कृत्रिम बुद्धिमत्ता का नया खतरा


  • इसके कई मॉडलों पर हुआ परीक्षण

  • अभी उपलब्ध मॉडलों में खामियां है

  • नये आंकड़ों से खुद को समृद्ध करेगा

राष्ट्रीय खबर


 

रांचीः ओपन ए आई के चैट जीपीटी 4 या कुछ अन्य जनरेटिव आर्टिफिशियल इंटेलिजेंस मॉडल आश्चर्यजनक रूप से नए टेक्स्ट, कोड, इमेज और वीडियो बनाने में सक्षम हैं। हालाँकि, उन्हें प्रशिक्षित करने के लिए इतनी बड़ी मात्रा में डेटा की आवश्यकता होती है कि डेवलपर्स पहले से ही आपूर्ति सीमाओं के खिलाफ चल रहे हैं और जल्द ही प्रशिक्षण संसाधनों को पूरी तरह से समाप्त कर सकते हैं।

डेटा की कमी की इस पृष्ठभूमि के खिलाफ, ए आई मॉडल की भावी पीढ़ियों को प्रशिक्षित करने के लिए सिंथेटिक डेटा का उपयोग करना कई कारणों से बड़ी तकनीक के लिए एक आकर्षक विकल्प की तरह लग सकता है, जिनमें शामिल हैं: ए आई-संश्लेषित डेटा वास्तविक दुनिया के डेटा की तुलना में सस्ता है और आपूर्ति के मामले में लगभग असीमित है; यह कम गोपनीयता जोखिम पैदा करता है जैसा कि चिकित्सा डेटा के मामले में होता है और कुछ मामलों में, सिंथेटिक डेटा ए आई प्रदर्शन को बेहतर भी बना सकता है।

हालांकि, राइस यूनिवर्सिटी में डिजिटल सिग्नल प्रोसेसिंग समूह द्वारा हाल ही में किए गए काम में पाया गया है कि सिंथेटिक डेटा का आहार जनरेटिव ए आई मॉडल के भविष्य के पुनरावृत्तियों पर महत्वपूर्ण नकारात्मक प्रभाव डाल सकता है। राइस के सी. सिडनी बुरस इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग के प्रोफेसर रिचर्ड बारानियुक ने कहा, समस्या तब उत्पन्न होती है जब यह सिंथेटिक डेटा प्रशिक्षण, अनिवार्य रूप से, दोहराया जाता है, जिससे एक तरह का फीडबैक लूप बनता है – जिसे हम स्व-उपभोग लूप कहते हैं।

मैड काउ रोग एक घातक न्यूरोडीजेनेरेटिव बीमारी है जो गायों को प्रभावित करती है और संक्रमित मांस खाने से होने वाली मानव समतुल्य बीमारी है। 1980-90 के दशक में एक बड़े प्रकोप ने इस तथ्य की ओर ध्यान आकर्षित किया कि गायों को उनके वध किए गए साथियों के संसाधित बचे हुए भोजन को खिलाने की प्रथा के परिणामस्वरूप पागल गाय रोग का प्रसार हुआ – इसलिए ऑटोफैगी शब्द ग्रीक ऑटो- से लिया गया है, जिसका अर्थ है स्वयं, और फेगी – खाना।

इसी तरह स्व-उपभोग करने वाले जनरेटिव मॉडल पागल हो जाते हैं शीर्षक वाला अध्ययन ए आई ऑटोफैगी पर पहला सहकर्मी-समीक्षित कार्य है और लोकप्रिय डीएएलएल-ई 3, मिडजर्नी और स्टेबल डिफ्यूजन जैसे जनरेटिव इमेज मॉडल पर केंद्रित है।

 

हमने ऑटोफैगस प्रशिक्षण की कमियों को बेहतर ढंग से उजागर करने के लिए विज़ुअल ए आई मॉडल पर काम करना चुना, लेकिन एसएसएम के साथ भी वही पागल गाय के मुद्दे होते हैं, जैसा कि अन्य समूहों ने बताया है, बरनियुक ने कहा।
इंटरनेट आमतौर पर जनरेटिव ए आई मॉडल के प्रशिक्षण डेटासेट का स्रोत होता है, इसलिए जैसे-जैसे सिंथेटिक डेटा ऑनलाइन बढ़ता है, मॉडल की प्रत्येक नई पीढ़ी के साथ स्व-उपभोग करने वाले लूप उभरने की संभावना होती है। यह कैसे हो सकता है, इसके विभिन्न परिदृश्यों में अंतर्दृष्टि प्राप्त करने के लिए, बरनियुक और उनकी टीम ने स्व-उपभोग करने वाले प्रशिक्षण लूप के तीन रूपों का अध्ययन किया, जो वास्तविक और सिंथेटिक डेटा को जनरेटिव मॉडल के लिए प्रशिक्षण डेटासेट में कैसे जोड़ा जाता है, इसका यथार्थवादी प्रतिनिधित्व प्रदान करने के लिए डिज़ाइन किए गए हैं।
एक जनरेटिव मॉडल की लगातार पीढ़ियों को पिछली पीढ़ियों के आउटपुट से सैंपल किए गए पूरी तरह से सिंथेटिक डेटा डाइट उपलब्ध कराया गया।

मॉडल की प्रत्येक पीढ़ी के लिए प्रशिक्षण डेटासेट में पिछली पीढ़ियों से सैंपल किए गए सिंथेटिक डेटा और वास्तविक प्रशिक्षण डेटा के एक निश्चित सेट का संयोजन शामिल था। मॉडल की प्रत्येक पीढ़ी को पिछली पीढ़ियों के सिंथेटिक डेटा और वास्तविक प्रशिक्षण डेटा के एक नए सेट के मिश्रण पर प्रशिक्षित किया जाता है।

लूप के प्रगतिशील पुनरावृत्तियों से पता चला कि, समय के साथ और पर्याप्त ताजा वास्तविक डेटा की अनुपस्थिति में, मॉडल गुणवत्ता, विविधता या दोनों की कमी वाले तेजी से विकृत आउटपुट उत्पन्न करेंगे। दूसरे शब्दों में, जितना अधिक ताजा डेटा होगा, ए आई उतना ही स्वस्थ होगा।

मॉडल की क्रमिक पीढ़ियों से उत्पन्न छवि डेटासेट की साथ-साथ तुलना संभावित ए आई भविष्य की एक भयावह तस्वीर पेश करती है।

मानव चेहरों वाले डेटासेट में ग्रिड जैसे निशान अधिकाधिक दिखाई देने लगते हैं — जिसे लेखक जनरेटिव आर्टिफैक्ट कहते हैं या वे अधिकाधिक एक ही व्यक्ति जैसे दिखाई देने लगते हैं।

संख्याओं वाले डेटासेट समझ से परे स्क्रिबल्स में बदल जाते हैं। इसे सुधारने और पूरी तरह दोषमुक्त कर लेने के बाद यह इंसान से शायद बेहतर तरीके से काम कर पायेगा। तब तक इसके पूरे इस्तेमाल से इंटरनेट पूरी तरह बाधित हो सकता है।

देखें इससे संबंधित वीडियो