Breaking News in Hindi
ब्रेकिंग
Dubai Property Market: मिडिल ईस्ट टेंशन का दुबई रियल एस्टेट पर बड़ा असर, औंधे मुंह गिरे प्रॉपर्टी के... Health Alert: क्या आप भी AI से पूछते हैं बीमारी का इलाज? नई स्टडी का खुलासा- 50% मामलों में मिली गलत... Vaishakh Masik Shivratri 2026: आज है वैशाख मास की शिवरात्रि, जानें पूजा का सटीक मुहूर्त और विशेष संय... Fitness Tips: जिम जाने का समय नहीं? आलिया भट्ट के ट्रेनर से सीखें 10 मिनट का ये आसान होम वर्कआउट Jhansi News: झांसी में बीयर कंटेनर और मिर्ची के ट्रक में जोरदार भिड़ंत, लूटपाट के डर से मौके पर पुलि... Amravati News: 108 लड़कियों से दरिंदगी और 350 वीडियो वायरल; जानें अमरावती 'वीडियो कांड' में कैसे बिछ... MP Crime News: झाबुआ में अमानवीयता की सारी हदें पार, महिला का मुंडन कर कंधे पर पति को बैठाकर गांव मे... Cyber Crime News: 'आपका नंबर पहलगाम आतंकी के पास है...' कॉल पर डराकर बुजुर्ग से 73 लाख की ठगी, जानें... Bihar New CM: बिहार में रचा गया इतिहास, सम्राट चौधरी बने पहले BJP मुख्यमंत्री; विजय चौधरी और विजेंद्... Bengal Election 2026: पांच संभाग और BJP का 'साइलेंट मिशन', चुनावी शोर के बीच ऐसे बंगाल फतह की रणनीति...

भावी ए आई अनंत लूप में फंस सकता है, देखें वीडियो

इंटरनेट की दुनिया में कृत्रिम बुद्धिमत्ता का नया खतरा


  • इसके कई मॉडलों पर हुआ परीक्षण

  • अभी उपलब्ध मॉडलों में खामियां है

  • नये आंकड़ों से खुद को समृद्ध करेगा

राष्ट्रीय खबर


 

रांचीः ओपन ए आई के चैट जीपीटी 4 या कुछ अन्य जनरेटिव आर्टिफिशियल इंटेलिजेंस मॉडल आश्चर्यजनक रूप से नए टेक्स्ट, कोड, इमेज और वीडियो बनाने में सक्षम हैं। हालाँकि, उन्हें प्रशिक्षित करने के लिए इतनी बड़ी मात्रा में डेटा की आवश्यकता होती है कि डेवलपर्स पहले से ही आपूर्ति सीमाओं के खिलाफ चल रहे हैं और जल्द ही प्रशिक्षण संसाधनों को पूरी तरह से समाप्त कर सकते हैं।

डेटा की कमी की इस पृष्ठभूमि के खिलाफ, ए आई मॉडल की भावी पीढ़ियों को प्रशिक्षित करने के लिए सिंथेटिक डेटा का उपयोग करना कई कारणों से बड़ी तकनीक के लिए एक आकर्षक विकल्प की तरह लग सकता है, जिनमें शामिल हैं: ए आई-संश्लेषित डेटा वास्तविक दुनिया के डेटा की तुलना में सस्ता है और आपूर्ति के मामले में लगभग असीमित है; यह कम गोपनीयता जोखिम पैदा करता है जैसा कि चिकित्सा डेटा के मामले में होता है और कुछ मामलों में, सिंथेटिक डेटा ए आई प्रदर्शन को बेहतर भी बना सकता है।

हालांकि, राइस यूनिवर्सिटी में डिजिटल सिग्नल प्रोसेसिंग समूह द्वारा हाल ही में किए गए काम में पाया गया है कि सिंथेटिक डेटा का आहार जनरेटिव ए आई मॉडल के भविष्य के पुनरावृत्तियों पर महत्वपूर्ण नकारात्मक प्रभाव डाल सकता है। राइस के सी. सिडनी बुरस इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग के प्रोफेसर रिचर्ड बारानियुक ने कहा, समस्या तब उत्पन्न होती है जब यह सिंथेटिक डेटा प्रशिक्षण, अनिवार्य रूप से, दोहराया जाता है, जिससे एक तरह का फीडबैक लूप बनता है – जिसे हम स्व-उपभोग लूप कहते हैं।

मैड काउ रोग एक घातक न्यूरोडीजेनेरेटिव बीमारी है जो गायों को प्रभावित करती है और संक्रमित मांस खाने से होने वाली मानव समतुल्य बीमारी है। 1980-90 के दशक में एक बड़े प्रकोप ने इस तथ्य की ओर ध्यान आकर्षित किया कि गायों को उनके वध किए गए साथियों के संसाधित बचे हुए भोजन को खिलाने की प्रथा के परिणामस्वरूप पागल गाय रोग का प्रसार हुआ – इसलिए ऑटोफैगी शब्द ग्रीक ऑटो- से लिया गया है, जिसका अर्थ है स्वयं, और फेगी – खाना।

इसी तरह स्व-उपभोग करने वाले जनरेटिव मॉडल पागल हो जाते हैं शीर्षक वाला अध्ययन ए आई ऑटोफैगी पर पहला सहकर्मी-समीक्षित कार्य है और लोकप्रिय डीएएलएल-ई 3, मिडजर्नी और स्टेबल डिफ्यूजन जैसे जनरेटिव इमेज मॉडल पर केंद्रित है।

 

हमने ऑटोफैगस प्रशिक्षण की कमियों को बेहतर ढंग से उजागर करने के लिए विज़ुअल ए आई मॉडल पर काम करना चुना, लेकिन एसएसएम के साथ भी वही पागल गाय के मुद्दे होते हैं, जैसा कि अन्य समूहों ने बताया है, बरनियुक ने कहा।
इंटरनेट आमतौर पर जनरेटिव ए आई मॉडल के प्रशिक्षण डेटासेट का स्रोत होता है, इसलिए जैसे-जैसे सिंथेटिक डेटा ऑनलाइन बढ़ता है, मॉडल की प्रत्येक नई पीढ़ी के साथ स्व-उपभोग करने वाले लूप उभरने की संभावना होती है। यह कैसे हो सकता है, इसके विभिन्न परिदृश्यों में अंतर्दृष्टि प्राप्त करने के लिए, बरनियुक और उनकी टीम ने स्व-उपभोग करने वाले प्रशिक्षण लूप के तीन रूपों का अध्ययन किया, जो वास्तविक और सिंथेटिक डेटा को जनरेटिव मॉडल के लिए प्रशिक्षण डेटासेट में कैसे जोड़ा जाता है, इसका यथार्थवादी प्रतिनिधित्व प्रदान करने के लिए डिज़ाइन किए गए हैं।
एक जनरेटिव मॉडल की लगातार पीढ़ियों को पिछली पीढ़ियों के आउटपुट से सैंपल किए गए पूरी तरह से सिंथेटिक डेटा डाइट उपलब्ध कराया गया।

मॉडल की प्रत्येक पीढ़ी के लिए प्रशिक्षण डेटासेट में पिछली पीढ़ियों से सैंपल किए गए सिंथेटिक डेटा और वास्तविक प्रशिक्षण डेटा के एक निश्चित सेट का संयोजन शामिल था। मॉडल की प्रत्येक पीढ़ी को पिछली पीढ़ियों के सिंथेटिक डेटा और वास्तविक प्रशिक्षण डेटा के एक नए सेट के मिश्रण पर प्रशिक्षित किया जाता है।

लूप के प्रगतिशील पुनरावृत्तियों से पता चला कि, समय के साथ और पर्याप्त ताजा वास्तविक डेटा की अनुपस्थिति में, मॉडल गुणवत्ता, विविधता या दोनों की कमी वाले तेजी से विकृत आउटपुट उत्पन्न करेंगे। दूसरे शब्दों में, जितना अधिक ताजा डेटा होगा, ए आई उतना ही स्वस्थ होगा।

मॉडल की क्रमिक पीढ़ियों से उत्पन्न छवि डेटासेट की साथ-साथ तुलना संभावित ए आई भविष्य की एक भयावह तस्वीर पेश करती है।

मानव चेहरों वाले डेटासेट में ग्रिड जैसे निशान अधिकाधिक दिखाई देने लगते हैं — जिसे लेखक जनरेटिव आर्टिफैक्ट कहते हैं या वे अधिकाधिक एक ही व्यक्ति जैसे दिखाई देने लगते हैं।

संख्याओं वाले डेटासेट समझ से परे स्क्रिबल्स में बदल जाते हैं। इसे सुधारने और पूरी तरह दोषमुक्त कर लेने के बाद यह इंसान से शायद बेहतर तरीके से काम कर पायेगा। तब तक इसके पूरे इस्तेमाल से इंटरनेट पूरी तरह बाधित हो सकता है।

देखें इससे संबंधित वीडियो