Breaking News in Hindi
ब्रेकिंग
Google Earthquake Alert: भूकंप आने से पहले कैसे मिल जाता है अलर्ट? जानें गूगल के इस स्मार्ट सिस्टम क... Muharram Facts: मुहर्रम के 10 दिन मातम के क्यों होते हैं? ताजिया और आशूरा से जुड़ी पूरी जानकारी Health Tips: ऑफिस में घंटों बैठकर काम करते हैं? हर घंटे सिर्फ 5 मिनट की सैर से मिलेंगे ये गजब के फाय... MP Land Controversy: मुख्यमंत्री मोहन यादव के समर्थन में उतरे अखिलेश यादव; AIMIM चीफ ओवैसी ने कहा- य... MP Land Dispute Controversy: उज्जैन जमीन विवाद में कूदे ओम प्रकाश राजभर; IAS भरत यादव पर लगाए गंभीर ... Ujjain News: मिठाइयों पर 'चांदी के वर्क' को बंद करने की पहल; कलेक्टर ने दिए मिठाई विक्रेताओं को निर्... Indore Crime News: जमीन विवाद सुलझाने गई पुलिस टीम पर बदमाशों का हमला; एक जवान के सिर में लगे 16 टां... AI Misuse Case: शादी का प्रस्ताव ठुकराने पर AI से बनाई फर्जी हनीमून फोटो; युवती ने महिला आयोग में की... Rahul Gandhi Defamation Case: शिवराज सिंह चौहान के बेटे के मामले में राहुल गांधी ने जताया खेद; हाई क...

Hidden Costs of AI: OpenAI और Claude पर हिंदी भाषा का पड़ता है ज्यादा असर, टोकन खर्च बढ़ने से बढ़ रहा है बिल

नई दिल्ली: यदि आप OpenAI, Anthropic या Google के AI मॉडल्स का उपयोग हिंदी या अन्य क्षेत्रीय भाषाओं में कर रहे हैं, तो सावधान हो जाएं। रिसर्चर्स के नए डेटा से पता चला है कि अंग्रेजी के अलावा अन्य भाषाओं में AI का उपयोग करना ‘छिपे हुए खर्च’ यानी ‘लैंग्वेज टैक्स’ की वजह से काफी महंगा पड़ सकता है। कंपनियां भले ही अपने मॉडल्स को सभी के लिए समान बताएं, लेकिन भाषा के आधार पर प्रोसेसिंग लागत में भारी अंतर है।

⚙️ क्यों महंगा है हिंदी में AI का उपयोग?

AI मॉडल किसी भी निर्देश (प्रॉम्प्ट) को ‘टोकन’ (Tokens) के रूप में प्रोसेस करते हैं। सरल शब्दों में, एआई सिस्टम टेक्स्ट को पढ़ने के लिए छोटी इकाइयों का उपयोग करता है। अंग्रेजी की तुलना में, हिंदी जैसे भाषाओं में शब्दों की संरचना भिन्न होने के कारण AI ज्यादा टोकन्स जेनरेट करता है। जो काम अंग्रेजी में कम टोकन्स में हो जाता है, वही हिंदी में कहने पर सिस्टम ज्यादा टोकन्स खर्च करता है, जिससे अंततः यूजर को ज्यादा पैसे चुकाने पड़ते हैं।

📉 क्या है ‘लैंग्वेज टैक्स’ का गणित?

रिसर्चर्स इसे एक ‘छिपा हुआ खर्च’ मानते हैं जो AI के टोकनाइजर (Tokenizer) की कार्यप्रणाली पर निर्भर करता है। हालिया प्रयोगों के नतीजे चौंकाने वाले हैं:

  • OpenAI के टोकेनाइज़र पर: हिंदी टेक्स्ट के लिए अंग्रेजी की तुलना में लगभग 1.37 गुना ज्यादा टोकन खर्च होते हैं।

  • Anthropic के Claude टोकेनाइजर पर: यह अंतर और भी बढ़ जाता है, जहाँ हिंदी के लिए 3.24 गुना ज्यादा टोकन की आवश्यकता होती है।

  • अन्य भाषाएं: अरबी के लिए 2.86 गुना और चीनी भाषा के लिए 1.71 गुना ज्यादा टोकन खर्च होते हैं।

💡 डेवलपर्स और यूजर्स के लिए चुनौती

यह शोध साबित करता है कि वर्तमान AI मॉडल्स अंग्रेजी-केंद्रित हैं। ‘द बिटर लेसन’ जैसे बेंचमार्क के माध्यम से यह साफ हो गया है कि भाषा की विविधता के बावजूद, तकनीक का मौजूदा ढांचा गैर-अंग्रेजी भाषी यूजर्स पर आर्थिक बोझ डाल रहा है। यदि आप भारी मात्रा में AI का उपयोग कर रहे हैं, तो यह टोकन खर्च आपके बजट को प्रभावित कर सकता है।