डिजिटल सभ्यतागत बुनियादी ढाँचा

AI ज्ञान प्रणालियाँ, डिजिटल संग्रह, और भारतीय मंच

भारत की 3 करोड़ पांडुलिपियाँ सड़न की घड़ी से दौड़ रही हैं, जबकि सभ्यतागत ज्ञान विदेशी मंचों पर रहता है। यह पाठ दिखाता है कि कैसे AI ज्ञान प्रणालियाँ, डिजिटल संग्रह, भारतीय मंच, और डेटा संप्रभुता भारत की धरोहर को उसके अपने शर्तों पर बचा सकते हैं।

आज देखिए: भारत का डिजिटल स्वतंत्रता दिवस

अक्टूबर 2023 में, भारतीय रिज़र्व बैंक ने घोषणा की कि यूनिफाइड पेमेंट्स इंटरफेस ने एक महीने में 11 अरब से ज़्यादा लेन-देन किए थे। 2024 की शुरुआत तक, वह संख्या 14 अरब तक पहुँच गई। 300 मिलियन से ज़्यादा भारतीय एक ऐसी भुगतान प्रणाली का उपयोग कर रहे थे जिसे भारत में पूरी तरह डिज़ाइन किया गया, बनाया गया, और संचालित किया जाता है, भारतीय सर्वर पर, भारतीय नियमों के तहत।

यह कोई दुर्घटना नहीं थी। यह एक सभ्यतागत चुनाव था।

एक दशक पहले, भारत के डिजिटल भुगतान क्षेत्र पर विदेशी मंचों का कब्ज़ा था। Visa, Mastercard, और PayPal रेल को नियंत्रित करते थे। हर लेन-देन डेटा बनाता था जो California के सर्वर तक पहुँचता था। भारत को कोई गोली दागे बिना डिजिटली उपनिवेशित किया गया था।

फिर भारत ने अपना स्टैक बनाया। आधार ने 1.4 अरब लोगों को डिजिटल पहचान दी। UPI ने एक खुली, आपस में जुड़ी भुगतान प्रणाली बनाई जिससे किसी भी भारतीय को फोन से तुरंत, बिना किसी खर्च के, बिचौलिए के लेन-देन कर सकते हैं। DigiLocker ने सरकारी दस्तावेज़ों को डिजिटल बनाया। 'इंडिया स्टैक' के नाम से जानी जाने वाली यह चीज़ केवल तकनीक नहीं थी। यह सभ्यतागत संप्रभुता के लिए बुनियादी ढाँचा था। भारत अब US, UK, China, और Europe को मिलाकर ज़्यादा रीयल-टाइम डिजिटल भुगतान करता है। 46 से ज़्यादा देशों ने UPI अपनाने में दिलचस्पी दिखाई है। भारत एक दशक में डिजिटल निर्भरता से डिजिटल निर्यात तक पहुँच गया।

NPCI operations centre in Mumbai at midnight, engineers monitoring eleven billion UPI transactions across a live map of Bharat.

पर भुगतान तो सिर्फ शुरुआत है। असली सवाल यह है: क्या भारत अपने सभ्यतागत ज्ञान के लिए भी वैसी ही संप्रभु डिजिटल बुनियादी ढाँचा बना सकता है? क्या मंदिरों के तहखानों में सड़ने वाली पांडुलिपियाँ, विश्वविद्यालयों की तिजोरियों में बंद संस्कृत ग्रंथ, पीढ़ी दर पीढ़ी मिटने वाली मौखिक परंपराओं को भारतीय डिजिटल प्रणालियों के ज़रिए बचाया जा सकता है, व्यवस्थित किया जा सकता है, और सुलभ बनाया जा सकता है? क्या AI ने भारत की बौद्धिक धरोहर के लिए वह कर सकता है जो UPI ने वित्तीय प्रणाली के लिए किया था?

यह पाठ तर्क देता है कि हाँ, ऐसा होना चाहिए, और काम शुरू भी हो चुका है।

तंत्र: डिजिटल सभ्यतागत बुनियादी ढाँचे के पाँच स्तंभ

डिजिटल सभ्यतागत बुनियादी ढाँचा पाँच आपस में जुड़े क्षेत्रों में काम करता है। हर क्षेत्र एक ऐसी कमज़ोरी को संबोधित करता है जिसे केवल भौतिक बुनियादी ढाँचा हल नहीं कर सकता।

स्तंभ 1: भारतीय भाषा के ग्रंथों के लिए AI ज्ञान प्रणालियाँ। भारत के पास संस्कृत, तमिल, पाली, प्राकृत और दर्जनों अन्य भाषाओं में अनुमानित 30 मिलियन पांडुलिपियाँ हैं। ज़्यादातर को कभी अनुवाद नहीं किया गया, सूचीबद्ध नहीं किया गया, या खोजने योग्य नहीं बनाया गया। परंपरागत विद्वता इस पैमाने पर समस्या को हल नहीं कर सकती। शायद विश्व भर में कुछ हज़ार विद्वान शास्त्रीय संस्कृत को धाराप्रवाह पढ़ सकते हैं। वर्तमान गति से मैनुअल प्रक्रिया करते हुए, इस संग्रह का एक अंश भी कवर करने में सदियाँ लगेंगी।

AI समीकरण बदल देता है। IIT Bombay, University of Hyderabad, और दुनिया भर की संस्थाओं की कम्प्यूटेशनल भाषाविज्ञान टीमों ने संस्कृत और भारतीय भाषाओं के लिए विशेष रूप से तैयार मॉडल बनाए हैं। पाणिनि की व्याकरण, जिसे 2,500 साल पहले औपचारिक रूप दिया गया था, कम्प्यूटेशनल प्रसंस्करण के लिए शानदार तरीके से उपयुक्त साबित होती है क्योंकि वह पहले से ही एक औपचारिक प्रणाली थी: संभवतः दुनिया की पहली। Sanskrit Heritage Engine रूपात्मक विश्लेषण प्रदान करता है। Samsaadhani जैसे मंच संस्कृत वाक्यों का स्वचालित व्याकरणीय विश्लेषण देते हैं। ये उपकरण ताड़पत्र की पांडुलिपि की फोटो खींचना, लिपि पर ऑप्टिकल वर्ण पहचान करना, पाठ को कम्प्यूटेशनली विश्लेषण करना, अनुवाद बनाना, और सामग्री को ज्ञान ग्राफ़ से जोड़ना संभव बनाते हैं।

A computational linguist builds an Indic AI knowledge graph

कल्पना कीजिए एक AI-संचालित प्रणाली जो Arthashastra की हर अवधारणा को Mahabharata के संबंधित विचारों से जोड़े, आयुर्वेदिक और खगोलीय ग्रंथों के साथ क्रॉस-रेफ़र किए गए हों, जिसे स्मार्टफोन वाला कोई भी नेविगेट कर सके। तकनीक मौजूद है। जो चाहिए वह संस्थागत इच्छा है कि इन्हें सभ्यतागत पैमाने पर तैनात किया जाए।

स्तंभ 2: डिजिटल संग्रह और पांडुलिपि संरक्षण। भारत की National Mission for Manuscripts ने 2003 से 10,000 संग्रहों में 4.2 मिलियन से ज़्यादा पांडुलिपियों का सर्वेक्षण किया है। यह मानव इतिहास में सबसे बड़ी पांडुलिपि संरक्षण पहल है। BORI की Mahabharata के डिजिटल आलोचनात्मक संस्करण और French Institute of Pondicherry के Shaivite पांडुलिपि संग्रह जैसी परियोजनाएँ दिखाती हैं कि क्या संभव है। अंतर अभी भी समन्वय में है: खंडित प्रयास, असंगत मेटाडेटा मानदंड, और संस्थानों के बीच सीमित परस्पर जुड़ाव।

स्तंभ 3: सभ्यतागत ज्ञान मंच। संग्रह ज्ञान को संरक्षित करते हैं। मंच इसे प्रसारित करते हैं। एक संस्थागत डेटाबेस में डिजिटल पांडुलिपि केवल विशेषज्ञों तक पहुँचती है। ज्ञान मंच विद्वतापूर्ण सामग्री को संरचित सीखने में अनुवाद करते हैं, प्राचीन ज्ञान को आधुनिक चुनौतियों के लिए संदर्भ प्रदान करते हैं, और सभ्यतागत शिक्षा के चारों ओर समुदाय बनाते हैं। परंपरागत गुरु-शिष्य परंपरा ठीक यही थी: सभ्यतागत ज्ञान को पीढ़ियों में प्रसारित करने की एक संरचित प्रणाली। डिजिटल मंच इस मॉडल को लाखों तक बढ़ा सकते हैं जबकि गहराई और कठोरता बनाए रखते हैं।

ज़रूरत तत्काल है क्योंकि विकल्प पहले से ही यहाँ है। भारतीय ज्ञान मंचों के बिना, भारत की सभ्यतागत धरोहर को Coursera, Khan Academy, और YouTube पर Western शैक्षणिक ढाँचे के माध्यम से व्याख्या किए जाने का खतरा बना रहेगा। ये मंच अक्सर धर्मिक अवधारणाओं को विकृत, कम आँकते, या संदर्भ से हटाते हैं। जब एक Western-डिज़ाइन किए गए एल्गोरिदम तय करता है कि भारतीय सभ्यता के बारे में कौन सी सामग्री भारतीय उपयोगकर्ताओं को सिफारिश की जाए, वह तटस्थ तकनीक नहीं है। वह बुनियादी ढाँचे के माध्यम से ज्ञानात्मक उपनिवेशवाद है।

स्तंभ 4: भारतीय संचार बुनियादी ढाँचा। सोशल मीडिया तटस्थ तकनीक नहीं है। यह एक ज्ञानात्मक वातावरण है जो आकार देता है कि लोग क्या सोचते हैं और कौन सी चीज़ें सोचने योग्य मानते हैं। जब किसी राष्ट्र का जनता वार्तालाप Menlo Park में डिज़ाइन किए गए मंचों पर चलता है, Silicon Valley की सांस्कृतिक मान्यताओं से नियंत्रित होता है, तब उस राष्ट्र की सभ्यतागत बातचीत विदेशी क्षेत्र पर होती है। Twitter, Facebook, और YouTube ने बार-बार दिखाया है कि सामग्री प्रबंधन नीतियाँ Western उदारवादी मानदंडों को दर्शाती हैं। Hindu त्योहारों को मनाने वाली सामग्री को "घृणा भाषण" के रूप में चिह्नित किया गया है। Western डेटासेट पर प्रशिक्षित एल्गोरिदम व्यवस्थित रूप से भारतीय सामग्री को कम-प्रचार करते हैं। भारत को अपना संचार बुनियादी ढाँचा चाहिए: भारतीय सर्वर पर बनाया गया, भारतीय मूल्यों से नियंत्रित, भारतीय भाषाओं और सांस्कृतिक संदर्भों के लिए डिज़ाइन किया गया।

स्तंभ 5: डेटा संप्रभुता। हर डिजिटल इंटरैक्शन डेटा बनाता है। इसका मालिक कौन है, यह कहाँ संग्रहीत है, और इसे कौन एक्सेस कर सकता है ये सभ्यतागत सवाल हैं। जब भारतीय नागरिकों के स्वास्थ्य रिकॉर्ड, वित्तीय डेटा, और संचार मेटाडेटा विदेशी सर्वर को बहते हैं, भारत की सूचनागत संप्रभुता को नुकसान होता है। Digital Personal Data Protection Act (2023) और RBI की डेटा स्थानीयकरण जनादेश ज़रूरी पहले कदम हैं। सच्ची डेटा संप्रभुता को भारतीय क्लाउड बुनियादी ढाँचा, भारतीय-निर्मित AI मॉडल जो भारतीय डेटा पर प्रशिक्षित हों, और ऐसी frameworks चाहिएँ जो सभ्यतागत डेटा को विदेशी निगमों द्वारा कटाई के लिए एक वस्तु के बजाय रणनीतिक संपत्ति मानें।

पैटर्न: जब पुस्तकालय जलते हैं, सभ्यताएँ भूल जाती हैं

डिजिटल संरक्षण की तत्काल ज़रूरत स्पष्ट हो जाती है जब आप देखते हैं कि ज्ञान बुनियादी ढाँचा नष्ट होने पर क्या होता है।

Nalanda University engulfed in flames in 1193 CE

1193 में, Bakhtiyar Khilji की सेनाएँ Nalanda पहुँचीं। वहाँ जो मिला वह महज़ एक विश्वविद्यालय नहीं था, बल्कि प्राचीन दुनिया की सबसे बड़ी ज्ञान संस्था थी। 700 साल से ज़्यादा समय के लिए, Nalanda में पूरे Asia से 10,000 छात्र और 2,000 शिक्षक रहते थे। इसका पुस्तकालय, Dharmaganja ("सत्य का खज़ाना"), तीन विशाल बहु-मंजिला इमारतें थीं। जब Khilji की सेना ने इसे आग लगाई, तो वह तीन महीने तक जलता रहा।

नुकसान की परिमाण समझ से परे है। Nalanda के संग्रह में गणित, खगोल, चिकित्सा, तर्क, दर्शन, व्याकरण, और सदियों से जमा राजनीति के ग्रंथ थे। जब पुस्तकालय जला, तो वह केवल पांडुलिपियों को नष्ट नहीं करता था। वह ज्ञान की प्रसारण लाइनों को काट देता था जिन्हें पीढ़ियों से बनाए रखा गया था। पूरी विषयें लुप्त हो गईं।

जो भिक्षु बचे वे जो कर सकते थे वह ले गए। बहुत सारे Tibet भाग गए, संस्कृत पांडुलिपियाँ लेकर गए जिन्हें Tibetan मठों में अनुवाद और संरक्षण मिला। सदियों बाद, विद्वानों ने इन Tibetan अनुवादों का उपयोग भारतीय मूल पाठों का पुनर्निर्माण करने के लिए किया जिन्हें अन्यथा पूरी तरह खो गया होता। ज्ञान बचा केवल इसलिए कि इसे कॉपी किया गया था, वितरित किया गया था, और कई जगहों पर संग्रहीत किया गया था। Tibet तक पहुँचने वाले टुकड़ों ने सिद्ध किया वह सिद्धांत जो हज़ारों साल बाद डिजिटल संरक्षण को परिभाषित करेगा: अनावृत्ति ही आपदा से बचाव का एकमात्र तरीका है।

औपनिवेशिक युग ने एक अलग लेकिन समान रूप से विनाशकारी नष्ट करने का तरीका जोड़ा: जलना नहीं बल्कि व्यवस्थित निष्कर्षण। British, French, और German विद्वानों ने 18वीं और 19वीं सदियों के दौरान भारतीय संग्रहों से पांडुलिपियाँ निकालीं, अक्सर विद्वतापूर्ण संरक्षण के बहाने। Oxford का Boden Professorship of Sanskrit स्पष्टतः Colonel Boden की वसीयत से भारतीयों के धर्मांतरण में मदद करने के लिए फंड किया गया था। भारत की अपनी बौद्धिक धरोहर को Bodleian Library, Bibliotheque nationale de France, और Berlin के Staatsbibliothek को भेज दिया गया। भारतीय जो अपने सभ्यतागत ग्रंथों का अध्ययन करना चाहते थे उन्हें विदेशी संस्थाओं से अनुमति माँगनी पड़ी।

डिजिटल बुनियादी ढाँचा इस गतिविज़ि को पूरी तरह उलट देता है। एक डिजिटल पांडुलिपि सैकड़ों जगहों पर एक साथ होती है। इसे जलाया नहीं जा सकता, लूटा नहीं जा सकता, या बंद नहीं रखा जा सकता। AI उपकरण इसे तुरंत सूचीबद्ध, अनुवाद, और क्रॉस-रेफ़र कर सकते हैं। जो Khilji की सेना को तीन महीने में नष्ट करने में लगा, डिजिटल संरक्षण उसे तीन घंटों में अविनाश्य बना सकता है।

पैटर्न स्पष्ट है: सभ्यताएँ जो ज्ञान को केवल भौतिक, केंद्रीकृत संग्रहों में रखती हैं वे अगली आपदा के लिए प्रतीक्षा कर रही सभ्यताएँ हैं। डिजिटल बुनियादी ढाँचा सुविधा नहीं है। यह अस्तित्व की आवश्यकता है।

धर्मिक ज्ञान: विद्या की रक्षा की आवश्यकता

Vidya-Raksha की अवधारणा, ज्ञान की रक्षा, भारतीय सभ्यतागत सोच के ज़रिए गहरे धारा की तरह बहती है। Vidya महज़ सूचना नहीं है। धर्मिक ढाँचे में, यह सभ्यता की जमा बुद्धिमत्ता है: वास्तविकता की समझ जो हर पीढ़ी को समझदारी से जीने के लिए सक्षम करती है।

Arthashastra ज्ञान बुनियादी ढाँचे को सैन्य बुनियादी ढाँचे जितनी गंभीरता से मानता है। Kautilya ने सभी ज्ञान को चार व्यवस्थित विषयों में वर्गीकृत किया और ज़ोर दिया कि राज्य शिक्षा, संग्रह, और विद्वान प्रशिक्षण में निवेश करे। यह दान नहीं था। रणनीतिक आवश्यकता थी। एक राज्य जो अपना ज्ञान खोता है वह बुद्धिमत्ता से शासन, प्रभावी बचाव, और नई चुनौतियों के अनुकूल होने की क्षमता खो देता है।

Guru-Shishya Parampara भारत की मूल वितरित ज्ञान प्रणाली थी। एक संस्था में ज्ञान को केंद्रीकृत करने के बजाय उपमहाद्वीप भर में फैले जीवंत शिक्षकों के माध्यम से ज्ञान प्रसारित करके, भारतीय सभ्यता ने प्राकृतिक अनावृत्ति बनाई। जब Nalanda गिरा, ज्ञान हज़ारों gurukuls में बचा। जब gurukuls को दबाया गया, ज्ञान पारिवारिक परंपराओं, मंदिर प्रथाओं, और मौखिक पाठ में बचा।

डिजिटल बुनियादी ढाँचा इस प्राचीन सिद्धांत की आधुनिक अभिव्यक्ति है। ज्ञान को इतना व्यापक रूप से वितरित करो कि कोई एकल विनाश उसे मिटा न सके। माध्यम ताड़पत्र से पिक्सेल, मौखिक पाठ से AI-सूचीबद्ध डेटाबेस में बदल गया है। सभ्यतागत आवश्यकता वही है: विद्या को अक्षर बनाओ, अविनाश्य।

Vidura की शिक्षा सदियों में गूँजती है जो आश्चर्यजनक रूप से प्रासंगिक है: जो अदेखे भविष्य की योजना बनाता है वह समृद्ध होता है, जबकि विलंबी नष्ट हो जाता है। भारत की पांडुलिपियाँ सड़ रही हैं। मौखिक परंपराएँ उनके आखिरी धारकों के साथ मर रही हैं। विदेशी मंच भारतीय ज्ञान तक पहुँच का मध्यस्थ बन रहे हैं। डिजिटल सभ्यतागत बुनियादी ढाँचे का समय कल नहीं है। यह अभी है।

रक्षा: डिजिटल रीढ़ बनाना

भारतीय पुनर्जागरण किसी और के डिजिटल बुनियादी ढाँचे पर नहीं बनाया जा सकता। डिजिटल स्टैक की हर परत के लिए एक भारतीय विकल्प होना चाहिए। इसलिए नहीं कि विदेशी तकनीक अंतर्निहित रूप से बुरी है, बल्कि क्योंकि सभ्यतागत संप्रभुता स्वतंत्र रूप से संचालित होने की क्षमता की माँग करती है।

व्यक्तियों के लिए। पांडुलिपि digitisation परियोजनाओं में योगदान दो। NMM और विश्वविद्यालय-नेतृत्व वाली पहलें सक्रिय रूप से ऐसे स्वयंसेवकों की तलाश करती हैं जो स्थानीय मंदिरों, मठों, और निजी संग्रहों से पांडुलिपियों की फोटोग्राफी, सूचीकरण, और प्रतिलेखन कर सकें। भारतीय मंचों का उपयोग करो और समर्थन करो। हर उपयोगकर्ता जो Indian-built मंच चुनता है उसकी आर्थिक व्यवहार्यता को मज़बूत करता है। नेटवर्क प्रभाव दोनों तरीकों से काम करते हैं। सभ्यतागत संदर्भों में डिजिटल कौशल सीखो। भारत को हज़ारों युवा इंजीनियरों की ज़रूरत है जो Sanskrit computational linguistics और आधुनिक AI दोनों को समझते हों। यह चौराहा वह है जहाँ सभ्यतागत ज्ञान ग्राफ़ बनेगा।

समुदायों के लिए। मंदिर ट्रस्ट और मठों को अपने पांडुलिपि संग्रहों को व्यवस्थित रूप से digitise करना चाहिए। भारत की कई सबसे महत्त्वपूर्ण पांडुलिपियाँ निजी धार्मिक संग्रहों में बैठती हैं जिनका सर्वेक्षण कभी नहीं किया गया, अकेले digitise नहीं किया गया। स्मार्टफोन और मानकीकृत प्रोटोकॉल का उपयोग करके समुदाय-नेतृत्व वाला digitisation अपघटन से परे क्षति के पहले इस ज्ञान को पकड़ सकता है। सामग्री निर्माण, विशेषज्ञ समीक्षा, और वित्तीय समर्थन के माध्यम से सभ्यतागत ज्ञान मंचों का समर्थन करो।

संस्थानों के लिए। विश्वविद्यालयों को कंप्यूटर विज्ञान पाठ्यक्रम में Sanskrit computational linguistics को एकीकृत करना चाहिए। भारत को Indic भाषाओं के लिए विश्व के नेतृत्व वाले AI मॉडल बनाने चाहिए, Western मॉडल आयात नहीं करने चाहिए जो Western डेटा पर प्रशिक्षित हों। सरकारी नीति को सभ्यतागत डेटा को रणनीतिक बुनियादी ढाँचे के रूप में व्यवहार करना चाहिए। पांडुलिपि संग्रह, मंदिर रिकॉर्ड, और मौखिक परंपरा recordings को रक्षा संस्थानों के समान निवेश और सुरक्षा के योग्य माना जाना चाहिए। एक एकीकृत सभ्यतागत ज्ञान ग्राफ़ बनाने के लिए धन दो: एक खोजने योग्य, AI-संचालित मंच जो India की सभी ज्ञान परंपराओं में हर digitise पांडुलिपि, अनुवादित ग्रंथ, और सूचीबद्ध अवधारणा को जोड़े।

India Stack ने साबित किया कि एक सभ्यता एक दशक में अपनी खुद की डिजिटल रेलें बना सकती है। वही ऊर्जा, वही संस्थागत इच्छा, वही निर्भरता स्वीकार न करने की मनोवृत्ति अब India की सभ्यतागत ज्ञान की ओर निर्देशित की जानी चाहिए। तकनीक मौजूद है। पांडुलिपियाँ मौजूद हैं, अभी के लिए। ज्ञान मौजूद है, अभी के लिए। जो चाहिए वह सभ्यतागत इच्छा है इन बिंदुओं को जोड़ने की, समय, उपेक्षा, और विदेशी मंचों से पहले काम को असंभव बना दे।

Case studies

संस्कृत Silicon से मिलता है: भारत की Computational Linguistics क्रांति

2000 के दशक की शुरुआत से, IIT Bombay, University of Hyderabad, JNU, और अंतर्राष्ट्रीय संस्थाओं की शोध टीमों ने संस्कृत पर कम्प्यूटेशनल तरीके लागू करने शुरू किए। Sanskrit Heritage Engine, जिसे INRIA (France) में विकसित किया गया, रूपात्मक विश्लेषण उपकरण दिए। University of Hyderabad ने Samsaadhani मंच बनाया संस्कृत वाक्यों के स्वचालित व्याकरणीय विश्लेषण के लिए। IIT Bombay की Sanskrit NLP प्रयोगशाला ने dependency parsers और machine translation मॉडल विकसित किए। breakthrough insight यह था कि Panini का Ashtadhyayi, अपने 3,959 औपचारिक संस्कृत रूपात्मकता नियमों के साथ, पहले से ही एक कम्प्यूटेशनल व्याकरण था। शोधकर्ताओं को Western भाषाई frameworks को संस्कृत पर लागू करने की ज़रूरत नहीं थी। वे सीधे Panini की architecture पर निर्माण कर सकते थे, AI सिस्टम बनाते थे जो संस्कृत को इस तरह संसाधित करते हैं कि ऐसी व्यवस्थित व्याकरणीय परंपरा के बिना भाषाओं के लिए असंभव है।

Panini का Ashtadhyayi स्वयं ज्ञान संपीड़न का असाधारण काम था: 3,959 sutras जो एक ऐसी व्यवस्था में संस्कृत की पूरी रूपात्मकता को कोडित करते हैं कि यह प्रोग्रामिंग भाषा की तरह काम करता है। sutra परंपरा जो न्यूनतम शब्दों में अधिकतम अर्थ व्यक्त करती है (alpaksharam asandigdham) डेटा संपीड़न का धर्मिक पूर्वज है। आधुनिक कम्प्यूटेशनल भाषाविदों ने जो किया वह यह स्वीकार करना था कि भारतीय परंपरा ने 2,500 साल पहले ही औपचारिकता की समस्या को हल कर दिया था। AI परंपरा को बदल नहीं रहा है। वह इसकी पहुँच को समय और पैमाने में बढ़ा रहा है।

2020 के दशक तक, ये उपकरण संस्कृत को उन गतियों से संसाधित कर सकते हैं जो कोई मानव विद्वान नहीं कर सकता। OCR सिस्टम क्षतिग्रस्त पांडुलिपियों को पढ़ते हैं। Morphological विश्लेषक जटिल समास अभिव्यक्तियों में शब्द रूपों को पहचानते हैं। ज्ञान ग्राफ़ ग्रंथों में अवधारणाओं को जोड़ते हैं। अभी भी मुख्य रूप से शोध उपकरण होते हुए, उन्होंने AI-संचालित सभ्यतागत ज्ञान प्रणालियों की व्यवहार्यता प्रदर्शित की है जो अंततः भारत की पूरी पांडुलिपि विरासत को खोजने योग्य और सुलभ बना सकता है।

भारतीय ज्ञान प्रणालियों के लिए सबसे प्रभावी AI भारतीय बौद्धिक परंपराओं पर निर्माण किए जाने पर सबसे अच्छा काम करता है, imported Western frameworks नहीं। Panini की व्याकरण सबूत है कि भारत का अतीत भारत के डिजिटल भविष्य की कुंजी रखता है।

जैसे-जैसे बड़े भाषा मॉडल AI पर प्रभुत्व रखते हैं, वे अत्यधिक English-भाषा डेटा पर प्रशिक्षित होते हैं जो Western ज्ञान frameworks को दर्शाते हैं। Sanskrit और Indic भाषा corpora पर प्रशिक्षित indigenous AI प्रणालियों के बिना, भारत के सभ्यतागत ज्ञान की व्याख्या विदेशी कम्प्यूटेशनल मॉडल के माध्यम से की जाएगी। Sanskrit कम्प्यूटेशनल भाषाविज्ञान कोई शैक्षणिक जिज्ञासा नहीं है। यह रणनीतिक आवश्यकता है।

भारत की अनुमानित 30 मिलियन पांडुलिपियाँ मानव इतिहास में सबसे बड़े undigitized ज्ञान corpus को दर्शाती हैं। manual विद्वता प्रसंस्करण की वर्तमान दरों पर, उन सभी का अनुवाद और सूचीकरण करने में 5,000 साल से अधिक समय लगेगा। AI उपकरण इस समय सारणी को हज़ारों सालों से दशकों में घटा सकते हैं।

Nalanda की आग: जब ज्ञान के पास कोई backup नहीं था

1193 CE में, Bakhtiyar Khilji की सेना Bihar के Nalanda में महान विश्वविद्यालय परिसर तक पहुँची। Nalanda ने 700 साल से ज़्यादा समय तक निरंतर संचालन किया, पूरे Asia से 10,000 छात्र और 2,000 शिक्षकों को घर दिया। Chinese तीर्थयात्री Xuanzang, जिन्होंने 7वीं सदी में वहाँ अध्ययन किया, ने Dharmaganja ("सत्य का खज़ाना") नामक एक पुस्तकालय परिसर का वर्णन किया जो तीन विशाल बहु-मंजिला इमारतों में फैला था: Ratnasagara ("रत्नों का महासागर"), Ratnodadhi ("रत्नों का समुद्र"), और Ratnaranjaka ("रत्न-सजा")। जब Khilji की सेना ने पुस्तकालय को आग लगाई, तो आग कथित तौर पर तीन महीने तक जली। गणित, खगोल, चिकित्सा, तर्क, और दर्शन में सदियों की विद्वता के पूरे काम नष्ट हो गए। जो भिक्षु बचे वे सभी दिशाओं में भाग गए, कई Tibet, Nepal, और Southeast Asia को पांडुलिपियाँ ले गए।

Arthashastra सिखाता है कि एक बुद्धिमान शासक सैन्य संस्थानों की तरह ज्ञान बुनियादी ढाँचे की सुरक्षा करता है, यह स्वीकार करते हुए कि जमा बुद्धिमत्ता की हानि एक राज्य को क्षेत्र की हानि से अधिक स्थायी रूप से कमज़ोर करती है। Nalanda का विनाश सभ्यतागत प्रबंधन के हर सिद्धांत का उल्लंघन था। फिर भी जो भिक्षु पांडुलिपियों के साथ भाग गए वे सहज रूप से वितरित संरक्षण के धर्मिक सिद्धांत का पालन करते थे: guru-shishya parampara हमेशा सुनिश्चित करता था कि ज्ञान एक साथ कई मानव repositories में मौजूद था। Tibet को बचाए गए टुकड़ों ने इस सिद्धांत की शक्ति साबित की, जैसा कि Tibetan अनुवादों ने बाद में खोई हुई भारतीय मूल पाठों का पुनर्निर्माण करने में मदद दी।

Nalanda का विनाश मानव इतिहास में सबसे बड़ी बौद्धिक आपदाओं में से एक था। भारतीय विद्वता की पूरी विषयें हमेशा के लिए लुप्त हो गईं। कुछ ज्ञान केवल इसलिए बचा क्योंकि Tibetan भिक्षुओं ने पहले Sanskrit ग्रंथों का अनुवाद किया था, सदियों बाद आंशिक पुनर्निर्माण सक्षम किया। पुरातात्विक स्थल को 2016 में UNESCO World Heritage Site के रूप में नामित किया गया, पर ज्ञान जो कभी इसके हॉलों को भरता था कभी पूरी तरह recover नहीं किया जा सकता।

Nalanda साबित करता है कि केंद्रीकृत, केवल भौतिक ज्ञान भंडारण सभ्यतागत जोखिम का सर्वोच्च क्रम है। डिजिटल बुनियादी ढाँचा वितरित, अनावृत्त copies बनाता है जिन्हें जलाया नहीं जा सकता, सभ्यतागत ज्ञान को सच में अविनाश्य बनाता है।

आज, अनुमानित 30 मिलियन भारतीय पांडुलिपियाँ slow-motion Nalanda का सामना करती हैं: नमी, कीटों, उपेक्षा, और संस्थागत उदासीनता के माध्यम से क्षय। तत्काल digitization के बिना, भारत को दूसरी बड़ी ज्ञान हानि का सामना करना पड़ता है, इस बार आक्रमण के माध्यम से नहीं बल्कि उदासीनता के माध्यम से।

Xuanzang के रिकॉर्ड इंगित करते हैं कि Nalanda के पुस्तकालय में सात सदियों में जमा मिलियन पांडुलिपियाँ हो सकते हैं। अगर सही है, तो Nalanda की आग ने प्राचीन Library of Alexandria से ज़्यादा individual ग्रंथों को नष्ट किया।

Koo और भारत की Indigenous Social Media की खोज

2020 की शुरुआत में, Aprameya Radhakrishna और Mayank Bidawatka ने Koo launch किया, एक micro-blogging मंच जिसे Twitter का Indian विकल्प माना जाता था। समय आदर्श लगा। Twitter के भारतीय सांस्कृतिक सामग्री के खिलाफ़ सामग्री प्रबंधन पूर्वाग्रह पर बढ़ती चिंता और digital संप्रभुता पर व्यापक बहस ने एक मौका खोला। Koo ने 10 भारतीय भाषाओं का समर्थन किया और जल्दी ही government ministers, celebrities, और लाखों उपयोगकर्ताओं को आकर्षित किया। mid-2021 तक, मंच 15 मिलियन उपयोगकर्ताओं को पार कर गया। फिर भी 2024 तक, Koo बंद हो गया। User retention मुश्किल साबित हुआ क्योंकि Twitter के (बाद में X के) network प्रभाव प्रभुत्वशाली रहे। Monetization challenging था एक user base के साथ जो मुफ़्त सेवाओं का आदी था। इस बीच, ShareChat, जिसने Twitter के format की नकल करने के बजाय एक vernacular-first सामग्री निर्माण मंच बनाकर मौलिक रूप से अलग दृष्टिकोण लिया, 15 भारतीय भाषाओं में 180 मिलियन उपयोगकर्ताओं का समर्थन बनाए रखा।

Kautilya का Arthashastra सिखाता है कि नए उद्यमों को genuine रणनीतिक लाभ की पहचान करनी चाहिए न कि मौजूदा शक्ति संरचनाओं की नकल करनी चाहिए। Koo ने Twitter के format को Indian दर्शकों के लिए नकल करके incumbent के नियमों पर compete करने का प्रयास किया। Arthashastra का दृष्टिकोण asymmetric रणनीति पर ज़ोर देता है: पहचानो कि प्रतिद्वंद्वी क्या प्रदान नहीं कर सकता, और नकल के बजाय उस आधार से निर्माण करो। ShareChat की सापेक्ष सफलता इस asymmetric तर्क का अधिक बारीकी से अनुसरण करती है, Western template को अनुकूल बनाने के बजाय भारत के अनोखे linguistic और cultural landscape के लिए जमीनी स्तर से निर्माण करते हुए।

Koo की बंदी ने प्रदर्शित किया कि social media में digital संप्रभुता नकल के माध्यम से अकेले हासिल नहीं की जा सकती। एक global मंच का विकल्प बनाने के लिए या तो massive capital reserves की ज़रूरत है incumbent को पीछे छोड़ने के लिए, एक मौलिक रूप से अलग value proposition, या दोनों। ShareChat की 180+ मिलियन उपयोगकर्ताओं के साथ survival सुझाती है कि भारत में सफल होने वाले मंचों को Western templates को अंदर अनुकूल बनाने से नहीं बल्कि भारतीय ज़रूरतों और भाषाओं से बाहर की ओर निर्माण किया जाना चाहिए।

संचार में digital सभ्यतागत संप्रभुता भारतीय भाषाओं, सांस्कृतिक संदर्भों, और user व्यवहारों में जमीनी स्तर से rooted मंचों की माँग करती है। Imitation संप्रभुता नहीं है। सभ्यतागत संदर्भ से shaped innovation है।

जैसे-जैसे AI-संचालित content recommendation अधिक sophisticated होता है, algorithms जो Indians को ऑनलाइन देखते, साझा करते, और discuss करते हैं उन्हें Western cultural datasets पर प्रशिक्षित किया जाता है और Silicon Valley की editorial assumptions द्वारा governed किया जाता है। अलग आधारों पर निर्मित indigenous विकल्पों के बिना, भारत की जनता विमर्श विदेशी सांस्कृतिक frameworks के माध्यम से तेज़ी से filtered होगा।

Koo की बंदी के बावजूद, भारत की व्यापक indigenous मंच ecosystem resilience दिखाता है। ShareChat 180+ मिलियन उपयोगकर्ताओं की सेवा करता है। Kuku FM में 50+ मिलियन downloads हैं। कुल indigenous मंच उपयोगकर्ता base 300 मिलियन से अधिक है, जो भारतीय संदर्भों के लिए designed मंचों की मजबूत माँग दर्शाता है।

Reflection

आपके अपने परिवार, समुदाय, या स्थानीय मंदिर से कौन सा ज्ञान केवल भौतिक रूप या मौखिक परंपरा में संरक्षित है? इस हफ़्ते खोने से पहले आप इसे document या digitize करने के लिए कौन सा एक कदम उठा सकते हैं?
अगर Nalanda के पुस्तकालय को Khilji के आक्रमण से पहले digitize किया गया होता और multiple locations में वितरित किया गया होता, तो भारतीय बौद्धिक इतिहास का रास्ता कितना अलग हो सकता था? आपके अपने समुदाय में कौन सा ज्ञान वर्तमान में उतना ही vulnerable है जितना 1193 में Nalanda की पांडुलिपियाँ थीं?
जब एक सभ्यता का ज्ञान दूसरी सभ्यता के मालिकाना मंचों पर store, indexed, और interpreted होता है, तो कौन सच में उस ज्ञान के अर्थ को नियंत्रित करता है? क्या epistemic संप्रभुता digital संप्रभुता के बिना मौजूद हो सकती है?