जलवायु

मौसम पूर्वानुमान में एएआई का इस्तेमाल करने में डेटा की कमी एक बाधा

दुनिया एआई-आधारित मौसम पूर्वानुमान की ओर बढ़ रही है लेकिन सटीक आंकड़ों की कमी भारतीय जलवायु वैज्ञानिकों के लिए एक मुश्किल स्थिति पैदा कर रही है।
हिन्दी
<p>नई दिल्ली में भारतीय मौसम विभाग का एक कर्मचारी जून, 2019 में पश्चिमी भारतीय राज्य गुजरात में दस्तक देने से पहले वायु चक्रवात की निगरानी कर रहा है। (फोटो: ऋषभ आर जैन / अलामी)</p>

नई दिल्ली में भारतीय मौसम विभाग का एक कर्मचारी जून, 2019 में पश्चिमी भारतीय राज्य गुजरात में दस्तक देने से पहले वायु चक्रवात की निगरानी कर रहा है। (फोटो: ऋषभ आर जैन / अलामी)

दुनिया भर में मौसम से जुड़ी उथल-पुथल वाली घटनाओं में काफ़ी इजाफा हो रहा है। इस बीच आर्टिफिशियल इंटेलिजेंस (एआई) और मशीन लर्निंग (एमएल) पर आधारित अत्याधुनिक मौसम पूर्वानुमान वाले मॉडल विकसित करने में अरबों डॉलर खर्च किए जा रहे हैं। गूगल और आईबीएम जैसी कंपनियां इस क्षेत्र में काम कर रही हैं जिससे सटीक और समय पर पूर्वानुमान किया जा सके।

भारत में भी जलवायु वैज्ञानिकों ने एआई के साथ प्रयोग शुरू कर दिया है। दिसंबर 2023 में पृथ्वी विज्ञान मंत्रालय के मंत्री किरेन रिजिजू ने कहा कि विभाग ने बेहतर मौसम पूर्वानुमानों के लिए एआई और एमएल की विभिन्न तकनीकों को विकसित करने और इनको बेहतर करने के लिए एक डेडिकेटेड आभासी केंद्र यानी वर्चुअल सेंटर स्थापित किया है।

इस सबसे देश में एआई-आधारित मौसम पूर्वानुमान को लेकर काफ़ी उत्साह है। हालांकि विश्वसनीय आंकड़ों की कमी इसमें एक बड़ी समस्या है ।

भारतीय प्रौद्योगिकी संस्थान यानी आईआईटी, दिल्ली में कंप्यूटर विज्ञान के प्रोफेसर अमिताभ बागची बताते हैं कि एआई-आधारित मॉडलिंग, मौजूद आंकड़ों और पिछले रुझानों के आधार पर आने वाले वक्त के मौसम के बारे में अपना आकलन देता है। बागची के अनुसार, एआई मॉडल की 95 फीसदी विकास प्रक्रिया आंकड़ों के प्रबंधन के इर्द-गिर्द घूमती है। सटीक आंकड़े इस प्रक्रिया के लिए बेहद ज़रूरी हैं। 

कश्मीर विश्वविद्यालय में असिस्टेंट जियोइंफॉर्मेटिक्स प्रोफेसर यानी सहायक भू-सूचना विज्ञान के एक प्रोफेसर इरफान राशिद कहते हैं, भारत में ऐसे आंकड़ों को इकट्ठा करना एक चुनौती है, खासकर हिमालयी क्षेत्र में। राशिद, हिमालय क्रायोस्फीयर (पृथ्वी प्रणाली के जमे हुए हिस्से) में डाटा कलेक्शन में सुधार करने के लिए जम्मू-कश्मीर और लद्दाख में 15 हिमनद झीलों यानी ग्लेशियल लेक की प्रोफाइलिंग करने वाली पृथ्वी विज्ञान मंत्रालय की एक परियोजना पर काम कर रहे हैं। यह परियोजना ग्लेशियल लेक के विस्फोट से आने वाली बाढ़ (जीएलओएफ) की एआई भविष्यवाणियों को बेहतर कर सकती है।

वह बताते हैं कि भारतीय भूवैज्ञानिक सर्वेक्षण ने हिमालय में 9,575 से अधिक ग्लेशियर दर्ज किए हैं। हालांकि 30 से कम ग्लेशियरों का विस्तृत ग्लेशियोलॉजिकल अध्ययन हुआ है। डाटा की यह कमी एआई-आधारित प्रारंभिक चेतावनी प्रणाली (ईडब्ल्यूएस) के विकास को कमज़ोर करती है।

राशिद कहते हैं कि ‘फ़िलहाल यदि हम किसी हिमनद झील में पानी की मात्रा जानना चाहते हैं, तो मूल स्थल का कोई प्राकृतिक विश्वसनीय आंकड़ा उपलब्ध नहीं है। अनुभवजन्य मॉडल पर आधारित आंकड़ा भारी अनिश्चितता से जुड़ा है। एआई और एमएल आधारित मॉडल बनाने के लिए ऐसे आंकड़ों का उपयोग ऐसे परिदृश्यों/पूर्वानुमानों की ओर ले जा सकता है, जो हो सकता है कि सटीक न निकलें।’

A red vehicle submerged in mud on a river bank, bridge in background
अक्टूबर 2023 में दक्षिण लोनाक हिमनद झील से एक भयानक बाढ़ आई। पूर्वोत्तर भारतीय राज्य सिक्किम अचानक बाढ़ की चपेट में आ गया। इससे राज्य में जनजीवन और बुनियादी ढांचे को भारी नुकसान हुआ। (फोटो: बिप्लव भूयन / अलामी)

राशिद की चिंताओं को लेकर भारत के शीर्ष जलवायु वैज्ञानिकों में से एक और पृथ्वी विज्ञान मंत्रालय के पूर्व सचिव माधवन नायर राजीवन ने भी सहमति जताई। उन्होंने कहा कि देश के डाटा सेट हिमालय तक विस्तारित नहीं हैं। इससे क्षेत्र के जटिल इलाके के लिए एआई/एमएल भविष्यवाणियों की विश्वसनीयता प्रभावित होती है। भारत में हमारे पास वर्षा, तापमान, आर्द्रता, हवा की गति आदि पर अच्छे डाटा सेट हैं, जो बुनियादी मौसम संबंधी पैरामीटर हैं। लेकिन हमारे पास हिमालय पर पर्याप्त डाटा उपलब्ध नहीं है और जीएलओएफ पर काम करने के लिए शायद ही कोई डाटा है। 

मशीन लर्निंग और मौसम पूर्वानुमान 

पारंपरिक मौसम पूर्वानुमान आम तौर पर मौसम की भविष्यवाणी करने के लिए फ़िज़िक्स पर आधारित कंप्यूटर गणना पर निर्भर है। इसके विपरीत, एआई और डीप लर्निंग (मशीन लर्निंग का एक उपसमूह) मौसम की भविष्यवाणी करने के लिए बड़ी मात्रा में रॉ, अनफिल्टर्ड और प्रोसेस्ड डाटा का उपयोग करते हैं। जब इसे पारंपरिक भौतिक मॉडल और सांख्यिकीय तरीकों के साथ मिलाकर उपयोग किया जाता है, तो यह मौसम पूर्वानुमान की सटीकता और विश्वसनीयता को बढ़ा सकते हैं।

अमेरिका के कैलिफोर्निया स्थित एक स्ट्रेटेजिक एआई सलाहकार फर्म प्रेस्सिवी एडवाइजर्स के संस्थापक और प्रबंध निदेशक मोहक शाह डायलॉग अर्थ को बताते हैं, ‘पारंपरिक मौसम पूर्वानुमान मॉडल विभिन्न शुरुआती बिंदुओं के एक समूह का उपयोग करते हैं और फिर मॉडल बनाने के लिए भौतिकी समीकरणों का उपयोग करते हैं, जो विभिन्न संभावित परिदृश्य प्रस्तुत करता है।’ हालांकि, मशीन लर्निंग ऐतिहासिक डाटा के सहसंबंधों का उपयोग करके मौसम की भविष्यवाणी को गति देता है।

शाह के अनुसार, किसी भी अन्य तकनीक की तरह मशीन लर्निंग के भी अपने फायदे और चुनौतियां हैं: ‘यह अपेक्षाकृत कम लागत वाली है… मापने योग्य भी है और मौसम की भविष्यवाणी को लोकतांत्रिक बना सकती है। लेकिन इसके उपयोग को लेकर यह मान लिया जाता है कि पर्याप्त मात्रा में विस्तृत आंकड़े उपलब्ध ही होंगे। कम से कम भारत के मामले में अभी ऐसा संभव नहीं हो पाया है। स्थानीय स्तर पर डाटा की कमी एक मूलभूत समस्या पैदा कर सकती है।’

जब मैं सचिव था, मैंने उच्चतम सरकारी अधिकारियों से स्वास्थ्य संबंधी कुछ आंकड़ों को इकट्ठा करने की कोशिश की लेकिन मुझे कोई आंकड़ा नहीं मिला। 
माधवन नायर राजीवन, भारत के शीर्ष जलवायु वैज्ञानिकों में से एक और पृथ्वी विज्ञान मंत्रालय के पूर्व सचिव

डायलॉग अर्थ को शाह बताते हैं कि आंकड़ों के अभाव की वजह से होने वाले प्रभावों को सीमित करने के लिए मशीन लर्निंग समान क्षेत्रों से आंकड़ों का उपयोग करके अनुपलब्ध जानकारी का अनुमान लगा सकती है। इससे पूर्वानुमान लगाने वालों को प्रभावी ढंग से आगे बढ़ने में मिलती है, हालांकि इच्छित परिणामों के लिए उच्च गुणवत्ता वाले आंकड़ों का कोई विकल्प नहीं है ।

शाह ने मशीन लर्निंग मॉडल की अपारदर्शी “ब्लैक बॉक्स” प्रकृति के बारे में चिंता जताई है। उनका मानना है कि पारंपरिक मौसम मॉडल की गलतियों को पहचाना जा सकता है क्योंकि ये भौतिकी समीकरणों के आधार पर विशिष्ट त्रुटियों की पहचान और सुधार की अनुमति देता है, जिनके आधार पर वे तैयार किए गए हैं। एआई/एमएल मॉडल में अक्सर ऐसी पारदर्शिता का अभाव होता है, क्योंकि वे पिछले सहसंबंधों यानी कोरिलेशंस पर आधारित होते हैं। इससे उनकी अशुद्धियों के पीछे के सटीक कारणों का पता लगाना मुश्किल हो जाता है।

आंकड़ों की दुविधा

पृथ्वी विज्ञान मंत्रालय के तहत संचालित होने वाले पुणे स्थित इंडियन इंस्टीट्यूट ऑफ ट्रॉपिकल मेटिओरॉलॉजी (आईआईटीएम) के जलवायु वैज्ञानिक रॉक्सी मैथ्यू कोल ने जलवायु संवेदनशील बीमारी डेंगू के लिए एआई-आधारित पूर्वानुमान मॉडल बनाने की खातिर आवश्यक आंकड़े प्राप्त करने के लिए संघर्ष किया है।

कोल कहते हैं, ‘हमने बारिश, तापमान और आर्द्रता सहित डेंगू की घटनाओं को प्रभावित करने वाले कई कारकों के पिछले आंकड़ों का इस्तेमाल किया है। लेकिन शहर में दैनिक बीमारी के मामलों पर स्वास्थ्य संबंधी आंकड़े प्राप्त करना एक बड़ी चुनौती थी। संबंधित एजेंसियां आंकड़े साझा करने को तैयार नहीं थीं। हमें कई दरवाजे खटखटाने पड़े। आंकड़ों के उपयोग और प्रकाशन की अनुमति प्राप्त करना एक मुश्किल काम था।’ 

कोल ने आंकड़ों की गुणवत्ता और एआई की पूर्वानुमान क्षमताओं के बीच सीधे संबंध पर प्रकाश डालते हुए कहा : ‘अगर एआई को बहुत हाई-रिज़ॉल्यूशन डाटा पर प्रशिक्षित किया जाता है, तो यह डेंगू, मलेरिया, चिकनगुनिया, आदि जैसी जलवायु-संवेदनशील बीमारियों के लिए हाई-रिज़ॉल्यूशन पूर्वानुमान देने में सक्षम होगा।’ वह कहते हैं, ‘पुणे में डेंगू के लिए एआई-आधारित मॉडलिंग को अन्य स्थानों पर दोहराया जा सकता है, बशर्ते संबंधित स्वास्थ्य विभागों के आंकड़ों तक पहुंच हो, जो एक चुनौती है।’

सरकारी वैज्ञानिकों को भी इस परेशानी का सामना करना पड़ा है। राजीवन कहते हैं, ‘यहां तक कि जब मैं सचिव था [सरकार में उच्चतम स्तर का प्रशासनिक अधिकारी], मैंने उच्चतम सरकारी अधिकारियों से स्वास्थ्य संबंधी कुछ आंकड़ों को इकट्ठा करने की कोशिश की। लेकिन कोई आंकड़ा नहीं मिला। हमारे पास सामाजिक-आर्थिक आंकड़ों को बड़े पैमाने पर संकलित और संग्रहीत करने की संस्कृति का अभाव है। यदि हम प्रभावों का अध्ययन करना चाहते हैं, तो हमें ऐसे आंकड़ों की आवश्यकता है।’ वह कहते हैं कि इसके बिना शोध वास्तविक दुनिया के लाभों में तब्दील नहीं होता है। कोल की तरह वह भी इस बात पर जोर देते हैं कि प्रौद्योगिकियां तभी अच्छी हो सकती हैं, जब उनके लिए अच्छे आंकड़े उपलब्ध कराए जाएं।

बागची भी इससे सहमत हैं। ‘मशीन लर्निंग के रूप में हमारे पास सर्वोत्तम गणितीय उपकरण उपलब्ध हैं और यही भविष्य हैं। लेकिन भारतीय संदर्भ में आंकड़ों की प्रामाणिकता, आंकड़ों की गुणवत्ता और आंकड़ों की मात्रा एक चुनौती है, जो एआई-आधारित मौसम पूर्वानुमान के विकास को प्रभावित कर सकती है।’

शाह एआई/एमएल को सब कुछ ठीक करने वाले उपकरण के बजाय एक पूरक के रूप में देखते हैं। वह कहते हैं, ‘हमें मशीन लर्निंग को अपने शस्त्रागार में एक अतिरिक्त उपकरण के रूप में देखना होगा।’ 

क्या ग्लेशियल लेक आउटबर्स्ट फ्लड की भविष्यवाणी में मदद कर सकता है एआई?

उत्तराखंड की दून घाटी में स्थित वाडिया इंस्टीट्यूट ऑफ हिमालयन जियोलॉजी, हिमनद से जुड़े खतरों के लिए एक उन्नत चेतावनी प्रणाली के विकास में अग्रणी है, इसके निदेशक कालाचंद सैन इन प्रयासों में एआई और एमएल के एकीकरण की वकालत कर रहे हैं।

सैन ने चमोली आपदा पर व्यापक शोध किया है। फरवरी 2021 में एक हिमस्खलन ने उत्तराखंड के चमोली जिले में दो जलविद्युत परियोजनाओं को गंभीर रूप से क्षतिग्रस्त कर दिया। इससे 200 से अधिक लोग हताहत हुए थे।

सैन ने डायलॉग अर्थ को बताया कि ‘हमारे अध्ययन में पाया गया कि हिमखंडों का स्खलन भूकंपीय तरंगों द्वारा शुरू किया गया प्रतीत होता है, जो मुख्य अलगाव से 2.5 घंटे पहले तक लगातार सक्रिय थे, लेकिन हम ग्लेशियरों के आसपास भूकंपीय गतिविधि की निगरानी नहीं करते हैं।’

सैन का संस्थान उत्तराखंड में जीएलओएफ के लिए संभावित जोखिम वाले क्षेत्रों की पहचान कर रहा है। उन्होंने 54 प्रस्तावित योजनाओं के अलावा, 29 मौजूदा जलविद्युत परियोजनाओं के पूरा होने के विभिन्न चरणों में होने के कारण टेक्टोनिक रूप से सक्रिय बेसिन, अलकनंदा-धौलीगंगा-ऋषि गंगा को प्राथमिकता वाले क्षेत्र के रूप में चुना है।

भारत में हमारे पास वर्षा, तापमान, आर्द्रता, हवा की गति आदि पर अच्छे डाटा सेट हैं, जो बुनियादी मौसम संबंधी पैरामीटर हैं। लेकिन हमारे पास हिमालय पर पर्याप्त डाटा उपलब्ध नहीं है और जीएलओएफ पर काम करने के लिए शायद ही कोई डाटा है। 

सैन कहते हैं, “ग्लेशियर संबंधी खतरों के एआई-आधारित एकीकृत प्रारंभिक चेतावनी प्रणाली के लिए हमें उपग्रह आंकड़े, रियल टाइम मौसम संबंधी आंकड़े, रियल टाइम हाइड्रोलॉजिकल आंकड़े, रियल टाइम भूकंपीय और जीपीएस आंकड़े और सामान्य क्षेत्र सर्वेक्षण की आवश्यकता है।” उन्होंने इस क्षेत्र में एक समर्पित ग्लेशियोलॉजिकल केंद्र स्थापित करने की तात्कालिकता पर ज़ोर दिया। इसके लिए 10-12 करोड़ रुपये के निवेश की ज़रूरत होगी।

राशिद ने 2021 की विनाशकारी चमोली हादसे और सिक्किम में 2023 के जीएलओएफ का हवाला देते हुए इस विचार को खारिज कर दिया, जो खराब निगरानी उपकरणों की मौजूदगी के बावजूद हुआ था।

वह कहते हैं, ‘अभी पूरे भारतीय हिमालयी क्षेत्र में ग्लेशियरों के आसपास कोई भूकंपीय आंकड़ा इकट्ठा नहीं किया गया है। इसके अलावा, जीएलओएफ जोखिम का कोई विस्तृत आंकड़ा नहीं है।’  मौजूदा अध्ययन टुकड़ो-टुकड़ों में बंटे हैं, जो हिमालय के हिमनद जोखिम की अधूरी तस्वीर पेश करते हैं।

राशिद पूरे क्षेत्र में ग्लेशियरों और हिमनद झीलों पर क्षेत्र आधारित आंकड़े जुटाने की एक मानकीकृत पद्धति की वकालत करते हैं। यह डाटा एक व्यापक एआई-आधारित पूर्वानुमान और चेतावनी प्रणाली विकसित करने में सहायक होगा। राशिद ने निष्कर्ष के रूप में बताया कि ‘इस विशाल कवायद के लिए धन की आवश्यकता होगी और धन तभी आएगा, जब मजबूत राजनीतिक इच्छाशक्ति होगी।’