बिग डेटा मौसम की स्थिति की भविष्यवाणी करने की अंतिम कड़ी है। दुनिया भर में, हजारों कंपनियां, वैज्ञानिक केंद्र, संस्थान आदि, बिग डेटा का उपयोग पैटर्न को खोजने के लिए कर रहे हैं, जहां भी वे हैं, बड़ा डेटा। मौसम विज्ञान में, एक विज्ञान जिसमें बहुत बड़ी और बड़ी मात्रा में डेटा है, बिग डेटा में भी इसके उपयोगी अनुप्रयोग हैं। यह आधुनिक और शक्तिशाली उपकरण, इसका उपयोग कई तरीकों से किया जा सकता है। एक ही चीज़ के रूप में नामित होने के बावजूद, आप जो खोज रहे हैं उसके आधार पर यह कई अलग-अलग भविष्यवाणियों को प्राप्त कर सकता है। बेशक, यह मौसम विज्ञान के लिए भी आया है, और यहां हम आपको बताने जा रहे हैं कि यह क्या और कैसे करता है।
सबसे पहले, आइए याद करते हैं प्रत्याशित समय हमेशा मनुष्य की प्राथमिक आवश्यकताओं में से एक रहा है। जीवित रहने के लिए हजारों साल पहले, मौसम का पूर्वानुमान बहुत महत्वपूर्ण था, यहां तक कि आज से भी अधिक। तकनीकी विकास इतना अत्याधुनिक नहीं था, किसी भी अस्थिरता के गंभीर परिणाम हो सकते हैं। हालांकि मौसम को रोकने के लिए हमेशा से यह ज़रूरत रही है, अरस्तू के आगमन तक ऐसा नहीं था कि हम मौसम विज्ञान शब्द को गढ़ा जा सके। उन्होंने इसे "मौसम विज्ञान" कहा, नाम उन्होंने अपनी पुस्तक दिया, लगभग 340 ईसा पूर्व।
पूर्वानुमान में बिग डेटा
वायुमंडलीय व्यवहार के तर्क ने विकसित करना बंद नहीं किया है तब से। हर बार तेजी से। 1607 में थर्मामीटर के माध्यम से जा रहे हैं, जो उपग्रहों द्वारा एकत्र किए गए डेटा के आधार पर कंप्यूटर सिमुलेशन के लिए XNUMX में आविष्कार किया था। अभी, हम बिग डेटा के साथ सामना कर रहे हैं, कई इस बात से सहमत हैं इंटरनेट मौजूद होने के बाद से सबसे क्रांतिकारी उपकरण है और कम के लिए नहीं है। जैसे कि यह एक विज्ञान कथा भविष्य था, आज हम कह सकते हैं कि यह वास्तविक है।
जैसा कि हमने टिप्पणी की है, बिग डेटा ने मौसम विज्ञानियों को उस अन्य दृष्टिकोण को देखते हुए, आज कार्यभार संभालना शुरू कर दिया है। जहां वे नहीं जा सकते थे, या विश्वास किया कि वे बिना सही थे, बड़ा डेटा आपको दिखाता है कि क्या छिपा या किसी का ध्यान नहीं गया, परिशुद्धता के स्तर के साथ भी कभी नहीं पहुंचा। ऐसी कंपनियां हैं जो पहले से ही आज इन सेवाओं की पेशकश करती हैं। संस्थाएं, सरकारें और कंपनियां जो जलवायु का पूर्वानुमान लगाने के लिए बड़े डेटा का उपयोग करती हैं। लेकिन यह पूरी प्रक्रिया कैसी है? यह कैसे किया जाता है? हमें कैसे लाभ होगा? आगे हम देखेंगे और समझेंगे कि तकनीकी नवाचार की यह पूरी प्रक्रिया कैसे संभव है।
बिग डेटा कैसे काम करता है?
मोटे तौर पर, बिग डेटा डेटा पर ध्यान केंद्रित करने के लिए आकाश की ओर देखता है, और वे सही ढंग से संसाधित होते हैं। ताकि आप इसके परिमाण में अधिक समझ सकें मौसम विज्ञान के साथ निहितार्थ, पहले यह समझाने की आवश्यकता है कि यह कैसे काम करता है।
बिग डेटा में 4 वी का ऑपरेशन कहा जाता है।
आयतन
इसका मतलब है डेटा की मात्रा। यह सभी डेटा एकत्र किया गया जिसे वॉल्यूम के रूप में जाना जाता है। यह लागू होने के आधार पर भिन्न हो सकता है, कभी-कभी हमारे पास बहुत अधिक डेटा होता है और अन्य बार "कम" होता है। यही है, हम 1.000 मिलियन डेटा से कई ट्रिलियन तक जा सकते हैं, जिसके आधार पर विश्लेषण किया जाता है।
गति
मेरा मतलब है, वह दर जिस पर डेटा उत्पन्न होता है। वे उन्हें पकड़ने, स्टोर करने और उन्हें संसाधित करने की आवश्यकता से आते हैं। जितने अधिक डेटा कैप्चर होते हैं, वे उतनी ही तेजी से संग्रहित होते हैं, जितना अधिक विश्लेषण करना है। मौसम के पूर्वानुमान में गति का दोगुना महत्व है, क्योंकि घटनाएं वास्तविक समय में होती हैं, और उन्हें जल्द से जल्द संसाधित किया जाना चाहिए।
विविधता
कभी-कभी ऐसा प्रारूप होता है कि डेटा कैसे आता है, अन्य बार अन्य। प्रत्येक प्रकार के डेटा का अपना वर्गीकरण होता है। अन्य बार कुछ गायब हैं (इसे ठीक करने की तकनीकें हैं, या त्रुटियां बहुत बड़ी होंगी) और अन्य बार वे वीडियो रूपों में भी आते हैं। डेटा का एक बहुत अलग द्रव्यमान है, जो बिग डेटा में एक ऑर्डर डालने के लिए है, एक तर्क का अच्छी तरह से विश्लेषण किया जाना है। उदाहरण के लिए, थर्मामीटर से तापमान माप "सामने से उपग्रह माप के समान पैकेज में नहीं डाला जा सकता है"।
सच्चाई
पिछले बिंदु के कोष्ठक से संबंधित। इसका मतलब है कि डेटा अंत में साफ आता है, "अजीब" चीजों के बिना। बिग डेटा मैनेजमेंट टीमों के पास एक अच्छी संरचना बनाए रखने के लिए एक निष्पक्ष टीम होनी चाहिए। डेटा की खराब सत्यता के परिणामों पर बहुत नकारात्मक प्रभाव पड़ता है। एक विचार प्राप्त करने के लिए, यह ऐसा होगा जैसे कि यांत्रिकी के एक समूह ने एक कार की मरम्मत समाप्त कर दी, और वे दो पहियों को पेंच करना भूल गए।
डेटा की सत्यता पर उदाहरण
हमारे पास कई क्षेत्रों से कई रिकॉर्ड हैं। आइए कल्पना करें कि हमारे पास तापमान, नमी का स्तर, हवाएं आदि हैं। लेकिन, हमारे पास एक विफलता है, और हम किसी भी कारण से कुछ क्षेत्र के लिए कुछ तापमान रिकॉर्ड गायब कर रहे हैं, और हम यह जानने के लिए उपयोग नहीं कर सकते हैं कि तापमान क्या दर्ज किया गया है। हमारे पास कुल 30 डेटा हैं, और उनमें से दो, बिना तापमान के आखिरकार।
उदाहरण के लिए, उन क्षेत्रों के औसत तापमान की गणना करने के लिए सटीक तापमान की गणना की जा सकती है जो लापता रिकॉर्ड में गिने जा सकते हैं, लेकिन त्रुटि के बहुत कम मार्जिन के साथ भी। मान स्पेयर पार्ट्स हैं, और फिर गणना को व्यवहार में लाया जा सकता है। यदि यह डेटा गायब था, तो कंप्यूटरों ने इसे मान्यता नहीं दी होगी, डेटा में एक ब्लैक होल बनाना, और पूरी तरह से गलत भविष्यवाणियां।
आप इसे कैसे पाते है?
मौसम विज्ञान में, किसी भी क्षेत्र में, डेटा चर के रूप में आता है। यही है, हर एक को जिस तरह से होता है उसी में संसाधित किया जाता है। और यद्यपि यह बहुत जटिल और जटिल लगता है, बिग डेटा विश्लेषकों के लिए यह कार्य "आसान" हो जाता है। वे चर जिन्हें हम मौसम विज्ञान में रिकॉर्ड कर सकते हैं, हालांकि वे अभी भी डेटा हैं, वे विभिन्न परिवारों से संबंधित हो सकते हैं। यही है, एक चर कोई भी डेटा है जिसे वर्गीकृत किया जा सकता है, लेकिन वे हमेशा समान नहीं होते हैं।
ऊपर की छवि, नासा द्वारा प्रदान की गई है, यह दर्शाता है ग्रह के चारों ओर धाराओं का उदाहरण। नासा के मामले में, उनके पास बड़ी संख्या में उपग्रह हैं जो उन्हें वास्तविक समय में दुनिया भर में घटनाओं का निरीक्षण करने और मापने की अनुमति देते हैं।
बिग डेटा हर ट्रेस को पढ़ सकता है जो कुछ छोड़ता है किसी चीज़ के बारे में, और जिसे डेटा माना जा सकता है। कई जब बिग डेटा के बारे में सोचते हैं, तो वे जल्दी से सोचते होंगे कि हम मोबाइल फोन का उपयोग करते हैं, इंटरनेट पर सर्फ करते हैं, एक पृष्ठ पर क्लिक करते हैं, ऑनलाइन एक आइटम खरीदते हैं, या फेसबुक पर "पसंद" करते हैं। यह केवल एक "छोटा" लेकिन घना हिस्सा है, हां, यह बहुत विश्वसनीय और अच्छी तरह से कोडित है। लेकिन बदले में, हम एक भौतिक / आभासी ट्रेस को छोड़ देते हैं, जैसे कि हम जहां हैं, वहां जीपीएस स्थान, मोबाइल फोन के लिए धन्यवाद। यहां हम पहले से ही भौतिक के साथ आभासी दुनिया का मिश्रण करना शुरू कर देते हैं। और निश्चित रूप से, शारीरिक आंदोलनों, शारीरिक खरीद, उम्र के अनुसार, हम क्या चुनते हैं, यह सब हमेशा संग्रहीत है, और निश्चित रूप से, यह अधिक से अधिक डेटा में अनुवाद कर सकता है।
चर स्पष्ट हो सकते हैं
श्रेणीबद्ध चर वे होते हैं जो मूल्यों या सीमित चर का प्रतिनिधित्व करते हैं जो जरूरी नहीं कि एक विशिष्ट परिमाण का मतलब हो। वे जिस चीज का वर्णन करते हैं उसकी गुणवत्ता का प्रतिनिधित्व करते हैं। मूल रूप से उनकी विशिष्टता इस बात की सीमा है कि वे क्या प्रतिनिधित्व करते हैं। उन्हें दो क्षेत्रों में वर्गीकृत किया जा सकता है।
नाममात्र श्रेणीबद्ध चर
वो वो हैं जो एक तार्किक कनेक्शन के बिना एक ही क्षेत्र में चीजों का प्रतिनिधित्व करते हैं से प्रत्येक। उदाहरण के लिए: उन क्षेत्रों का नाम जो इंगित करते हैं कि रिकॉर्ड कहां से हैं, जैसे शहर, स्वायत्त समुदाय, एक पोस्टल कोड आदि।
साधारण श्रेणीबद्ध चर
वो वो हैं जो कुछ के परिमाण का प्रतिनिधित्व कर सकता है, जैसे कि तरंग स्तर में डगलस पैमाने, उस स्तर का स्तर जिसके साथ बवंडर को उनकी चमक, आदि के अनुसार वर्गीकृत किया जा सकता है।
चर संख्यात्मक हो सकते हैं
संख्यात्मक चर वे हैं जो हैं एक परिमाण के भीतर मूल्यों या चर का प्रतिनिधित्व करते हैं और औसत दर्जे का हो सकता है। वे मात्रात्मक मूल्यों का प्रतिनिधित्व करते हैं। उनकी ख़ासियत यह है कि वे मौसम संबंधी घटनाओं में माप की एक बड़ी रेंज का प्रतिनिधित्व कर सकते हैं। उन्हें दो तरह से वर्गीकृत किया जाता है
लगातार संख्यात्मक चर
सतत चर वे हैं जो हैं कुछ स्थापित मापने के प्रभारी हैं। उनके उदाहरण आर्द्रता सूचकांक, तापमान, हवा की गति, बारिश की मात्रा आदि होंगे।
संख्यात्मक चर असतत
ये ही हैं वे स्थापित कुछ का ट्रैक रखते हैं। यानी एक क्षेत्र में एक साल में जितनी बार बारिश हुई है, उतनी बार बर्फ गिरी है, आदि।
सभी चर संसाधित किए जाते हैं
एक बार सभी चर वर्गीकृत किए जाने के बाद, उन्हें कंप्यूटरों के लिए संसाधित किया जाता है, हमेशा विश्लेषकों द्वारा पर्यवेक्षण किया जाता है बिग डेटा का। कुछ साल पहले तक, डेटा की मात्रा जो बहुत बड़ी संख्या होने के बावजूद उपलब्ध थी, डेटा विश्लेषकों द्वारा विश्लेषण किए जाने के लिए कोई समस्या नहीं थी। बिग डेटा विश्लेषण, हालांकि, इस बड़े पैमाने पर डेटा के विश्लेषण के लिए जिम्मेदार है, जहां विश्लेषण प्रक्रियाएं जो आज तक आम हैं, उनमें लंबा समय लगेगा (हम भी दिनों के बारे में बात करते हैं) एक जवाब देने के लिए। इतना ही नहीं, बिग डेटा अधिक कुशल और सटीक है, उनके बीच चर के साथ "खेल" द्वारा।
यह सब उत्पन्न करता है पहले हमने बिग डेटा के 4 वी पर टिप्पणी की है, गति, विश्वसनीयता और मौसम के मॉडल जो अविश्वसनीय रूप से सटीक पूर्वानुमान देते हैं समय की एक सुपर छोटी अवधि में।
बिग डेटा एक नवजात अनुशासन के रूप में
एक अच्छा उदाहरण एसीसीओएनए कंपनी के बारे में बात करना होगा, जिसमें ए अक्षय ऊर्जा नियंत्रण केंद्र (CECOER) है। यह दुनिया का सबसे बड़ा केंद्र है जहाँ उद्देश्य वास्तविक समय में समाधान प्रदान करना है, करोड़ों डेटा जो अपनी सुविधाओं से एकत्र किए जाते हैं, दोनों बायोमास, पवन और सौर ऊर्जा। यह लगभग 3000 वार्षिक कार्यक्रम तैयार करता है जो आवश्यक मांग को समायोजित करने के लिए यह सभी डेटा लेते हैं। CECOER का एक और फायदा उन घटनाओं का स्वागत है, जो उनकी सुविधाओं से हैं, इस प्रकार उनमें से 50% को दूर से हल किया जाता है। शेष 50% ऑपरेटरों द्वारा शारीरिक रूप से तय किए गए हैं। इस तरह, Acciona को अपनी अक्षय ऊर्जा मिलती है, एक वैकल्पिक ऊर्जा होने से अधिक, आज एक समाधान हो.
बिग डेटा के बारे में एक और महत्वपूर्ण तथ्य आज डेटा वैज्ञानिकों की कमी है। यह एक नवजात क्षेत्र है, और यह कुछ पूर्व-निर्धारित मानकों में चला गया है। क्या बिग डेटा वास्तव में पूर्वानुमानों के विकास में इतनी मदद कर सकता है, कंपनियों को लाभ की सूचना दे सकता है, इतनी सारी चीजों का अनुमान लगाने और बड़े डेटा का विश्लेषण करने की लागत को सही ठहरा सकता है? हाँ। लेकिन यह कुछ ऐसा है जिसे बहुत कम लोगों ने देखा है। डेटा वैज्ञानिकों की बढ़ती मांग के परिणाम सामने आए हैं और सभी स्थानों पर उनकी आवश्यकता को समझकर। यह सच है कि शानदार परिणाम के साथ पहले से ही कई बिग डेटा टीमें काम कर रही हैं, लेकिन यह अभी है जहां हम पाते हैं कि अधिक मांग है। बिग डेटा विश्लेषकों की अत्यधिक मांग की जा रही है।
तदनुसार, हम उस क्रांति को जी रहे हैं जो वे विकास में करते हैं, लेकिन शुरुआत से। किसी भी उद्योग की तरह, हम अब इसकी क्षमता देख रहे हैं, लेकिन यह पूरी तरह से विकसित नहीं हुआ है, यह कुछ ऐसा है जो हमारे लिए समय की दुकान है। एक बात पहले से ही स्पष्ट है, इसकी वर्तमान क्षमता, दूसरा, यह कितनी दूर जा सकता है। आपके परिणाम हमें उदासीन नहीं छोड़ेंगे।
आईबीएम की द वेदर कंपनी एक निजी कंपनी है कि 26 मिलियन दैनिक पूर्वानुमान प्रदान करता है मौसम के बारे में। शुरुआत से ही आईबीएम गूगल के साथ-साथ क्षेत्र की सबसे अग्रणी कंपनियों में से एक रही है। वेदर कंपनी लोगों को मौसम के बारे में सूचित निर्णय लेने के लिए बेहद प्रतिबद्ध है। यह दुनिया का सबसे बड़ा नेटवर्क है व्यक्तिगत मौसम स्टेशनों से। विमानन, ऊर्जा, बीमा, मीडिया और सरकार में दुनिया के सबसे बड़े ब्रांड डेटा, प्रौद्योगिकी प्लेटफार्मों और सेवाओं के लिए वेदर कंपनी पर निर्भर हैं।
जलवायु परिवर्तन के खिलाफ बड़ा डेटा
संयुक्त राष्ट्र ग्लोबल पल्सकी एक बड़ी डेटा पहल संयुक्त राष्ट्र और पश्चिमी डिजिटल निगम, ने जलवायु परिवर्तन के खिलाफ एक साथ लड़ने के लिए एक गठबंधन पर हस्ताक्षर किए हैं। यह परियोजना संयुक्त राष्ट्र और पश्चिमी डिजिटल कॉर्प के नेतृत्व में है। दुनिया भर के डिजिटल नवाचार वैज्ञानिकों को एक साथ लाना समस्या का अधिक कुशल तरीके से हमला करना। उनमें से, हम उनके बीच बहुत अलग क्षेत्रों के सहयोगियों को पाते हैं। BBVA, Orange, Planet, Plume Labs, Nielsen, Schneider Electric, Waze ... उनमें से कुछ हैं जो इस परियोजना में भाग लेते हैं।
हम भी पाते हैं बार्सिलोना सुपरकंप्यूटिंग सेंटर (BSC), यह MareNostrum श्रृंखला में 4 वां मॉडल है। बिग डेटा विश्लेषण के लिए एक सुपर कंप्यूटर कई क्षेत्रों में कुंजी, उनमें से जलवायु परिवर्तन की लड़ाई भी है। इसे 2017 के जून के अंत में परिचालन में लाया गया था। यह यूरोप का तीसरा सबसे तेज कंप्यूटर है, स्पेन के अर्थव्यवस्था, उद्योग और प्रतिस्पर्धा मंत्रालय द्वारा 34 मिलियन यूरो की स्थापना के लिए इसमें एक निवेश किया गया है। इसकी क्षमता 14 पेटाबाइट यानी 14 मिलियन गीगाबाइट है। यह 11,1 पेटाफ्लॉप्स तक पहुंचता है, यानी प्रति सेकंड 11.100 बिलियन ऑपरेशन की बर्बरता।
मौसम विज्ञान के भविष्य में और हमारे जीवन में बड़ा डेटा
बदलती दुनिया में, जहां परिवर्तन तेजी से और अधिक आश्चर्यजनक होते जा रहे हैं, कुछ के भविष्य की भविष्यवाणी करना मुश्किल है। हम निश्चित रूप से जानते हैं रहने के लिए बिग डाटा आ गया है, और यह कि मौसम और अन्य क्षेत्रों में किए गए पूर्वानुमान ने हमें चिंतित कर दिया है। कुछ को संदेह रहेगा, अन्य इसे अस्वीकार करेंगे, अन्य इसे कुछ दूर के रूप में देखेंगे। लेकिन सच्चाई यह है, हम पहले से ही इसके साथ रह रहे हैं।
आज हम जानते हैं कि बिग डेटा कई बारिशों, तूफान के मौसमों का पूर्वानुमान लगाता है, और यहां तक कि बड़ी सटीकता के साथ ओलंपिक खेलों में कोई भी देश जीत सकता है। यह भी अनुमान लगाता है कि कौन, कहां और कब अपराध करने वाला है (यदि किसी ने "अल्पसंख्यक रिपोर्ट" फिल्म देखी है तो यह उनके दिमाग को पार कर गया है, ठीक है?)। बड़ा डाटा तेजी से कई क्षेत्रों के भविष्य की आशंका की ओर बढ़ रहा है, और यह है कि अमेज़ॅन भी इसकी आशा करना शुरू कर देता है, और हाल ही में ग्राहकों को खरीदारी करने से पहले ही शिपमेंट बनाने की शुरुआत हो गई है। भविष्य आज तक था, अक्सर अनिश्चित। लेकिन यह बदल रहा है भविष्य का अनुमान है।
हम जानते हैं कि इसकी क्षमता बढ़ेगी। कौन जानता है, यह अनुमान लगाने के लिए जल्दबाज हो सकता है कि कौन (बिग डेटा) कुछ का अनुमान लगाता है। लेकिन पर्याप्त डेटा के साथ, क्या बिग डेटा वैश्विक जलवायु का अनुमान लगाने में सक्षम होगा? हां। जैसा कि आप अनुमान लगा सकते हैं कि हमारे कार्य पहले दिए गए लोगों को अलग-अलग परिदृश्य देंगे, क्योंकि भविष्य में किसी भी कार्रवाई की गूंज है, और बिग डेटा इसे जानता है और इसे फिर से मूल्यांकन करता है, एक और नया परिदृश्य देता है।
हर चीज का अनुमान लगाया जा सकता है। क्या हम यह जान पाएंगे कि निकट भविष्य में हमारा क्या होगा? हम किन समस्याओं का सामना करेंगे? तूफान कब और कहां आएगा? इसे हल करने के लिए हमें क्या करना होगा? जैसे-जैसे तकनीक में सुधार होता है, कंप्यूटर दक्षता और गति में सुधार करता है, इस क्षेत्र का विकास जारी रहता है ... सबसे अधिक संभावना है यह कि "कौन जानता है" का जवाब देने के बजाय, शायद सबसे उपयुक्त बात यह होगी कि "चलो बिग डेटा पूछते हैं।"
बीए पार्टनर्स | विलिस अपडेट | मटका