बड़ा डेटा प्राप्त करने में सक्षम उपकरणों का एक सेट है a बड़ी मात्रा और डेटा की विविधता.
क्योंकि इसकी एक बड़ी मात्रा और बहुत सारी विविधता है, इस डेटा की व्याख्या और पारंपरिक सॉफ़्टवेयर द्वारा संसाधित नहीं किया जा सकता है। बड़ा डेटा इसकी चपलता और बड़ी मात्रा में और विभिन्न प्रकार के डेटा की व्याख्या करने की क्षमता के कारण आया।
इस डेटा के विश्लेषण और व्याख्या के बाद, इसका उपयोग व्यावसायिक रणनीतियों में किया जा सकता है, उदाहरण के लिए।
बिग डेटा किसके लिए है?
बिग डेटा के साथ बनाया गया था जितना संभव हो उतना डेटा प्राप्त करने, पहचानने और व्याख्या करने का उद्देश्य.
इस प्रक्रिया का परिणाम कंपनियों को नए के निर्माण में एकत्रित जानकारी का उपयोग करने की अनुमति देता है उत्पाद, ग्राहक वफादारी, लक्षित दर्शकों के हित की व्याख्या, दूसरों के बीच परिस्थितियाँ।
नेटफ्लिक्स और फेसबुक जैसी कंपनियां अपने उपयोगकर्ताओं की रुचि का आकलन करने के लिए बड़े डेटा का उपयोग करती हैं और उदाहरण के लिए, उनके ब्राउज़िंग विकल्पों से मेल खाने वाली सामग्री और उत्पाद भेजती हैं।
नतीजतन, वे बड़ी संख्या में ग्राहकों को बनाए रखते हैं, क्योंकि वे हमेशा उन लोगों की इच्छाओं के प्रति चौकस रहते हैं जो उनकी सेवाओं का उपयोग करते हैं।
बड़े डेटा में कौन से डेटा प्रकार पाए जाते हैं?
संरचित डेटा
ये पारंपरिक डेटाबेस हैं, जो टेबल, कॉलम और पंक्तियों में व्यवस्थित होते हैं। इस प्रकार के डेटा वे होते हैं जिनकी व्याख्या करना आसान होता है, जैसे टेक्स्ट और नंबर।
अर्ध-संरचित डेटा
यह डेटा है जिसमें संरचित और असंरचित दोनों पैटर्न होते हैं। इस प्रकार के डेटा की व्याख्या करना अधिक कठिन होता है क्योंकि इसकी संरचना विषम होती है।
कुछ उदाहरण ऑडियो फ़ाइलें और यहां तक कि सामाजिक नेटवर्क द्वारा उत्पन्न जानकारी भी हैं।
असंरचित डेटा
यह आज का सबसे आम डेटा प्रकार है, जो बड़े डेटा में 80% से अधिक डेटा के लिए जिम्मेदार है। उदाहरण के लिए, ये छवियां, वीडियो और दस्तावेज़ हैं जिनमें स्रोतों की एक बड़ी विविधता है, यही कारण है कि संरचित डेटा के साथ वे मानकीकृत और व्याख्या करने में आसान नहीं हैं।
बड़े डेटा के 5 वी
बड़े डेटा की सामान्य संरचना को समझने के लिए, इस टूल सेट को निर्देशित करने वाले 5 वी के कार्यों को जानना आवश्यक है। क्या वो:
आयतन
आयतन और यहबड़े डेटा में मौजूद डेटा की मात्रा. यह अनुमान लगाया गया है कि 2020 तक वैश्विक स्तर पर लगभग 1 बिलियन टेराबाइट संग्रहीत होंगे।
यह मात्रा इंटरनेट पर किए गए अनगिनत प्रकार के लेन-देन से आती है, जैसे ईमेल भेजना, ऑनलाइन स्टोर पर खरीदारी करना, बैंकिंग लेनदेन, सामाजिक नेटवर्क पर बातचीत, आदि।
वैराइटी
बड़े डेटा में, विविधता को संदर्भित करता है प्राप्त विभिन्न प्रकार के डेटा साधनों द्वारा।
डेटा ज्यादातर संरचित और विश्लेषण और व्याख्या करने में आसान थे। जैसे-जैसे इंटरनेट पर तत्काल इंटरैक्शन बढ़ता गया, डेटा प्रकार भी तेज़ी से बदलते गए, जिससे अर्ध-संरचित और असंरचित डेटा उभरा।
स्पीड
गति है प्राप्त डेटा की त्वरित व्याख्या.
यह पहले से ही ज्ञात है कि बड़े डेटा में हर दिन बड़ी मात्रा में डेटा होता है, हालांकि, एक और महत्वपूर्ण विशेषता यह गति है कि यह डेटा टूल तक पहुंचता है।
चूंकि अधिकांश समय की बातचीत और लेनदेन तात्कालिक होते हैं, इसलिए इस डेटा के विश्लेषण और व्याख्या की गति यह तत्काल होना चाहिए, विशेष रूप से कंपनियों के लिए वास्तविक समय में मुद्दों को हल करने के लिए, में प्रतिस्पर्धात्मक लाभ प्राप्त करना बाज़ार।
सच्चाई
सत्यता बड़े डेटा की शक्ति है डेटा का चयन करें जो उपयोगी और उपयोग करने के लिए सत्य है.
विभिन्न संरचनाओं की विशाल मात्रा के साथ, यह पहचानना महत्वपूर्ण है कि कौन सा आने वाला डेटा उपयोगी और विश्वसनीय है।
सत्यता बड़े डेटा की सबसे बड़ी और सबसे महत्वपूर्ण विशेषताओं में से एक है क्योंकि यह वह क्षेत्र है जो सीधे प्रभावित करता है कि कंपनियों की रणनीति में क्या उपयोग किया जा सकता है या नहीं।
सत्य होने के अलावा, यह डेटा एकत्र किए गए समय से भी मेल खाना चाहिए, क्योंकि पिछली घटनाओं का जिक्र करने वाले डेटा का कोई मूल्य नहीं है।
मूल्य
मान संदर्भित करता है डेटा की व्याख्या करने वाली उपयोगिता कंपनी के लिए हो सकती है.
एक कंपनी जो बड़े डेटा को गले लगाती है, उदाहरण के लिए, ऐसे डेटा की आवश्यकता होती है जो उपयोगी हो और उसकी रणनीति के लिए मूल्य हो। अन्यथा, जो डेटा समझ में नहीं आता है या जिसका उपयोग नहीं किया जा सकता है, वह कंपनी के लिए अक्षम हो जाता है।
बड़ा डेटा कहां लागू किया जा सकता है?
बड़े डेटा का उपयोग निजी कंपनियों में इसके उपयोग से कहीं आगे जाता है। संसाधनों के इस बड़े समूह ने हमारे शहर के चारों ओर घूमने के तरीके, हम कैसे खरीदारी करते हैं और यहां तक कि हम कैसे महामारी से बचने के तरीके को बदलने में कामयाब रहे हैं।
यहां कुछ स्थितियां हैं जहां बड़ा डेटा लागू किया जा सकता है।
शहरी गतिशीलता
डेटा की तत्काल प्राप्ति और व्याख्या के साथ, आज हम जिस तरह से शहरों में आगे बढ़ते हैं, वह बहुत तेज और अधिक सटीक हो गया है।
बड़े डेटा द्वारा प्राप्त जानकारी के साथ, उदाहरण के लिए, वहां पहुंचने का सबसे अच्छा तरीका जानना संभव है अपने गंतव्य पर, सार्वजनिक परिवहन का कौन सा साधन लेना है या यह भी जानना है कि आपको कितना समय लगेगा आने के लिए।
विज्ञापन
यह बड़े डेटा के माध्यम से है कि बड़ी कंपनियां अपने ग्राहकों और संभावित ग्राहकों के व्यवहार का विश्लेषण और समझ कर पाती हैं।
इसलिए, इंटरनेट ब्राउज़ करते समय, आप अपने खोज इतिहास के आधार पर उत्पादों और सेवाओं से प्रभावित होते हैं।
सार्वजनिक और व्यक्तिगत स्वास्थ्य देखभाल
लोग जो कहते हैं या इंटरनेट पर खोजते हैं उसे बड़ा डेटा कैप्चर कर सकता है। यह बड़ी महामारियों को रोकने में मदद करता है, जब उपकरण कैप्चर करते हैं, उदाहरण के लिए, एक बड़ा एक निश्चित क्षेत्र में लोगों की संख्या फ्लू के लक्षणों या किसी अन्य के बारे में शिकायत कर रही है रोग।
इसके अलावा, बड़ा डेटा सेकंड में डीएनए अनुक्रम की व्याख्या करने में सक्षम है, जिससे बीमारियों को रोकना या उनका इलाज करना संभव हो जाता है।
यह भी देखें डेटा वेयरहाउस तथा डेटा खनन.