Голяма информация е набор от инструменти, способни да получат голям обем и разнообразие от данни.
Тъй като има огромен обем и много разнообразие, тези данни не могат да бъдат интерпретирани и обработвани от конвенционален софтуер. Големи данни се появиха поради гъвкавостта и способността им да интерпретират данни в големи обеми и от различни видове.
След като тези данни бъдат анализирани и интерпретирани, те могат да бъдат използвани например в бизнес стратегии.
За какво са големи данни?
Големи данни бяха създадени с цел получаване, идентифициране и тълкуване на възможно най-много данни.
Резултатът от този процес позволява на компаниите да използват събраната информация при създаването на нова продукти, лоялност на клиентите, интерпретация на интереса на целевата аудитория, наред с други обстоятелства.
Компании като Netflix и Facebook използват големи данни, за да преценят интереса на своите потребители и да изпратят съдържание и продукти, които съответстват на избора им за сърфиране, например.
Следователно те задържат голям брой клиенти, защото винаги са внимателни към желанията на тези, които използват техните услуги.
Какви са типовете данни, открити в големите данни?
структурирани данни
Това са традиционни бази данни, организирани в таблици, колони и редове. Този тип данни са тези, които са лесни за интерпретация, като текстове и цифри.
Полуструктурирани данни
Това са данни, които имат както структурирани, така и неструктурирани модели. Този тип данни е по-труден за тълкуване, тъй като има разнородна структура.
Някои примери са аудио файлове и дори информация, генерирана от социалните мрежи.
Неструктурирани данни
Това е най-често срещаният тип данни днес, като представлява над 80% от данните в големи данни. Това са например изображения, видеоклипове и документи, които имат голямо разнообразие от източници, поради което не са стандартизирани и лесни за интерпретиране със структурирани данни.
5 V на големи данни
За да разберете общата структура на големите данни, е необходимо да знаете функциите на 5 V, които ръководят този набор от инструменти. Те са:
Сила на звука
Обемът иколичество данни, налични в големи данни. Смята се, че до 2020 г. в световен мащаб ще се съхраняват около 1 милиард терабайта.
Този обем идва от безброй видове транзакции, направени в интернет, като изпращане на имейли, пазаруване в онлайн магазини, банкови транзакции, взаимодействия в социалните мрежи и др.
Разнообразие
При големи данни сортът се отнася до различни видове получени данни от инструментите.
Данните бяха предимно структурирани и лесни за анализ и тълкуване. С нарастването на незабавните взаимодействия в интернет бързо се променят и типовете данни, от които се появяват полуструктурирани и неструктурирани данни.
Скорост
скоростта е незабавна интерпретация на получените данни.
Вече е известно, че големите данни имат голям обем данни всеки ден, но друга важна характеристика е скоростта, която тези данни достигат до инструментите.
Тъй като по-голямата част от времето взаимодействията и транзакциите са мигновени, скоростта на анализ и интерпретация на тези данни трябва да бъде незабавно, особено за компаниите да решават проблеми в реално време, като получават конкурентно предимство в Пазар.
достоверност
Достоверността е силата на големите данни изберете данни, които са полезни и достоверни за използване.
С огромното количество различни структури е важно да се определи коя от входящите данни е полезна и надеждна.
Достоверността е една от най-големите и най-важни характеристики на големите данни, тъй като това е областта, която пряко влияе върху това, което може или не може да се използва в стратегията на компаниите.
Освен че са верни, тези данни трябва да съответстват и на времето, в което са били събрани, тъй като данните, отнасящи се до минали събития, нямат никаква стойност.
Стойност
Стойността се отнася полезността, която интерпретираните данни могат да имат за една компания.
Фирма, която обхваща големи данни, например, се нуждае от данни, които са полезни и имат стойност за своята стратегия. В противен случай данните, които нямат смисъл или не могат да бъдат използвани, в крайна сметка са неефективни за компанията.
Къде могат да се прилагат големи данни?
Използването на големи данни далеч надхвърля използването им в частни компании. Този голям набор от ресурси успя да промени начина, по който се придвижваме из града, как пазаруваме и дори как избягваме епидемиите.
Ето някои ситуации, при които могат да се прилагат големи данни.
Градска мобилност
С незабавното получаване и интерпретиране на данните начинът, по който се движим в градовете днес, стана много по-бърз и по-точен.
Например с информацията, получена от големи данни, е възможно да се знае най-добрият начин да се стигне до там до вашата дестинация, до което обществен транспорт да поемете или дори да знаете до колко време ще ви отведе пристигам.
Реклама
Чрез големи данни големите компании са в състояние да анализират и разберат поведението на своите клиенти и потенциални клиенти.
Ето защо, когато сърфирате в интернет, вие се влияете от продукти и услуги въз основа на вашата история на търсене.
Обществено и индивидуално здравеопазване
Големите данни са в състояние да уловят това, което хората казват или изследват в интернет. Това помага за предотвратяване на големи епидемии, когато инструментите улавят, например, че голяма брой хора в определен регион се оплакват от симптоми на грип или други заболяване.
В допълнение, големите данни са в състояние да интерпретират ДНК последователност за секунди, което прави възможно предотвратяването на болести или дори тяхното излекуване.
Вижте също значението на Склад за данни и Извличане на данни.