Большое количество данных набор инструментов, способных получить большой объем и разнообразие данных.
Поскольку они имеют огромный объем и большое разнообразие, эти данные не могут быть интерпретированы и обработаны обычным программным обеспечением. Большие данные появились из-за их гибкости и способности интерпретировать данные в больших объемах и разных типов.
После анализа и интерпретации этих данных их можно использовать, например, в бизнес-стратегиях.
Для чего нужны большие данные?
Большие данные были созданы с помощью цель получения, идентификации и интерпретации как можно большего количества данных.
Результат этого процесса позволяет компаниям использовать собранную информацию при создании новых продукты, лояльность клиентов, интерпретация интересов целевой аудитории и др. обстоятельства.
Такие компании, как Netflix и Facebook, используют большие данные для оценки интереса своих пользователей и, например, отправки контента и продуктов, которые соответствуют их выбору просмотра.
Следовательно, они удерживают большое количество клиентов, потому что всегда внимательно относятся к пожеланиям тех, кто пользуется их услугами.
Какие типы данных встречаются в больших данных?
структурированные данные
Это традиционные базы данных, организованные в виде таблиц, столбцов и строк. Эти типы данных легко интерпретировать, например тексты и числа.
Полуструктурированные данные
Это данные, которые имеют как структурированные, так и неструктурированные шаблоны. Этот тип данных сложнее интерпретировать, поскольку он имеет неоднородную структуру.
Некоторыми примерами являются аудиофайлы и даже информация, генерируемая социальными сетями.
Неструктурированные данные
Сегодня это наиболее распространенный тип данных, на который приходится более 80% данных в больших данных. Это, например, изображения, видео и документы, которые имеют большое разнообразие источников, поэтому они не стандартизированы и не просты для интерпретации со структурированными данными.
5 V больших данных
Чтобы понять общую структуру больших данных, необходимо знать функции 5 V, которыми руководствуется этот набор инструментов. Они:
Объем
Громкость иколичество данных, присутствующих в больших данных. По оценкам, к 2020 году во всем мире будет храниться около 1 миллиарда терабайт.
Этот объем исходит от бесчисленных типов транзакций, совершаемых в Интернете, таких как отправка электронных писем, покупки в интернет-магазинах, банковские транзакции, взаимодействие в социальных сетях и другие.
Разнообразие
В больших данных под разнообразием понимается разные типы полученных данных инструментами.
Данные были в основном структурированы и легко анализировались и интерпретировались. По мере роста мгновенных взаимодействий в Интернете типы данных также быстро менялись, из которых возникали полуструктурированные и неструктурированные данные.
Скорость
скорость мгновенная интерпретация полученных данных.
Уже известно, что большие данные содержат большой объем данных каждый день, однако другой важной характеристикой является скорость, с которой эти данные достигают инструментов.
Поскольку в большинстве случаев взаимодействия и транзакции происходят мгновенно, скорость анализа и интерпретации этих данных он должен быть незамедлительным, особенно для компаний, чтобы решать проблемы в режиме реального времени, получая конкурентное преимущество в Торговая площадка.
правдивость
Истина - сила больших данных выберите данные, которые полезны и правдивы для использования.
При огромном количестве различных структур важно определить, какие из входящих данных являются полезными и надежными.
Достоверность - одна из самых больших и важных характеристик больших данных, поскольку это область, которая напрямую влияет на то, что можно или нельзя использовать в стратегии компаний.
Эти данные должны быть не только правдивыми, но и соответствовать времени их сбора, поскольку данные, относящиеся к прошлым событиям, не представляют никакой ценности.
Значение
Значение относится полезность, которую интерпретированные данные могут иметь для компании.
Например, компании, которая занимается большими данными, нужны данные, которые полезны и имеют ценность для ее стратегии. В противном случае данные, которые не имеют смысла или не могут быть использованы, окажутся неэффективными для компании.
Где можно применить большие данные?
Использование больших данных выходит далеко за рамки их использования в частных компаниях. Этот большой набор ресурсов смог изменить то, как мы передвигаемся по городу, как делаем покупки и даже как избегаем эпидемий.
Вот несколько ситуаций, в которых можно применить большие данные.
Городская мобильность
Благодаря мгновенному получению и интерпретации данных наши передвижения по городам сегодня стали намного быстрее и точнее.
Например, с помощью информации, полученной с помощью больших данных, можно узнать, как лучше всего туда добраться. в пункте назначения, на каком общественном транспорте ехать или даже знать, сколько времени вам потребуется, чтобы добраться до места назначения. прибывать.
Реклама
Именно с помощью больших данных крупные компании могут анализировать и понимать поведение своих клиентов и потенциальных клиентов.
Вот почему при просмотре страниц в Интернете на вас влияют продукты и услуги, основанные на вашей истории поиска.
Общественное и индивидуальное здравоохранение
Большие данные могут фиксировать то, что люди говорят или исследуют в Интернете. Это помогает предотвратить крупные эпидемии, когда инструменты фиксируют, например, что количество людей в определенном регионе жалуется на симптомы гриппа или другие болезнь.
Кроме того, большие данные могут интерпретировать последовательность ДНК за секунды, что позволяет предотвращать заболевания или даже лечить их.
См. Также значение Хранилище данных а также Сбор данных.