Відео: Маленькое королевство Бена и Холли - Вылазка ⭐Лучшие моменты (Листопад 2024)
Підприємства не отримують балів за те, наскільки ефективно працює їх інфраструктура або наскільки високо вони можуть складати всі великі дані, які вони збирають. Що враховує, це якість аналітики та інтелекту, які виробляють дані.
За останні кілька років Hadoop - це слово, яке стало найбільш синонімом прийому, обробки та перетворення даних. Ця структура з відкритим кодом для розподіленого зберігання та обробки даних породила власний корпоративний простір та інтегрувала його у всі основні хмарні платформи. Hadoop - далеко не єдина технологія Big Data, про яку варто говорити, але вона стала тією, на якій будується багато інших.
Проблема для бізнесу полягає в тому, що простір Hadoop наповнений дистрибутивами та інструментами, і, як пояснив директор дослідження Gartner Нік Хюдекер, багато з них виглядають однаково. Heudecker, дослідження якого охоплює управління інформацією, включаючи простори Big Data та NoSQL, сказав, що якщо ви дивитесь на загальні варіанти обробки даних, багато постачальників пропонують дуже схожі функції.
Прорив ринку
Існує три основні стартові компанії Hadoop - Cloudera, Hortonworks і MapR - і вони постійно зростають у 2015 році. За даними Gartner, кожен має приблизно 700 клієнтів, що дають або беруть 10 відсотків, поклавши світовий ринок між 2100-2400 клієнтів Hadoop по всьому світу. Усі троє пропонують як вільний рівень, так і корпоративний рівень свого розповсюдження Hadoop, і кожен вносить значний внесок у проекти з відкритим кодом під банер Apache Software Foundation (ASF).
"Наші дані свідчать про те, що 44 відсотків використання Hadoop наразі не сплачено", - сказав Хьюдекер. "Чи є чіткий лідер? Я не думаю, що так. Усі вони захоплюють частку ринку, тому що це зовсім новий простір".
В останні кілька місяців значна частина конкуренції між трьома зводилася до конкуренції за можливості аналізу даних та креативні способи інтеграції Apache Spark, відкритого джерела обробки даних Big Data з використанням випадків від потоків даних у режимі реального часу до машинного навчання . Нещодавно MapR оголосив MapR Streams як частину "конвергентної платформи даних", що інтегрує Hadoop, Spark-обробку потоків та аналітику. Hortonworks впровадив оновлення до платформи даних Hortonworks (HDP) з аналітикою Spark в пам'яті, а Cloudera пропонує різноманітні інтеграції з відкритим кодом Spark через свою Ініціативу на одну платформу, а також пропонуючи навчальні класи Spark.
"У просторах управління інформацією та інформаційною інфраструктурою багато що відбувається, і це не все Hadoop", - пояснив Гедекер. «За швидкістю та орієнтованою на пам’ять модель Spark є величезним імпульсом, хоча розробка Spark все ще знаходиться на початковій стадії. Spark буде ще однією мовою franga в обробці даних, подібно до SQL сьогодні, і напевно показує ознаки того, що у неї є деякі ноги оскільки все більше компаній інвестують у це ".
Гедекер також підкреслив важливість хмарних гравців у Big Data; технічні гіганти, які інтегрували Hadoop та інші технології великих даних у існуючі пропозиції інфраструктури як послуга (IaaS).
Amazon Web Services (AWS) використовує свою послугу Amazon Elastic MapReduce (EMR) для хмарового оркестрування Hadoop. Microsoft пропонує цілу низку сервісів Big Data на своїй хмарній платформі Azure, що співпрацює з Hortonworks на його сервісі HDInsight для управління Apache Hadoop, Spark, HBase та Storm, а також на основі SQL-бази даних Azure Data Lake та Azure Data Analytics. IBM має як локальну платформу IBM Open для Hadoop, так і IBM BigInsights, пакет аналітики, що працює над ним, а також керовані Hadoop та Apache Spark-as-a-service у своїй хмарі Bluemix. Список продовжується, і підприємства знаходять більше застосовних випадків використання у хмарі.
"Ми вважаємо, що тільки в AWS є близько 5000 клієнтів, тож це вдвічі більше, ніж клієнтська база" чисто п'єс "разом", - сказав Гедекер. "Однією з переваг переміщення в хмару є те, що ви отримуєте екосистему. Ви можете отримати дистрибутивні Hadoop-дистрибуції на будь-якій із пропозицій IaaS. MapR доступний у всіх областях, про які ви можете подумати, крім IBM; для Cloudera та Hortonworks. Ми не бачили, щоб доступність хмари стала надто важливим фактором при виборі одного постачальника та іншого ".
Вибір стратегії даних підприємства
Як для малого середнього бізнесу (SMB), так і для зростаючого підприємства, коли інвестують у рішення для обробки даних та аналітики, Хьюдекер сказав, що визначальним фактором є те, яка платформа може забезпечити найвищий рівень обслуговування. За словами Gartner, найбільшим завданням для бізнесу є розрив у вміннях - з'ясування того, хто буде керувати платформою після її встановлення та розгортання.
"Якщо компанії шукають партнера платформи даних, хто буде допомагати їм в обробці даних? Хто допоможе їм створити аналітичний додаток? Що стосується трьох чисто ігрових Hadoop, то критерії оцінювання, як правило, існують навколо зрілість інструментів і консолей управління, інструментів управління даними та продуктивність ".
Інший цікавий аспект вибору платформи Hadoop - це відсутність лояльності. Компанії переоцінюють свою платформу Hadoop так само часто, як кожні 6-12 місяців, щоб побачити, чи компоненти для обробки даних все ще підходять правильно, через те, як швидко змінюється простір і наскільки мало великі гравці розмежуються. Хьюдекер заявив, що 20 відсотків компаній, з якими він спілкується, мають кілька дистрибуцій Hadoop, що працюють у своїх центрах обробки даних або в хмарі, або дозволяючи різним командам обирати свою платформу за вибором, або навмисно диверсифікуватися, щоб не зациклюватися лише на одній дистрибуції Hadoop.
Цей різновид диверсифікованого портфеля платформ подає те, що Френк Буйтендейк, віце-президент з дослідження Gartner та відомий аналітик, який зосередився на цифровій стратегії, називає "інформацією як перевагою". Як ви не можете вести бізнес без капіталу, робочої сили, матеріалів та фізичних чи віртуальних засобів, Буйтендейк сказав, що не можете вести бізнес без інформації.
"Ми звикли дивитися на бізнес з точки зору трьох потоків: первинний потік - товари, вторинний потік - гроші, а третинний потік - це інформація, щоб забезпечити вирівнювання товарів і грошей. Зараз у більшості підприємств це навпаки. . Основний потік - це інформація, від ідентифікації та конфігурації до контент-маркетингу тощо. Незалежно від того, ви називаєте, що Big Data чи ні, насправді не має значення ".
"Великі дані" застаріли
Буйтенджик сказав, що він не розглядає Big Data як окрему технологію для бізнесу, а як одну тему чи менталітет у вашій загальній цифровій стратегії.
"Я не вірю у створення стратегії великих даних", - сказав Буйтенджик. "Навряд чи існує бізнес-стратегія без цифрових компонентів, тому я вірю у створення цифрової стратегії, в якій всі види технологій забезпечують критичні можливості. Це включає мобільні, соціальні, хмарні, IoT, розумні машини та великі дані".
Хьюдекер вважає, що ми починатимемо говорити про "Великі дані" все рідше, тому що зараз це лише дані. Це так, як ведеться бізнес. Масивні обсяги та висока швидкість передачі даних вже не є приголомшливими.
"Великі дані знову піддаються інформацією та аналітикою", - сказав Гедекер. "Категорія Big Data відверто не відрізняється. Ми завжди запитуємо розмір ринку Big Data, але що це навіть означає? Big Data - це насправді не ринок, це концепція. Для бізнесу, думаючи про Big Data як щось унікальне та особливе, що докорінно відрізняється від того, що ви робили раніше, - це помилка. На даний момент дані просто нормальні ".