Будинки Бізнес Ай бази даних: що вони є і чому ваш бізнес повинен піклуватися

Ай бази даних: що вони є і чому ваш бізнес повинен піклуватися

Зміст:

Відео: BACK TO SCHOOL J'ai déjà Je n'ai jamais // KIARA'S TOYS 💼🌷 (Листопад 2024)

Відео: BACK TO SCHOOL J'ai déjà Je n'ai jamais // KIARA'S TOYS 💼🌷 (Листопад 2024)
Anonim

Дані та бізнес-розвідка (BI) - це дві сторони однієї монети. Просування в галузі зберігання, обробки та аналізу демократизувало дані до того, що вам не потрібно бути професіоналом бази даних або вченим, який би працював з масивними наборами даних та отримував уявлення. Досі існує крива навчання, але BI та інструменти візуалізації самообслуговування переосмислюють те, як бізнес використовує всі дані, які збирає, на практичну аналітику. Однак існує різниця між BI-компанією або компанією баз даних, яка займається передовою аналітикою, і базою даних штучного інтелекту (AI), яка створена для навчання машинному навчанню (ML) та моделей глибокого навчання.

Алгоритми ML вбудовуються в тканину більшості програмного забезпечення сьогодні. Споживчий досвід поєднується з AI за допомогою віртуальних помічників, а в бізнес-програмному забезпеченні є приклади, такі як Salesforce Einstein, які виступають інтелектуальним рівнем під цілим портфелем управління відносинами з клієнтами компанії (CRM). Технологічні гіганти, включаючи Google та Microsoft, ще більше підштовхують наше інтелектуальне майбутнє не лише за допомогою досліджень, але й за допомогою переписування того, як їхні технології працюють з нуля з AI.

Однією з проблем, що стосуються моделей тренувальних машин та глибокого навчання, є повний об'єм даних та потужність обробки, необхідні для навчання нейронної мережі, наприклад, для розпізнавання складних шаблонів у таких сферах, як класифікація зображень або обробка природних мов (NLP). Отже, бази даних AI починають з'являтися на ринку як спосіб оптимізації процесу навчання та навчання AI для бізнесу. Ми розмовляли з прискореним GPU постачальником реляційних баз даних Kinetica, який створив власну базу даних AI, а також резидентом PCMag BI та експертом із баз даних Pam Baker, щоб демістифікувати, що таке база даних AI та як вона працює в порівнянні з традиційними базами даних. Що ще важливіше, ми попросили їхньої допомоги розібратися в рекламі і рекламному маркетингу, щоб визначити, чи має цей технологія справжню ділову цінність.

Що таке бази даних AI?

Швидко мінливий характер простору ШІ може ускладнити встановлення термінології. Ви часто чуєте такі терміни, як ML, глибоке навчання та AI, які взаємозамінно використовуються, коли насправді вони все ще розвивають методики під великим парасолькою ШІ. Бейкер сказав, що існує два дуже різні визначення того, що таке база даних AI, залежно від того, з ким ти спілкуєшся: одне практичне, а інше - більше простого в небі.

"У галузі існує певна думка про те, що база даних AI буде тією, яка працює повністю з натуральних мовних запитів. Інтерфейс користувача буде таким, що вам не доведеться покладатися на пошукові терміни та ключові фрази, щоб знайти потрібна інформація, що дозволяє користувачеві викликати набори даних за допомогою NLP ", - сказав Бейкер. "Ви можете зробити дуже обмежений аргумент, що IBM Watson може задавати природні мовні запити до системи, але вам потрібно вже підключитися до даних і вибирати дані самостійно. Отже, саме зараз це визначення є розтяжкою."

Більш практичне визначення та предмет цього пояснювача - це по суті використання цільової бази даних для прискорення навчання моделей ML. Ряд технологічних компаній вже розробляють спеціалізовані мікросхеми AI для зменшення великого навантаження на обробку нових апаратних продуктів, оскільки виробники впроваджують більше функцій на основі AI, які потребують значної обчислювальної потужності. Що стосується даних, використання бази даних AI може допомогти вам краще вирішити обсяг, швидкість та складні проблеми управління та управління даними, пов’язані з навчанням ML та моделей глибокого навчання, щоб заощадити час та оптимізувати ресурси.

Кредитний імідж: Тодд Жакіт на Futurism.com. Натисніть, щоб розгорнути повну інфографіку

"Наразі докладаються багато зусиль для прискорення тренувань з МЛ за допомогою декількох різних тактик", - пояснив Бейкер. "Одне - відокремити інфраструктуру від дослідників ШІ, що роблять кодування, щоб автоматизовані функції обробляли інфраструктуру та навчали модель ML. Тому, замість того, щоб витрачати щось на зразок трьох місяців, ви можете дивитися на 30 днів або 30 хвилин. "

Kinetica розбиває цю ідею на інтегрованій платформі баз даних, оптимізованій для моделювання ML та глибокого навчання. База даних AI поєднує зберігання даних, вдосконалену аналітику та візуалізацію в базі даних пам'яті. Мате Радаль, віце-президент та головний інженер програмного забезпечення групи просунутих технологій Kinetica, пояснив, що база даних AI повинна мати можливість одночасно обробляти, досліджувати, аналізувати та візуалізувати швидкі, складні дані протягом мілісекунд. Метою є зниження витрат, отримання нових доходів та інтеграція моделей ML, щоб бізнес міг приймати більш ефективні рішення, керовані даними.

"База даних AI - це підмножина загальної бази даних", - сказав Радаль. "Зараз бази даних AI користуються великою популярністю. Але багато рішень використовують розподілені компоненти. Spark, MapReduce та HDFS завжди крутяться вперед і назад, а не в пам'яті. У них немає згущення факторів, таких як наша база даних, які був побудований з нуля з тісно інтегрованими процесорами та графічними процесорами на єдиній платформі. Перевага на високому рівні для нас - це швидше забезпечення та менший технічний слід на основі модельного навчання, з швидким поворотом та аналітикою, інтегрованою в одну платформу. "

Як працює база даних AI

На практиці є ряд прикладів баз даних ШІ. Microsoft Batch AI пропонує хмарну інфраструктуру для навчання поглибленому навчанню та моделям ML, що працюють на графічних процесорах Microsoft Azure. Компанія також має свій продукт Azure Data Lake для полегшення бізнесу та науковців даних для обробки та аналізу даних у розподіленій архітектурі.

Інший приклад - підхід Google AutoML, який принципово переробляє спосіб навчання моделей ML. Google AutoML автоматизує дизайн моделі ML для створення нових архітектур нейронної мережі на основі конкретних наборів даних, а потім тестує і повторює ці тисячі разів для кодування кращих систем. Насправді, ІС Google тепер може створити кращі моделі, ніж людські дослідники.

"Подивіться на Google AutoML: ML пише код ML, щоб вам навіть не потрібні люди", - сказав Бейкер. "Це дає вам уявлення про те, яка екстремальна різниця є у тому, чим займаються постачальники. Деякі намагаються пропустити передову аналітику як ML - і це не так. А інші роблять ML на такому просунутому рівні, що виходить за рамки більшості бізнес може зрозуміти на даний момент ".

Тоді є Кінетика. Стартап із Сан-Франциско, який зібрав 63 млн. Доларів венчурного капіталу (ВК), забезпечує високоефективну базу даних SQL, оптимізовану для швидкого прийому даних та аналітики. Kinetica - це те, що Раджал описав як розподілену базу даних та обчислювальну платформу, що має паралельну обробку (MPP), в якій кожен вузол має спільно розташовані дані пам'яті, процесор та GPU.

Радаль пояснив, що база даних AI відрізняється від традиційної бази даних зводиться до трьох основних елементів:

  • Прискорене прийом даних,
  • Колокація даних в пам'яті (паралельна обробка між вузлами бази даних) та
  • Загальна платформа для науковців даних, інженерів програмного забезпечення та адміністраторів баз даних, щоб швидше повторювати та тестувати моделі та застосовувати результати безпосередньо до аналітики.

Для всіх експертів з підготовки даних, що не мають баз даних, та моделей AI, читаючи це, Радаль розбив кожний із цих трьох основних елементів і пояснив, як база даних ШІ пов'язана з відчутною діловою цінністю. Наявність даних та прийняття даних є ключовими, оскільки він здатний обробляти потокову передачу даних у режимі реального часу, дає змогу компаніям швидко вживатись із метою інтелектуальної інформації.

"У нас роздрібний клієнт хотів відслідковувати ціни продажу через магазин, кожні п'ять хвилин", - сказав Радаль. "Ми хотіли скористатися AI для прогнозування, виходячи з останніх кількох годин історичних даних, чи слід поповнювати інвентар та оптимізувати цей процес. Але для цього машинного поповнення інвентаря потрібно підтримувати 600-1200 запитів в секунду. Ми - це база даних SQL і база даних AI, тому ми можемо передавати дані з такою швидкістю. На зустрічі з цією бізнес-місією виникла програма, яка принесла більше рентабельності інвестицій.

Бейкер погодився, що для МС потрібна велика кількість даних, тому їх швидке введення в систему буде дуже важливим для бази даних ШІ. Другий фактор, концепція "спільної локалізації даних в пам'яті", має дещо більше пояснень. База даних в пам'яті зберігає дані в основній пам'яті, а не в окремому дисковому сховищі. Це робиться для швидшого опрацювання запитів, особливо в аналітичних та BI-базах даних. За спільнотою Радаль пояснив, що Kinetica не розділяє обчислювальні вузли процесора та GPU порівняно з вузлами зберігання.

В результаті база даних AI підтримує паралельну обробку, яка імітує здатність мозку людини обробляти безліч подразників, а також залишається розподіленою по масштабованій інфраструктурі баз даних. Це запобігає більшому технічному слідуванню, спричиненому тим, що Раджал назвав "доставкою даних" або необхідністю надсилати дані назад і назад між різними компонентами бази даних.

"Деякі рішення використовують оркестратор, подібний до IBM Symphony, для планування роботи над різними компонентами, тоді як Kinetica наголошує на функціонуванні доставки проти розташованих ресурсів із вдосконаленою оптимізацією для мінімізації доставки даних", - сказав Радаль. "Ця спільнота надає кращі показники продуктивності та пропускної здатності, особливо для дуже одночасних важких запитів на великих наборах даних."

Що стосується власне апаратного забезпечення баз даних, Kinetica є партнером Nvidia, який має розширення лінійки графічних процесорів AI та вивчає можливості з Intel. Радаль також заявив, що компанія слідкує за новим обладнанням AI та обласною інфраструктурою, таких як тензорні процесори Google (TPU).

Нарешті, існує ідея єдиного навчального процесу. База даних AI ефективна лише в тому випадку, якщо ті переваги прискореного прийому та переробки служать більшій, орієнтованій на бізнес цілям компанії ML та глибоким навчанням. Раджал називає базу даних AI Kinetica як "платформу модельних трубопроводів", яка виконує хостинг моделей, керованих науковими даними.

Це все піддається більш швидкому тестуванню та ітерації для розробки більш точних моделей ML. З цього приводу Бейкер заявив, що співпраця уніфікованим способом може допомогти всім інженерам та дослідникам, які працюють над навчанням МЛ або моделі глибокого навчання, ітератуватися швидше, поєднуючи те, що працює, на відміну від постійного відновлення всіх етапів навчального процесу. Радаль сказав, що мета - створити робочий процес, за допомогою якого швидше введення, передача та запит партії генерують результати моделі, які можна негайно застосувати до BI.

"Науковці даних, інженери програмного забезпечення та адміністратори баз даних мають єдину платформу, де роботу можна чітко розмежувати над самою наукою про дані, написанням програмних програм та моделями та запитами SQL", - сказав Радаль. "Люди працюють більш чітко разом у тих різних областях, коли це спільна платформа. Ціль частіше, ніж не запуск ML та глибокого навчання, - ви хочете використовувати результати цього - коефіцієнти та змінні - спільно з аналітикою, і використовуйте вихід для таких речей, як підрахунок балів або для прогнозування чогось корисного. "

Обман чи реальність?

Підсумкове значення бази даних AI, принаймні так, як визначає Kinetica, полягає в оптимізації обчислювальних та бази даних. Це, у свою чергу, дозволяє створювати кращі моделі МЛ та глибокого навчання, навчати їх швидше та ефективніше, а також підтримувати наскрізну лінію щодо того, як цей ІІ буде застосований до вашого бізнесу.

Радаль наводив приклад управління флотом або автотранспортом. У цьому випадку база даних AI може обробляти величезні потоки інформації в реальному часі з парку транспортних засобів. Потім, моделюючи ці геопросторові дані та поєднуючи їх з аналітикою, база даних може динамічно перенаправляти вантажні автомобілі та оптимізувати маршрути.

"Простіше швидко забезпечити, скласти прототип та випробувати. Слово" моделювання "в АІ є, але це все про рух на велосипеді за допомогою різних підходів - чим більше даних, тим краще - запускати їх знову і знову, тестуючи, порівнюючи та придумуючи найкращі моделі ", - сказав Радаль. "Нейрові мережі отримали життя, тому що є більше даних, ніж будь-коли раніше. І ми вчимося бути в змозі обчислити їх".

Зрештою, база даних бази даних та платформи трубопроводів Kinetica - це лише один підхід у просторі, який може означати багато різних речей залежно від того, кого ви запитуєте. Бейкер заявив, що завдання для покупця на ринку, який все ще розвивається та експериментальний, - розібратися, що саме прориває постачальник баз даних AI.

"Як бізнес-концепція, глибоке навчання, ML та все це є міцною концепцією. Те, що ми розробляємо, - це технічні проблеми, які вирішуються, навіть якщо ми їх ще не вирішили", - сказав Бейкер. "Це не означає, що це зрілий простір, тому що його точно немає. Я б сказав:" Остерігайся покупця ", бо щось таке, як ML може бути, а може і не бути. Це може бути просто розширена аналітика для садових сортів".

Щодо того, чи є зараз всі бази даних AI скаргами чи вони представляють важливу тенденцію для того, де йде бізнес, Бейкер сказав, що це трохи обох. Вона сказала, що Big Data, як маркетинговий термін, зараз не в нагоді. Бейкер сказав, що зараз існує певна ринкова зв'язок між передовою, керованою даними аналітикою та справжніми алгоритмами ML та глибокого навчання. Незалежно від того, чи говорите ви про базу даних для моделювання ML або про усвідомлені поп-культурою інтелектуальні ідеї, все починається і закінчується даними.

"Дані будуть використовуватися в бізнесі до закінчення часу; це просто головне для ведення бізнесу", - сказав Бейкер. "Коли ви говорите з точки зору наукової фантастики, AI - це самореалізований інтелект. Саме тоді ви починаєте говорити про особливості та роботів, які заволодівають світом. Це станеться чи ні, я не знаю. Я залишу що для Стівена Хокінга ".

Ай бази даних: що вони є і чому ваш бізнес повинен піклуватися