Будинки Думки Великі дані - це лише велика афера | Джон c. дворак

Великі дані - це лише велика афера | Джон c. дворак

Відео: РС DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° клипа, 2014 (Вересень 2024)

Відео: РС DONI ft Ð¢Ð¸Ð¼Ð°Ñ Ð¸ Ð Ð¾Ñ Ð¾Ð´Ð° Ð Ñ ÐµÐ¼Ñ ÐµÑ Ð° клипа, 2014 (Вересень 2024)
Anonim

Щойно з'явився мем "великих даних" ніколи не був визначений жодним змістовним і остаточним способом. Це самий аморфний новий термін, який я бачив протягом десяти років. Це один із тих термінів "очі очі", які використовуються для оживлення семінару та врешті-решт, щоб замочити інвесторів.

Почнемо з питання, що означають великі дані? Багато даних? Більше даних, ніж ви можете обробити? Аморфні дані? Вийшли з контролю даних? Корисні дані для аналізу? Марні дані? Перевантаження інформацією?

Якщо ви читаєте достатньо про великі дані, це все вищезазначене та інше. Ключовим є не дані, а завдання, як обробляти дані та що робити з самими даними.

Іншими словами, як ми можемо зробити цю величезну купу даних, яку нам вдалося накопичити, бути корисною новими і вигідними способами? Пули даних можуть надходити з будь-якого місця через різні обчислювальні механізми, такі як повідомлення у Facebook, журнали NSA, списки розсилки, клієнти тощо.

Я заперечую, що більшість читачів цієї колонки самі є сховищами великих даних. Я щойно купив накопичувач 3 терабайт для резервного копіювання. У мене є багато даних для резервного копіювання! Великі дані!

Корисним інструментом, який я можу уявити, був би великий інструмент аналізу даних, який поліція може використати, щоб визнати вас винним у вчиненні випадкових злочинів, переглянувши ваші файли. Або хоча б знайти щось, що вас бентежить. Великі дані!

Це все суттєво повертається до коментаря колишнього генерального директора American Express, який сказав аудиторії, що якщо компанія захоче (і це стосується всіх компаній, що займаються кредитними картками), вона може використати ваші особисті звички та тенденції до купівлі досьє і обов'язково скажіть, маєте ви справу чи ні. Великі дані!

Як я можу сказати, це саме те, що найкращі дані найкраще роблять, шпигують за окремими особами.

Популярний коментар галузі полягає в тому, що якось величезні бази даних, що містять інформацію про вас, будуть використані на вашу користь. Так, ви знаєте, тому ви отримаєте речі, які вас насправді цікавлять. Цільова реклама. Це корисно для всіх!

Ось як це працює. Мені цікаво придбати нову камеру і почути про новий Bogus One. Я читаю статтю на PCMag.com про камеру, потім заходжу в Amazon і перевіряю ціни та відгуки користувачів. Схоже, нікому не подобається камера. Це очевидний шматок лайна. Усі рецензенти відхилилися від камери. Покупці ненавидять камеру. Це не камера, яку я хочу. Але програмне забезпечення для аналізу великих даних вирішує подати мені сотні рекламних оголошень на кожній веб-сторінці, яку я відвідую, і показує камеру Bogus One. Великі дані!

Це гірше. Якби все пішло в іншому напрямку, і я вирішив, що мені подобається і хотів, щоб камера і фактично придбала камеру, я все одно отримала рекламу, що заохочує мене придбати камеру. Великі дані!

Орієнтована реклама на "великі дані" - це найбільше завантаження повітряної кулі.

Добре, так що давайте забудемо це фіаско та перейдемо до використання великих даних для тенденцій. Великі дані можуть виявити різні голки в різних стогах сіна. Тож ви отримаєте щось подібне: сорок відсотків усіх покупців Subaru - вегетаріанці / вегани, а 80 відсотків - демократи. Але це число збільшилося до 60 і 90 відсотків відповідно, якщо ми говоримо про Subaru Outback. Крім того, вона збільшується до 99 відсотків вегетаріанців / веганів і 99 відсотків демократів, якщо автомобіль пофарбований у зелений колір.

Теоретики великих даних мали б день проведення семінару з цією інформацією. Але він ігнорує всі змінні, які можуть змінити розрахунки та тенденції, які нескінченні. Скільки часу буде тримати будь-яка з цих особливо великих даних, якщо генеральний директор Subaru під'їде до зборів у зеленій глибинці та заявить, що "Усі кити повинні бути знищені!"?

Навіть не потрібно так багато, щоб змінити динаміку висновків великих даних. Незважаючи на те, що каже хлопець American Express, дані насправді сліпі. Ось чому ви отримуєте рекламу вже придбаних товарів.

Великі дані допоможуть вам прийти до висновків.

Якщо хтось купує десять книг про те, як зробити бомбу, чи означає це, що він хоче підірвати Федеральну будівлю? Що робити, якщо він був експертом з вибуху бомб, і це не було включено до його посади на посаді консультанта поліції? Великі дані поки не можуть знати все. Він не може знати, що ти думаєш. Я думаю, наприклад, що камера Bogus One смокче. Великі дані не можуть цього знати, якщо мене не допитують. І я можу збрехати про це.

Нічого з цього не звучить ні здорово, ні здорово для суспільства. Спішаючи на висновки, роблячи припущення, діючи на помилкові припущення. Зловживання громадськості з марними с.

Великі дані, як висока концепція, ніколи не визначать себе повністю і померти нещасною смертю. Я сподіваюсь.

Великі дані - це лише велика афера | Джон c. дворак