Будинки Бізнес Google спрощує машинне навчання за допомогою sql

Google спрощує машинне навчання за допомогою sql

Зміст:

Відео: Getting to know Cloud SQL for SQL Server (Вересень 2024)

Відео: Getting to know Cloud SQL for SQL Server (Вересень 2024)
Anonim

Зараз Google додав можливості машинного навчання (ML) до своєї програми Google Cloud BigQuery, що пропонує петабайт (PB) в масштабі хмари. Тепер, отримавши назву BigQuery ML, нова версія дозволяє використовувати прості оператори мови структурованих запитів (SQL) для створення та розгортання моделей ML для прогнозованої аналітики.

Це не просто гарна новина для науковців, які використовують Google. Це також добре для бізнес-операторів, зацікавлених у просуванні своїх можливостей аналізу даних, оскільки він додає ще одного ефективного конкурента до досить невеликого списку постачальників, здатних забезпечити цей рівень складності через хмару. Інші два найвідоміші імена - служба реляційних баз даних Amazon та Azure SQL Microsoft, і ви можете дізнатися більше в нашому недавньому раунді служби хмарних баз даних.

Основою всіх постачальників товарів і покупців даних завжди було розрив у навичках. Це особливо стосується тих, хто цікавиться питаннями ML та прогнозованої аналітики, оскільки ці дисципліни часто вимагають знання нових технологій та мов запитів.

"Для кожного вченого даних є сотні аналітиків, які працюють з даними, і більшість з них використовують SQL", - сказав PCMag Судхір Хасбе, директор з управління продуктами в Google Cloud. Щось потрібно було б дати, якщо сила армії аналітиків даних повинна бути відірвана від вузького місця, створеного занадто мало і занадто перевантаженими вченими.

Відповідь Google на цю дилему нічим не примітна. Незважаючи на те, що ML є гарячою тенденцією і з'являється у продуктах усіх видів скрізь, вона все ще є надійною територією науковців. Чимало постачальників просунулося в спрощенні технології, але потворна правда полягає в тому, що ви можете спростити її на багато, і більш ніж 99 відсоткам людського населення це ще важко використовувати. Тим не менш, нам потрібно вміти користуватися ним, оскільки ML може зробити більше, і зробити це швидше, ніж може група супер-розумних людей.

Google садить ML в Google BigQuery, щоб він знаходився ближче до даних. Додаток приносить можливості ML швидше, ніж традиційні моделі ML частково, оскільки аналітика даних може бути виконана у джерелі. Тепер у бета-версії BigQuery ML дозволяє аналітикам (і науковцям даних) запускати прогностичну аналітику, таку як прогнозування продажів та створення сегментів клієнтів прямо поверх даних, де вони зберігаються. Це одне - поважне і помітне оновлення.

Однак Google пішов далі, додавши можливість, яка дозволяє аналітикам даних використовувати прості оператори SQL для створення та розгортання моделей ML. Наразі можливі варіанти лінійної регресії та логістичної регресії для прогнозного аналізу, оскільки це дві моделі, що найчастіше використовуються.

Ось ілюстрація, яку Google надав, щоб продемонструвати, як аналітики даних використовуватимуть цю можливість:

За його словами, Google планує додати більше можливостей для ML, з часом. "Нам потрібно почути від наших клієнтів, які моделі вони хочуть, щоб ми додали, щоб ми спочатку надавали найкорисніші", - сказав він.

Додаткові оновлення Google BigQuery

Очолюючи суттєвий перелік оновлень після ML - це можливість кластеризації, географічні інформаційні системи BigQuery (BigQuery GIS), новий роз'єм даних Google Sheets та новий роз'єм даних Google Sheets.

Кластеризація також знаходиться в бета-версії, що дозволяє створювати кластеризовані таблиці в ході оптимізації даних, що поєднує рядки з подібними клавішними клавішами разом. Це зменшує витрати, оскільки покращує продуктивність і дає змогу Google BigQuery стягувати плату з користувача лише за скановані дані, а не за всю таблицю чи розділ.

ГІС BigQuery в даний час знаходиться в альфа-форматі і використовується для аналізу геопросторових даних. Коли команда Google Cloud співпрацювала з Google Earth Engine для створення BigQuery GIS, ви повинні внести свої власні геопросторові дані до таблиці. Це не є проблемою в кількох галузях, включаючи підключені автомобільні системи, Інтернет речей (IoT), виробництво, роздріб, розумні міста та телематику. Не кажучи вже про державні установи, починаючи з Агентства охорони навколишнього природного середовища (EPA) та Національного агентства геопросторової розвідки до Національної адміністрації океаніки та атмосфери (NOAA) та, звичайно, усіх військових гілок.

BigQuery GIS використовує бібліотеку S2, в якій зараз налічується понад мільярд користувачів через різноманітні продукти, такі як Google Earth Engine та Google Maps. Якщо вам потрібно більше геопросторових даних, то федеральний уряд ділиться величезною кількістю його на GeoPlatform.

Новий роз'єм даних Google Sheets, ймовірно, порадує багатьох аналітиків даних просто тому, що він такий практичний для щоденного використання. Ви можете отримати доступ до Google BigQuery з Google Таблиць (програма електронних таблиць) та використовувати інструменти Google Таблиць, такі як Explore, що є комбінованим інструментом співпраці, візуалізації даних та запитів на природній мові.

Google BigQuery тепер має новий бета-інтерфейс користувача у бета-версії. Одним з найбільш цікавих елементів є функція візуалізації одним клацанням, яку підтримує Google Data Studio. Всім сказано, це прекрасний раунд оновлень для вже елегантного сервісу. Ці оновлення будуть перевірені в наступному раунді оглядів рішення бази даних PCMag Data-As-a-Service (DBaaS) після відпрацювання помилок, і продукти вийдуть за межі відповідних альфа-та бета-статусів.

PCMag EIC Dan Costa обговорює майбутнє даних:
Google спрощує машинне навчання за допомогою sql