Будинки Думки Google, виправте вади! | Джон c. дворак

Google, виправте вади! | Джон c. дворак

Відео: Щенячий патруль НОВЫЕ СЕРИИ игра мультик для детей про щенков Paw Patrol Детский летсплей #ММ (Листопад 2024)

Відео: Щенячий патруль НОВЫЕ СЕРИИ игра мультик для детей про щенков Paw Patrol Детский летсплей #ММ (Листопад 2024)
Anonim

ГОЛОВНЕ ВСІ ФОТО В ГАЛЕРЕЇ

Щоб отримати свої новини, я часто сканую новини Google News, де зібрані статті з усього світу на основі того, що визначає "робот". Це все про те, що в тренді. Він, як правило, не вистачає важливих новин і повністю ігнорує важливі коментарі, як моя колонка. Натомість, схоже, він вважає за краще переходити до мертвих посилань - під якими я маю на увазі журнал Wall Street Journal, для читання потрібна передплата.

Сьогодні це справа. З CES сталася надзвичайна новина про те, що мережа блюдо зробила пропозицію придбати Clearwire. Але замість посилання на будь-яку з пов’язаних історій на безкоштовних та читаних веб-сайтах Google вирішує, що основна історія повинна надходити з журналу Wall Street Journal .

У минулому Google мав якусь угоду, яка дозволяла користувачам хоча б прочитати головний абзац або навіть всю статтю, перш ніж її заблокували платної стіни. Якщо ви не знаєте обхідного фокусу (обговорюється нижче), це більше не застосовується. Тепер ви біжите в платну стіну і все закінчено. Я вважаю, що фактичні абоненти проходять це, але мені цікаво, як боти Google отримують його, щоб знайти історію в першу чергу. Чи платить Google? Я сумніваюся в цьому. Отже, для ботів Google має бути якийсь задній кут, правда?

Це неправдиво і робить користь для користувачів Google. Google переживає всю цю проблему, щоб перемогти людей, які намагаються грати в систему, але вона дозволяє журналісту Wall Street Journal витягувати цей трюк? Це, по суті, платна за підписки на Wall Street Journal . Це те, чого хоче Google? Чи отримує Google скорочення?

Google не може бути таким важким, щоб просто виправити це роздратування. Минуло б одну хвилину - п’ять вершин. Це занадто багато роботи?

Якщо в компанії вбудований платний стін, Google взагалі не повинен шукати сайт. Боти повинні знати, що є платний стін і просто уникати пошуку. І так, я хотів би пояснити, як саме боти можуть шукати сайт, який блокується платною стіною. Це таємниця.

Заробітна плата повинна бути точно такою ж, як "robots.txt", яка сповіщає бота-сканера відходити. Але дещо риба в стосунках WSJ -Google. Найпростіший спосіб знищити всіх ботів - це метатег у файлі robots.txt, таким чином: .

ГОЛОВНЕ ВСІ ФОТО В ГАЛЕРЕЇ

Натомість WSJ спеціально блокує певні підкаталоги, але, мабуть, не всі. І дивніше все ж, якщо ви шукаєте Новини Google саме таку саму статтю, а не просто натискаєте на посилання в пробігу, ви отримуєте статтю через якийсь інший механізм.

Я кидаю виклик більш технічним читачам там, щоб зрозуміти, що відбувається з цими двома, вивчаючи файл robots.txt, який використовується WSJ . Тут відкритий публічний документ.

Незалежно від випадку, на сайтах є платні стіни з фінансових причин. Якщо вони хочуть грати в ігри зі своїм вмістом, це одне, але це має бути заборонено в результатах пошуку так само, як Google намагається перешкоджати людям, які намагаються грати в систему. Google заборонить нещасному блогеру на падінні капелюха за якусь схематичну поведінку. Як щодо того, як працювати з великими сайтами однаково?


Ви можете слідкувати за Джоном К. Двораком у Twitter @therealdvorak.

Детальніше Джон К. Дворак:

Перейдіть поза темою з Джоном К. Двораком.

ГОЛОВНЕ ВСІ ФОТО В ГАЛЕРЕЇ

Google, виправте вади! | Джон c. дворак