HOMEPAGE TIPS BLOG

ホームページ制作TOP > Web技術Tips > Googleに記事が即反映される?WordPressプラグイン『WebSub/PubSubHubbub』を試してみた
[期間限定] 標準クオリティープラン  WEBサイト制作20%OFF
失敗しないWeb制作会社の選び方
WordPress

Googleに記事が即反映される?WordPressプラグイン『WebSub/PubSubHubbub』を試してみた

WordPress2017.12.07

通常、Web サイトが Google にインデックスされるには、不定期にサイトに訪れるクローラーに見つけてもらう必用があるため、インデックスされるまでの時間が読めず、「ただ待つだけの時間」があります。

しかし Google のハブと呼ばれるサーバーに「変更があったよ」という通知を送ることで、インデックスを早めてもらうことができます。

Google に見つけてもらう」から「Google に見つけさせる」に移行できるわけですね。

この技術を PubSubHubbub もしくは WebSub と呼びます。
もともとは PubSubHubbub だったのですが、今年の 5 月に WebSub と名称を変更したようです。

WordPress では主に 2 つのプラグインがあります。

  • WebSub/PubSubHubbub
  • PuSHPress

この 2 つの違いはほぼないので、利用者が若干多い『WebSub/PubSubHubbub』の方を使ってみます。

『WebSub/PubSubHubbub』の使い方

『WebSub/PubSubHubbub』に使い方らしい使い方は特になく、インストールして有効化したら自動的に通知が送られるようになります。

設定画面には通知を送るためのハブサーバー一覧がありますが、ここはデフォルトの設定のままで問題ありません。

インデックスされる期間は短くなったのか?

『Web技術Tips』でプラグインを有効化してテストしてみました。

最初のころはあまり効果がなく、インデックスされるまでに 3 日くらいかかっていたのですが、1 ヶ月くらい経った最近ではブログを投稿したら次の日の朝には反映されるようになっています。

長く使っているうちに徐々にタームが短くなっていくのかもしれません。

反映を確認する方法 1:info 検索をしてみる

 

Google の検索ウインドウに URL を入力して検索します。

『info:https://example.com』のように、頭に [info:] を付けて検索すると URL 検索ができます。

ここに反映されていれば Google にインデックスされたことになります。

似たような条件に site を頭につける site 検索がありますが、こちらはあまり信頼性がないので info 検索を使ったほうが良いでしょう。

反映を確認する方法 2:Google のハブサーバーに問い合わせる

 

Google Pubsubhubbub Hub – Publisher debug

この URL にアクセスし、Publisher Diagnostics のほうに URL を入力して問い合わせます。

結果画面には最後に通知が送られてきた時間が保存されています。

保存されている時間に『+0000』とありますが、これはグリニッジ標準時を表しているので、日本時間ならこれを 9 時間後に変換した時間に通知が送られてきたようですね。

整理すると、記事を投稿したのは「2017/11/30 10:51」に対して通知を受け取った Google ハブが Last successful fetch したのは「2017/12/01 9:48」なので、大体 23 時間弱で反映されています。

Last successful fetch の時間とインデックスされた時間の関連性は不明ですが、だいたい 23 時間弱でインデックスされた(多分)ということにしておきます。

まとめ

プラグイン『WebSub/PubSubHubbub』の使い方と使った結果についてまとめました。

即反映というほどの早くはありませんでしたが、やらない時よりかは早くなっていました。

名前がキャッチーとは言い難いので取っ付きにくいかもしれませんが、有効化しておいて損はないプラグインだと思いました。

ちなみに、Web 制作者にとってはある意味重要な情報かもしれない、僕が WebSub を導入するに至ったきっかけを下に書いていますので、よければ併せてご覧ください。

余談……WebSub を導入するきっかけ

このブログ『Web技術Tips』はどちらかというと速報性よりも長く役に立つような便利さを重視しているため、Google にインデックスされる速度はあまり気にしていませんでした。

しかし、最近 WordPress にはブログを簡単にパクることができる戦慄のプラグインがあることを知ってしまい、考え方を改めるようになりました。

参考サイト:他人のブログを10秒でパクる方法と防御策

記事を気軽にパクれるプラグインが存在する

FeedWordPress という RSS フィードを元にアンテナサイトを作るための WordPress のプラグインがあるのですが、このプラグインを悪用すると、人の書いた記事を盗んでさもオリジナルかのように投稿することができます。

ソースコードを抽出する行為を Web スクレイピングと呼び、それによって作られたサイトをスクレイピングサイトと呼びます。

もちろん Web スクレイピングはオリジナルへのリンクや、引用の明言など適切に載せていれば問題ありません。
そもそも Google の検索エンジンがコンテンツの引用なしには成り立ちませんし。

パクりコンテンツがオリジナルよりも上に来てしまう?

参考サイト:パクりコンテンツが本家よりも上位表示、それグーグルはわざとやってるかも

そしてここからが重要なのですが、もしも「自分の書いた記事が誰かにパクられてしまい、それが Google にオリジナルと認められる」ということがあったら、かなり絶望的だと思いませんか?

どうやら、まったく同じコンテンツがあった場合、Google はどちらがオリジナルかを判断できないようです。

つまり、「オリジナルコンテンツとパクリコンテンツが、どちらがオリジナルかを賭けてタイマンバトルする」という展開になってしまい、勝負を決める材料となる「アクセス数」や「Google にインデックスされた順番」で敗北した場合、どういうことになるのか考えるだけで具合が悪くなりますよね?

パクリコンテンツに対抗するには

そもそもパクリコンテンツばかり載せているパクリサイトというのは極めてグレーな存在であるため、いきなり出現すると思われます。

つまり、前もって対策するにも限界があり、前述のタイマンバトルを避けられない場面が出てくるかもしれません。

「アクセス数」というのはコントロールできませんが、「Google にインデックスされた順番」はなんらかの対策ができそうです。

そんなわけで『WebSub/PubSubHubbub』は「Google にインデックスされた順番」に対応するために導入しました。

PAGE TOP