PR

大量の「クロール済み – インデックス未登録」

「GOOGLE 検索に自分のブログが出てこない」でお伝えしたように、ブログ初心者の超ド素人の私のこのブログがグーグル検索で出てきません。タイトル通りに打ち込んでもでない始末です。

先日、掲載されない私のページを1つずつGOOGLE SEARCH CONSOL からインデックス登録リクエストを5月16日に掛けました。

またその結果は別記事で報告する予定です。

ただ、ずっと気になっていた事があります。

URLの最後に/feed または/feed/atomで終わるページが大量にインデックス未登録

GOOGLE SEARCH CONSOLのGOOGLE様巡回(クロール)の私のブログサイトの結果には、77ものページが巡回したけどインデックス未登録と出ています。

なんか、見た目嫌ですよね。これのせいで、自分のページが検索で出てこないのかな?という気にもなってしまいます。

その中でもURLの末尾に /feed/や/feed/atom/とついているものが多く散見されます。

結論から言うと、このfeedで終わるページのインデックス未登録は普通の事だそうです。

色々なサイトで情報をさがしていましたが、feedページをnoindexにして低品質ページを見つけやすくする方法という記事が一番私のケースにぴったりして、分かりやすかったです。なるほど、他の人のサイトにも同じ現象が出ているなら、ひとまず安心しました。

おまけに私が使っているWORDPRESSでは自動でこれらのページが生成されるそうなので、クロールされるのを止めるというのは、今のところやらない方向でいます。

「/feed/] や「/feed/atom/」って何のページ?

ただこの「/feed/] や「/feed/atom/」の意味が分かりませんでした。

これらのページはブログの更新情報をRSS形式、ATOM形式というデータ形式の1つとしてブログの更新情報や概要を発信しているページだそうです。(データー形式としては、他にXMLとかHTMLとかあるようですが、そんなノリのうちの1つ。)

じゃ、誰がこれを必要としているのか?というと、このデーター形式を解析する「リーダー」と呼ばれるアプリやサービス。(例えば「RSSリーダー」とか「FEEDLY」どいうアプリなどがあります)

この「リーダー」サービスとは、予め自分の気になるサイトを登録しておくと、そのサイト達の更新情報が上がってきます。わざわざ各々のページを見に行かなくても、1か所で読めるというもの。

正直、そんなものの存在すら知らなかったです。

いわゆる、機械読み取り用のページなので、検索インデックスに現れなくていいものです。

この結論に至るまでも実は時間が掛ったので、大発見の様に再度繰り返しますと、「これはユーザーの人に検索結果として挙がってくるべきページというよりは、RSSフィード、ATOMフィード発信のページなので、インデックス未登録でも大丈夫」という事です。

よし、1個疑問が解けました。

もっと深い知識つけられたら理解の仕方や結論が変わるかもしれませんが、取り敢えず、現段階は気にしないで次に進む事にします。

メモ: /feed/や /feed/atom/は小規模ブログの段階は気にしない。大きくなってきて知識が付きだしたら、クロールさせるか否か決めればよいかな。

コメント

タイトルとURLをコピーしました