wordpressがヤフーにインデックスされない件について思うこと

サッカーのワールドカップの運命の一戦まで時間があったので、このブログのアクセスレポートやらgoogleのウェブマスターツール・yahooのサイトエクスプローラーでインデックス状況を確認していたら、yahooのインデックス状況についに変化が。。。

このwordpressで作っているブログ、googleには現時点で200ページ程がインデックスされていて記事を追加すればしただけのページが増える順調な状態。対するヤフーにはsitemapで送信済みの230ページ程が検知はされているものの、インデックス状況のページにはタイトルページやsitemap自身を含めて13ページしかインデックスされていないというお寒い状態が長い事続いてました。

ヘッダ内にある 『<link rel=”alternate” ~ 』 でRSSの指定の仕方を色々なサイトで解説されているように修正したり、新しい記事を書いたら手動で「http://api.my.yahoo.co.jp/rss/ping?u=最新記事のアドレス」をやってみたりしたものの相変わらず駄目なまんまで数ヶ月が経過。

…で、正直なところ「もうyahooの検索なんてどうでもいいやっ!」と思っていたりしたんですが、もしかしてyahooのクローラのシステム(含むサイトエクスプローラー)って、想像以上にショボイ状態なんでは?と思いつき…robots.txtにサイトマップへのパスを書いておいたのが数日前(この時のインデックス数はもちろん13ページ)…

今サイトエクスプローラーを見たら、何をやってもダメダメだったyahooのインデックス数が…何と26ページに増えているではあ~りませんかっ!もちろんrobots.txtにパスを書いたからこうなったとは言い切れないんですが、雰囲気的には大いに関係ありそうです。sitemapでの個別記事のpriorityが0.3と低め?でこの変化なので、影響があるかは分かりませんが0.8程度に上げたsitemapをwordpressのプラグイン「XML Sitemap Generator」で生成させるように設定して、しばらく様子をみたいと思います。

まぁ内容の浅さはともかくとして、多くの方に見て頂きたいという願望は私にもありますから…(笑)

現時点でのWordPressカスタマイズ内容(2010/03/30)

月末&年度末も近い&昨日スタイルシートをいじって不完全な状態であったにも関わらず、そのまんま公開し続けた事に反省しつつ今月の総括をご報告(ん?先月末は…報告無しだったな(笑))。

 

~~~~~ 改善内容 ~~~~~

良くも悪くも、コンテンツの表題を具体的&個性的な表現に統一しました。

  「@日立市」 ← こういう表現の仕方は良く見る(ネット上)ので、検索エンジンの登録順位を考慮してやめました。

その結果どうなったかは把握してますが、「データの提供は有償」ですので今後ともヨロシク(笑)

 

【Google ウェブマスターツール】

  Googleのエンジンには順調に追加ページを認識してもらってます。こちらで生成して提供しているSiteMapに従って、順調にクロールして頂いている模様です。

 

【Yahoo サイトエクスプローラー】

  Yahooのクローラには、相変わらずあんまり好かれてないみたいです(汗)。ま、JUGEM時代とのコンテンツのダブりがペナルティ要因なんですかね?

①【松阪駅】 汽笛亭 肉うどん

②P板.comの「ワークサイズパッケージ」に参戦

  ↑ 未だに「2ページ」しか「クロール対象」になっていないと言われます。何で?ペナルティ?(涙)

 

ま、さっきのスタイルシート&背景画の変更で「スープかガソリンがなくなり次第閉店」の見てくれは完成しているんで、安心して独り言を言わせて頂きま~す。皆さん4月もヨロシクです!

現時点でのWordPressカスタマイズ内容

追加したプラグイン

  • 【WP Multibyte Patch】 日本語環境下でのマルチバイト文字の不具合修正用らしい。デフォルトで入っていたので有効化しておいた。
  • 【Akismet】 WordPress標準?の高性能スパム防止用プラグインらしい。そもそも人気サイトでは無いので当面お世話になることは無さそうだが、有効化しておいても手間が掛かるわけではないのでユーザー登録後有効化。
  • 【Google XML Sitemaps】 サイトマップ自動生成プラグイン。最初の頃は「Create your Google Sitemap Online – XML Sitemaps Generator」というサイトでWeb経由でsitemap.xmlを生成してFTPで転送していたが、トップページを指定してサーチエンジンの「クローラ」みたいな感じに、リンク構造を吸い上げて解析する為か結構作成までの時間が掛かる。こういうローカル側ですでにページ構造が分かっている情報に関しては、ローカル側で作るのがスマートなはずなので探してみると、このプラグインを見つけた。導入後は手間いらずでとっても快適。
  • 【Smart Update Pinger】 「WordPress」のデフォルトの状態は「記事の改編」をした時もpingを送信する状態で、公開中の本文の間違い等を「ちまちま」&「こっそり」修正する「作曲家で言うところのブルックナー」タイプな自分はpingサーバにとって「大迷惑野郎」になる可能性が有るので即導入。 プラグインの解説としてよく「未来への投稿予約に対してping送信しないので気をつける事」とされているが、個人的な問題点としては多用している「下書き」として一度保存した投稿を「初めて公開」した時もpingが送信されない辺りかな。まぁ、投稿のステータス管理をどうすべきかという根本的な事柄なので、最終的には自分で使いやすいプラグインを作るなりなんなりする事にして当面は迷惑を掛けない事を優先して、決め所では「手動送信」する運用で行きます。

 

使用を断念したプラグイン

  • 【WP-DBManager】 WordPressのバックアップ用プラグインとして有名&便利そうなので使いたかったのだが「mysql」「mysqldump」のコマンドを呼び出して使っているらしく、「LaCoocan」のサーバー上のコマンドのパスが分からない(未公開)為、使用不能。仕方が無いので「phpMyAdmin」のエクスポートを使ってブログデータをバックアップ中。(【WP-DB-Backup】はうまく行くみたいなので、今後確認する予定。)

アクセスアップ狙いの方策

  • 【Google ウェブマスターツール】
    ブログ立ち上げ当初から順調にクロールしてくれている模様で、現時点でgoogleの検索で「浜の宮食堂」と入れると一番上に表示されたりします(汗)ブログの内容に問題が無いか若干不安です。
  • 【Yahoo サイトエクスプローラー】
    「JUGEM」時代は普通にインデックスしてくれたのですが、「WordPress」に移行後は全く駄目で、ページトップとサイトマップの場所だけがインデックスされてる状態です。サイトマップ自体は問題なく受け取っているみたいなので「WordPress」がヤフーにインデックスされない問題を解決したページを参考に「header.php」を変更したが現時点では相変わらずインデックスされず。当サイト内に、各ページへの固定的なリンク情報を記載した普通のページを用意してクローラに見せるのが手っ取り早いかな?と思ってます。

使っているテーマ

  • 【WordPress Default 1.6】 『有名な Kubrick をもとにした「WordPress」のデフォルトテーマ』と呼ばれているものを使用中。
    このテーマのPHPのソースを眺めたり、少々いじってみたりして分かったのは「日本語環境でのデフォルト」を意識して作られたものでは無いというある意味当然の事実。これは生成されたHTMLの見た目の定義を決めている「style.css」も同様なので全般的な見直しが必要っぽい。 知識がある&デザイン的センスがある方々が公開しているテーマを使ってしまうのが一番手っ取り早いとは思うのだが、これを機会に自分のコントロール下に「WordPress」を持ってきたいので、もう少し頑張る予定。 ちなみに最初にいじったのは記事のタイトルが大きすぎる気がして、ブログの記事のタイトルを生成している「index.php」の<h2></h2>を<h3></h3>に変更。これは簡単な内容だったので問題なく結果に反映されたのだが、HTMLの論理的な構造の意味合いを守るためには<h2>の定義自体を変えなければならない事にとあるホームページの作者の方の意見で気が付き、<h2>へ再度戻して定義ファイル「style.css」にて調整(泥沼化の一因でもある)。  あと、各記事の日時の表示に時刻が出ていなかったので、get_the_time(__(‘F jS, Y’, ‘kubrick’))の後に、Webで拾ったそれっぽいコードを付け足したら、何とサーバー内部エラーになって30秒程アクセス出来ず、ブログの表示も出来なくなった。サーバー側のリソースを食うような状態のエラーを頻繁に起こすとniftyに怒られる羽目になるので、今後はローカル側でデバッグしたものを上げたいと思うが…まだローカルでのまともなデバッグはやってません。 ちなみに時刻表示を追加するのは<?php the_time(‘Y/m/d G:i:s’) ?>で出来てます。その後’F jS, Y’の意味合いは理解出来ましたが、他言語(Verilog・VHDL・e言語・C言語・C++・C#等々)を日常的に使う身としては、’F jS, Y’は使わない方が良さそう。

あと、今日になって気が付いたのは、当初から感じていた「投稿を入力するBoxの縦方向が小さすぎる」件は「設定」→「投稿設定」の一番上にある「投稿入力欄の大きさ」を設定するだけで変更可能だった。。。

「…最初に気付けやっ!」(爆)