当ブログの検索フォームへの検索文字列設定方法について
現在、海外からの当ブログへの検索スパムがひどい状況で、勝手ながら、ここ数日検索機能(テキスト検索・タグ検索)を停止していました。
とりあえず検索スパム対処を行ってみました。これまでと検索方法が若干異なりますので、このエントリーで周知致します。
2008.12.12:IPアドレスの規制を追加しました。タグ検索もIPアドレスで規制しています。
1.検索スパムの状況
当サイトのブログ別のログ(検索状況)は次のような状況です。
ご覧の通り、エントリーから半角英数文字列を無作為に抽出し、検索フォームに入力されています。このようなスパムと思われる検索が、800件/日のペースで、数ヶ月にわたって続いています(スパムでない検索は60件/日ほど)。
皆さんのブログにも検索スパムが飛来している可能性がありますので、ログをチェックしてみてください。
2.検索フォームの入力方法について
現在、検索機能を復旧させていますが、少し細工をしました。入力する検索文字列は下記のように設定してください。
- [検索文字列][半角スペース][このブログ名]
上記のように、検索文字列の最後に必ず「半角スペース(全角スペースでもOKです)+当サイトのブログ名(あなたのブログ名ではありません)」を入力してください。「半角スペース+ブログ名」を入力しないとエラーページに遷移します。
検索したい文字列が2つある場合は次のようになります。
- [検索文字列][半角スペース][検索文字列][半角スペース][このブログの名称]
検索文字列が3つ以上の場合も同じ要領で入力してください。
- 「MTDDC Meetup TOKYO 2015」に登壇します
- ブログ開設10周年
- 2012年上半期アクセスランキングベスト10
- MTCafe Tokyo開催のお知らせ
- 「ソーシャルコマース~ソーシャルメディア時代のショッピングと企業戦略~(仮)」刊行記念セミナー開催のお知らせ
- 書籍「MovableTypeによる実用サイト構築術 ウェブシステムとしての活用ノウハウ MT5/5.1対応」プレゼント企画
- 書籍「Facebookページプロフェッショナルガイド」プレゼント本日締め切り
- 「Facebookページプロフェッショナルガイド」3刷決定
- 書籍「Facebookページプロフェッショナルガイド」プレゼント企画
- Facebookページ「小粋空間」が300いいね!達成
- 東京電力 計画停電検索(iPhone版)
- 東北地方太平洋沖地震対策情報まとめサイト
- 「東京電力 計画停電インクリメンタル検索」バージョンアップ
- 東京電力 計画停電インクリメンタル検索
- 東京電力計画停電
≫ from trial and error
最近?でもないけど、ずいぶん前からちょっと不思議に思ってたことが... [続きを読む]
こんばんわ^^
検索スパムっていう存在!? を始めて知りました (; ̄∇ ̄A
以前、訪問者さんから聞いた話ですが、検索結果の URL をリンクするといった使い方をしたりするそうなんです。
わたし的にはセンセーショナルな使い方でなるほどっ!! と思ったわけですが、mt-search.cgi の場合そういったアクセスログも残っちゃうんですよね!?
壱さんとこのサイトの検索結果 URL は Google だったか Yahoo にインデックスされてたし・・・。
幸いわたしのとこでは検索結果の URL を表に出してないのでそういった使い方はできないのですが、MT 知ってる人ならなんてことないですもんね。
一応 mt-search.cgi もリネームしておいたほうが良さそうですね。
スパマーっていろいろ考えるもんだなぁ・・・って少し感心しちゃう今日この頃です。
いつも大変お世話になっています。m(._.)m
小粋空間さんを参考に、一昨日MT4.22にバージョンアップをしたのに
もう次のバージョンがリリースされているとは…。(;^_^A
わたしも検索スパムは、以前から気になっていましたがここ何日かは
特にひどい状況です。タグクラウドの単語がずらりと並んでいます。
検索スパムの嫌がらせには、何の意味があるのでしょうか?
あと、いつからの現象なのか不明なのですが、記事を編集している時に
確認ボタンを押して、ブログ記事のプレビューを行った際には
記事本文の下に該当の カテゴリ名 | comments[0] | trackbacks[0]と
表示されているのですが、実際にエントリしてみると…。
Permalink | | Comments [0] | Trackbacks [0] となります。
Permalink | カテゴリ名 | Comments [0] | Trackbacks [0] とするには
どのようにしたら良いのでしょうか?
お手数ですが、ご教授頂ければ幸いです。
よろしくお願い致します。
こんばんわ。
私も MT を使ってブログを運営していて、ログに検索履歴が大量に残る(1400件/day)症状に悩まされています。
ですが、そのIPを調べてみると...
crawl-*.googlebot.com.
*.crawl.yahoo.net.
msnbot-*.search.msn.com.
など、検索エンジンの bot からのアクセスがほとんどでした。
なぜ、検索エンジンがMTの検索を巡回するのかはわかりませんが。
かなり不思議です。
さらに、上の画像に載っているIPがうちのログに残っているものと同じものもあるので、同じ症状かもしれません。
一度、アクセスがあった IP を nslookup してみてはどうでしょう?
検索エンジンからの嫌がらせ?みたいで、気持ち悪いです。
>bzbellさん
こんばんは。
コメント&情報ありがとうございます。
CGIが起動するので、検索結果はインデクシングしてほしくないですね…。
>せなっち♪さん
こんばんは。
コメントありがとうございました。
ご質問の件ですが、ご利用になっているテンプレートセットは最近リリースしたものでしょうか。また「ブログ記事のメタデータ」テンプレートモジュールを編集されていないか、ご連絡頂ければ幸いです。
>technoさん
こんばんは。
情報ありがとうございました。時間をみて試してみたいと思います。
ではでは!
こんにちは、それでは少し補足させて頂きます。
しばらく MovableType 4.01-ja を利用していました。
おそらく変なところを私がイジッてしまったのでしょう、この頃から
プレビューで表示されているカテゴリ名が実際のエントリには、
表示されない症状がでていました。
12月3日に、4.01 → 4.14 → 4.22 とバージョンを上げました。
4.22で使わせて頂いているテンプレートは同日にダウンロードしました。
「template_4_2_utf8_1_11_style_liquid.zip」です。
4.22の導入では、テンプレートの初期化を行ったので正常に戻るかと
期待していたのですが…。
今回は「ブログ記事のメタデータ」、別段編集していないつもりなのです。
宜しくお願い致します。m(_._)m
こんばんは。日頃はMovableType関係の記事を拝見させて頂き、ありがとうございます。
さて、この記事で掲載されていた検索スパムですが、私のところにも1日200件位のペースでやってきていることがわかり、早速bzbellさんが話されたリネームによる対策を講じてみましたが、どうも効果が出ていません。
そこで、yujiroさんが記事の冒頭で書かれていた「検索機能を停止させる方法」をやってみたいのですが、それはどのような方法なのでしょうか?。
もし差し支えなければご教示ください。
(もしご教示頂けるようでしたら、私のメールアドレスへご連絡くださるようお願いします。)