2007-10-18

メモ

初音ミクに対するGoogle八分はあるのかもしれないし、無いのかもしれない。

各種の画像検索には文字コードキーワード形態素解析に大きなバグがあるのかもしれないし、無いかもしれない。

何らかのバグがある可能性については既にGoogleが言及しているようだ。確かに振る舞いは奇妙である。

それはそれとして画像検索の失敗には様々なファクターが関わっているため、何か一つの原因で全てが説明が付くかのように語るのは誤解を生む。

だから以下に挙げる要因もまた、起こりえる可能性の一部に過ぎない。

前提

画像検索の仕組みは様々な手段がありえるし、実際にそれぞれのサービスが様々な手段を組み合わせている。

しかし、最も重要な手がかりは「画像と隣接するテキスト」と「画像とそのキャプション」の組み合わせである。

ブログ

その結果「初音ミク」というキーワードと、そのサイトにある別の画像を紐づけてしまうため、

検索精度が著しく落ちている。

この状況は検索エンジンにとって、「キーワード」と「その中身」がランダムに組み合わされているように見える。

これはSPAMブログの典型的な特徴であるため、フィルタリングされる可能性がある。

ブログ

日本の絵師のサイトは、HTMLの文書構造が、解析に適していない(例えば、Altに代換テキストではない文言を入れたり、表を多用したレイアウトだったり)サイトがたくさんある。グーグルイメージ検索の結果を見てみると、それが原因でキーワード画像の対応づけが上手くいってないサイトも見受けられる。

  • ああ、なるほど、動画を紹介するブログの記事が邪魔で上手く画像を探せないのか、ありそうな話だ。 そういう目で改めてイメ検結果を眺めると、確かにブログが圧倒的に多い。

  • それでも商品名で検索すると、最低でも通販系のサイトでのパッケージ画像が必ずどこかに出てくる 通販系サイト(Amazn, Rakuten, はてななど)はリンクされることも多いので比較的検索ラ...

  • 初音ミクの公式の画像以外にも、通称はちゅねミクの二等身画像など キャラとしての「初音ミク」に関連する画像は、公式/非公式・ 手描き/CG・リアル/デフォルメの区別なく一切表...

    • 「ボーカロイド」で検索すると、わずかだがミクの画像が出てくる。 そのページを見てみると、画像の周囲に「初音ミク」という単語が出てこない。

    • “無断リンク禁止”の第一人者であるはずの彼女が、最近は自ら無断リンクをするように堕落してしまったのか、はたまた、「俺のコンテンツは無断リンク禁止、お前(ら)のコンテ...

  • >キャラとしての「初音ミク」に関連する画像は、公式/非公式・ >手描き/CG・リアル/デフォルメの区別なく一切表示されなくなっている。 こちらの環境では"ミク"で検索したら最...

    • >>初音ミクというキーワードでの画像解析は完璧にできている > >そんなことが「完璧に」出来る技術などどこにもない。 そうかなあ。 google の画像検索の英語版インタフェース...

      • 糞関係ないしどうでもいいけど、百度でも初音ミクで画像検索効かないからそもそも画像の方はそんなに有名じゃないんじゃないかな。 しかしこの手の話題は盛り上がりすぎ。初音層が...

      • 完璧な画像解析アルゴリズムなんてものは未だに無い。 それにキーワードと画像の紐付けは、画像とそれに付けられたキャプションとの関係のデータベースに基づくものが基本であって...

    • それらの画像があるページには(ミクという表記はあっても) 「初音ミク」という名称が一切ない不思議。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん