はてなキーワード: 検索エンジンとは
エンジニアでも関係者でもなんでもないので、ことの真偽についてはいろいろな意見があるだろうが、Google以前の検索事情が懐かしくて面白かった。
昔は検索といえば、Yahoo!だった。ブラウザのホームページに設定されてたから。
Yahoo!以外から他のサイトに移動する方法を知らなかった。
昔は「アングラサイト」という言葉があったが、実感としてはアングラサイトはYahoo!から移動できないというイメージだった。
しかし、どっかのコミュニティで他の検索エンジンを覚え、各検索サイトで結果に差があることを知った。
そんな中、評判になってたのがGoogleだった。
googleはすごかった。なんでも出てくる。
今で言う、中国の百度のような感じ(今では百度もそうとう浄化されてるけど)。
その頃から、昔のようなGoogleに対するアングラ感が薄れていった。
gmail、YouTube、Androidと次々に出る新サービスがことごとく成功し、Google一強になってしまった世界には、つまらないインターネットが待っていた。
http://anond.hatelabo.jp/20170222214739 はホットエントリにブクマする層のみを追跡したが、実際何人いるのか数字を見かけた記憶がない。
2008年の記事によるとアカウント数は15万人だったらしいが、あまり突き詰めて分析していなかったようだ。2008年5月だから前記事のアクティブユーザー8,147IDの約1年後、20,011IDの約2年前の話ということになる。
naoya氏のインタビュー記事「今夏に新はてなブックマーク登場--その進化と情熱」
2008年05月13日 08時00分 https://japan.cnet.com/article/20372715/
いま、登録ユーザーさん、要ははてなブックマークのアカウントを持っている人が15万人ぐらいで、アクティブ率は正確にはわからないんですが、半分弱ぐらい。何をもってアクティブにするかという問題もありますが、6, 7万人くらいの人がアクティブに利用していて、あとはてなブックマークを見ているだけの人が300万人ぐらいいます。
その300万人というのも、月間ユニークユーザーというデータですので、ピンキリですね。検索エンジン経由でやってきてちょこっと見たというだけの人と、ブックマークはしないけれど毎日見ている人とでは全然違うと思いますが、把握している範囲ではそういった感じです。
2008年だが別の角度からはてなブックマーカーを分析されている方がいた
Life like a clown 「アルファブックマーカーは誰だ」 http://d.hatena.ne.jp/tt_clown/20081016/p1
はてなキーワードのnaoyaの項目がnaoyaではなく元ZOOのダンサーになっているのが時の流れを感じる。 http://d.hatena.ne.jp/keyword/naoya
はてな社員は項目にならないのかとも思ったがreikonはreikonで解説されている。はてな社内ではタブー扱いなんだろうか?
10年以上前に、ネトゲのプレイ日記を書いてる人ですごく好きなサイトがあった。
著者はそのサイトをたたんで、後に小説を書いてた。小説も好きだった。
当時その方のプレイ日記のサイトは人気があって、私なんかがコンタクトを取るのは憚られるなと思ってた。
時は経ち、久しぶりに作品を読みたいなと思って検索してみたら、驚くほどに活動の痕跡がインターネット上から消えてた。
0.5回/年ぐらいのペースで読み返してたけど、読み返す度に検索がしづらくなっていってるな、とは思っていた。
新しい活動を始める度にそれまで活動してたサイトはほぼ閉鎖しちゃうタイプの人で、こうなると検索エンジンを使った検索では跡地すら引っかからない。
過去のサイトアドレスは知ってたからwebarchiveで作品のかけらは見ることができた。
ネトスト的捜索活動の末、その方のものと思われる更新の止まったtwitterアカウントを見つけ、メッセージを送ってみた。
今になって10年以上前の作品のファンでした、と言われても気持ち悪いかなあとも思うけれど、
完全に消息が追えなくなる前に作品が好きだったこと、できれば今後も作品を読ませてもらいたいと思っていることを伝えたかった。
MERYとかWELPが消えて心の底では喜んでたのが日本の一部のスタートアップです。
そこそこ近いところで見てたけど、飲みの席では競合消えて検索順位が上がって収益150%でラッキーとか平気で言っちゃってる
ANRIの左俣アンリ氏が出資しまくったキュレーション事業のスタートアップ。調子いいときはメディア向けにMERYの生みの親とか自称しながら、問題起こった後はダンマリして平気な顔してるのはどうかと思う
NAVERも相当ヤバイけど、お金の出所のこの辺にも焦点当てるべきだと思うよ
RETRIPなんてイマドキの金かけた豪華なオフィスをしつらえて、
月商数千万でお金使いまくってGoogleのさじ加減で業績5分の1になったら冷や汗もんだな
今日のGoogleの発表受けて少しは考え直しているところだろうか。投資した連中もスタートアップの起業家も、この先10年は言われ続けるだろうよ
検索エンジンの結果がすっきりしてくれることを願うよ
基になったのは、有用な論文は多くの論文に引用されている、という気づきだ。
このアイディアを基に、有用な情報は多数のページからリンクされているという仮説を立てて、それを検索順位に反映するアルゴリズムをGoogleは作り出した。
誰もが自分のサイトに載せている情報の専門家であった天国の様な時代には、それで良かったのだ。
Googleの検索順位付けは素晴らしく、当時のYahoo!の様なインデックス型の検索エンジンを瞬く間に駆逐した。
しかし、そのアルゴリズムを悪用して中身のない広告ページが検索順位の上位に現れるということが起こる様になった。
つまり、役に立たない広告ページが狙ったキーワードで検索上位を占めるという現象だけ見ると、それはWelq問題が起こるはるか前から起こっていたことなのだ。
Googleはその度にアルゴリズムに変更を加え、悪質なサイトを排除してきた。そしてGoogle自ら、健全で中身のあるウェブサイトのガイドラインを公開してきたのだ ((ウェブマスター向けガイドライン(品質に関するガイドライン) https://support.google.com/webmasters/answer/35769?hl=ja)) 。
それは、天国で生まれたGoogleにとって、顕現してくる地獄に引き摺り下ろされるような苦痛を伴う作業だったのではないかと思う。
それまで悪質なサイトで行われていたのがGoogleのアルゴリズムの隙をついて検索順位を上げるブラックなものだとしたら、そのガイドラインに沿ってサイトを作り検索順位を上げることはホワイトな行為だと見なされてきた。
間違えてはならないのは、Welqをはじめとしたキュレーションメディアはそのガイドラインに沿った『ホワイトな』コンテンツ作りをしてきたという点だ。たとえそれが倫理的に劣る行為であったとしても。だからこそ、Google検索で軒並み上位を占める結果を出したのだ。
ここでGoogleはまた、キュレーションメディアのスパマー達(あえてこう言わせてもらう)とのいたちごっこのスタートに引き摺り下ろされたのだ。Googleの検索アルゴリズムは変更を余儀なくされるだろう。
だが、今回の件は『倫理的に劣る行為である』という点から火がついた。そこをカバーする新アルゴリズムというのはどんな姿になるのだろう?機械が人間の倫理を理解するには、まだ早すぎはしないだろうか?人間が考える倫理を機械に明け渡してしまうことは、本当に正しいことなのだろうか?それは地獄へ続く道ではないのか?
おそらくそれよりは、信頼できるドメインが信頼できる情報を発信しお互いにリンクし合うという、かつてGoogleが生まれた時に存在した天国を再び目指すべきなのではないだろうか?
いや、本当はそんなことは出来はしない。時間の針を逆に戻すことなど誰にもできやしない。それに、機械が判断した『正しさ』を鵜呑みにして生きることだって、多分そんなに悪いことではない。
自分が正しいかどうか判断できない情報を目にした時、それの『正しさ』を保証してくれるのが機械だろうと人間の専門家だろうと、信じることができればどちらだって同じじゃないか。自分の頭の中身がいつの間にか機械にすり替わっていたとして、それに気付ける奴なんてどこにいるんだ?
WELQ問題からNAVERまとめに飛び火して、NAVERまとめ閉鎖を求める人たちが内部から潰しにかかろうとして続々とNAVERまとめにNAVERまとめ批判のまとめ記事を投稿し始めたけど、
それとともにNAVERまとめが既に行ってきた措置について、批判者が今までぼんやりとしか分かっていなかった部分について理解が進んでいる感じ。
主なルール
・まとめのタイトルと内容が一致していなかったり、無意味と判定された場合、検索エンジンよけの“noindex”を設定
・NAVERまとめに全く利用されたくない、というサイトのURL貼り付け禁止(朝日新聞などのリンクをNAVERまとめに貼ることはできない)
対策をしても外部から運営への批判が止まないのは(特にYouTubeなどの権利侵害と比べて運営批判が大きくなるのは)、やっぱりユーザー同士で連絡をやり取りできる機能がついていないから、各まとめは個々人が作っているというふうに見えにくいんだろうな。YouTubeなら権利侵害動画をアップロードしてしまった場合、権利者からアップロードしたアカウントに直接連絡を入れることもできるが、NAVERまとめはプロフィール設定をしているユーザー以外は、間に運営が入ったやり取りになってしまうし。
【追記:トラックバック返信】
・WELQの「うちはプラットフォームだから~」の言い訳が通用しなかったのは、社員がライターに記事作成方法のマニュアルを提示し、内容について指導添削をしていた事実が判明したから。NAVERまとめは今のところユーザーの自由投稿の域を出ていない。
・NAVERまとめの内容ももっとサクサク削除されるべきとは思うけど、一個人にとってYouTubeの削除要請がNAVERまとめと比べて簡単とは思わないし、今もYouTubeには真っ黒な動画がアップし続けられているのだが。
・NAVERまとめの削除取り組みとしては、申請すればそのドメインからは転載することができなくすることができる(上記の通り、朝日新聞や毎日新聞はURLを貼り付けることすらできない)。そういう権利者証明は個人には敷居が高くて叩かれる対象になってるという点は理解(でもそれはYouTubeや他のプラットフォームでも同等でないか)。また、権利処理については、一応ユーザーが自由に使える画像サイトは用意されていて、その数は拡大している。例をだすと、ゲッティ、アナマイ、アフロ、アメブロ、トリップアドバイザ、Amazon、じゃらん、食べログ、ぐるなび、楽天レシピ等。ただし、その枠に納めずにアップロードしちゃうユーザーがいる問題は今でも大きい。だから今回の炎上で、インセンティブ制度を「勝手にまとめられた」側にも適用すると、YouTubeやニコ動的な対策をすることになった。
・たぶんもっとも怒りの対象であるNAVERまとめのインセンティブ制度については記事ごとかユーザーごとに事前申請させて審査・承認する形にして完全にクリーンなものだけにすべきだね
1年ぐらい前に「そういえば日本の歴史は教科書を読めばいいけど、インターネット上の歴史は意外とまとまってないよな」とふと思いつきで書いて、以降何か思い出す度にちまちまと書いてて、最終的に本にするかどっかで公開しようかと思ってた。
が、金取るほどじゃないし、そもそも出典元は自分の記憶とWikipediaとかその他ウェブサイトだし、正確性も担保できないし、どうせなら皆で見て「あーこういうのあったねー」とか「これが無い!」とか言い合うのも楽しいと思ったので書く。
あと、自分だけでなく、一度某所に公開して出てきたやつも一部混ざってます。※2016年まであります。
・アメリカで現代のインターネットの起源となる「ARPANET」が始動する。最初はカリフォルニア大学ロサンゼルス校とスタンフォード研究所、カルフォルニア大学サンタバーバラ校、ユタ大学の4つを結ぶネットワークから始まった。最初に送信されたメッセージは”lo”だった。(login:を入力しようとしてクラッシュした)
・東北大学とARPANETが接続される。日本にARPANETが入った最初の出来事である。
・慶應義塾大学と東京工業大学を接続するJUNETが誕生。日本におけるインターネットの起源。後に東京大学をはじめ、様々な研究機関や大学が接続されるようになる。
〜〜中略〜〜
・Windows95誕生。一般市民にインターネットが急速に広まる。地下鉄サリン事件発生。
・阪神淡路大震災発生
https://www.youtube.com/watch?v=ktPL7X7nFXk
https://www.youtube.com/watch?v=FvfBJapb2pw
・芝雅之により掲示板「あやしいわーるど」が誕生。日本インターネットのアンダーグラウンドの祖先。元は地下鉄サリン事件を題材にした不謹慎ゲームを配布するために立ち上げたウェブサイト。
あやしいわーるどで発生した文化は後のインターネットに大きな影響を与えたものも多い。
・ネット流行語:「マターリ」「ヽ(´ー`)ノ」「『餃』『子』『の』『王』『将』」「萌え」「Warez」「ギコ猫」「ツンデレ」
・あめぞうにより「あめぞうリンク」誕生。酒鬼薔薇事件発生。あやしいわーるどに少年Aの実名が投稿される。
・あやしいわーるど閉鎖。あやしいわーるどから派生した掲示板が大量に発生する。これらは2016年現在も続いているものもある。
・「あめぞうリンク」にスレッドフロート型掲示板(あめぞう掲示板)が設置される。最初にあったのは「掲示板ニュース速報」「株式速報」
読みづらいとされていた大型掲示板サイトの中でこのシステムは当時は画期的で、爆発的な人気を誇るようになる。
・この頃に「ひろゆき」出現。
・この頃はまだコンピュータも高価で、インターネットもまだ滅多に使われず高額だったため、利用者が好事家に限られていた。雑談以外には、株式、経済、社会情勢、コンピュータ等、専門的で高度な話題が多かったとされている。
・テキストサイト全盛期
・あめぞうの利用者が増加し、サーバ確保が困難になったり荒らしが増えるようになり運営に様々な問題を抱えるようになる。
・サイトの引き継ぎ先を求めていたあめぞうの声に応える形で同年、利用者の1人であったひろゆきにより「2ちゃんねる」が誕生。当時は「あめぞうのセカンドチャンネル」という位置づけとされていた。1日あたり1万人程度の来訪者。
https://www.youtube.com/watch?v=h22l8iWAW18
https://www.youtube.com/watch?v=6rNZBF9DXTU
・スクリプト荒らしによりあめぞう掲示板壊滅。同年閉鎖。西鉄バスジャック事件発生。犯人が2chに書き込んでいたことを受けてひろゆきが初めてテレビに出る。
・ネット流行語:「(この掲示板は)匿名というのが前提になりますので、うそもあるし、ひどいことも書かれます。そういうのをうそはうそであるとか、見抜ける人でないと(掲示板を使うのは)難しいものがあるでしょう」
・教育改革国民会議(森内閣)「バーチャル・リアリティは悪であるということをハッキリと言う」
http://www.nicovideo.jp/watch/nm3956863
https://www.youtube.com/watch?v=LWSZMrz0zsk
・2chに対抗した1ch.tv誕生。あめぞうと西和彦が関わる。
・アメリカ同時多発テロ事件発生
・先行者出現
・田代神
・MAD GEAR SOLIDの1作目が公開される。「性欲をもてあます」
・グリッドコンピューティングを用いたUD ガン研究プロジェクトが開始。2007年に終了するまでの間、Team2chが大きく貢献する
・WinMXで逮捕者。「かぎのおとが おやがかぎわたしや もうだめぽ」
・ドラえもんのキャラを使ったFlashが流行(後にオラサイトと呼ばれる)
https://www.youtube.com/watch?v=DaoGHZFKt6s
https://www.youtube.com/watch?v=nQl3NIJYkt0
>でも「自分で入力するのヤダヤダ私が欲しい結果をエスパーしてくれないとヤダヤダ」とか言ってるお子様にはお似合いじゃねえの。
え?
それがGoogleが目指す先なんじゃなかったの?
究極のユーザビリティってユーザ個々にとって最適な情報結果を同じキーワードでも出してくれることだろ
それやらなかったら何のために情報ひっこぬいてんだよ(※広告のためです)
それ自体は今の時点でもある程度やってるけど、その精度がエスパーどころか痴呆老人レベルなわけなんだが
その痴呆エン人の徘徊がもたらしたのがウェルク問題であり未だ放置されてるパクリサイト問題だろ
誰がどうみても不特定多数に対して情報価値の低いパクリサイトをビッグワードで検索上位に挙げているのは
巨人がビッグワード食うたびに糞尿垂れ流しまくってたらため息ついて言葉を失いますよ
世の中俺やお前みたいに最適な詳細検索設定できるマニアなやつなんて世界人口全体の数%程度しかいねーから
やってることは全くかっこよくなくて大量のクソの中から使えそうなやつを金塊のように探ってるに過ぎない
使いにくい道具を使わされて、その糞の掬い方を知ってるというだけで
クソまみれの顔と体で得意げな顔をしてドヤ顔して悦に浸って骨の髄までクソ教育された優等生がお前(これでヒョロガリノッポ眼鏡ならビジュアルばっちり)
ユーザー全体の質とそれに対する影響力の大きさを考えろ
事実、問題になってるけどそれについても眼をそらしてお前らが悪い設定が悪いとか言い出すの?
ゲームにバグ残してユーザーが発生したらお前の遊び方が悪い!ってクリエイターいたら口がふさがらんだろ
5年間もバグ放置してるゲームとか普通クソゲーとしてしか認識されんが
残念ながらこの世界には出来の悪いインベーダーゲームしかなかったな
みんなインベーダーゲームの謎(SEO対策)を解いて小銭稼いで
アップした後にお決まりのように「ユーザーにとって価値あるコンテンツを評価する」動画でブランディングを忘れない
SEO業者・悪VS正義のGoogleという信者の聖書に記された二元論作ってまた自分のやりたいことやるためにアルファベットに引っ込む
そしてまた始まるバグ探し
それらが出すクソに巻き込まれる情報弱者のユーザーとコンテンツ
この関係性をもう何年も繰り返してる
ここまでの顛末、対応を見て、たいていの人は薄々感づいているはずだ。「こいつ、どんだけ炎上しても逃げ切る気だな」と。
NAVERまとめへの批判記事が殺到している昨今だけれど、ここまで批判されていてもNAVERが腹を切る絵図はいまいち見えてこない。「批判は一部のもの」と取り扱い、なし崩し的に現状維持を試みているようだ。民草の怒りが別の対象に切り替わるまでやり過ごそう!と、事の解決を時間に求めているようだ。
しかしもちろん「じゃあ野放しにしておこうぜ!」っていう流れに話は転ばない。戦は大将首を落としてこそ完結する。DeNAを討って一国を滅ぼした今の反乱軍の勢いを鑑みればそれはなおの事だ。
ではNAVERを打倒するにはどういった手段に出ればいいのか。以下は1+1=2!ぐらいのみんなわかりきった話だ。再確認みたいなものだと思ってほしい。
著作権侵害を助長するNAVERへ未だに広告出稿する倫理観の低い企業のまとめ
https://matome.naver.jp/odai/2148162947661675701
薬機法ロンダリングをして更に著作権侵害を助長する小林製薬のPR記事まとめ
https://matome.naver.jp/odai/2148168906592981501
出資元を殴って補給路を絶て、という実に戦略的なやり口。相手が長期戦を望むのであれば兵糧攻めは基本である。
NAVERだって迷惑行為やリスキーな著作権侵害を慈善事業や趣味として敢行しているわけではない。そこにお金が発生するからである。原動力はお金。ならお金を彼らから切り離そう!という手段だ。
https://support.google.com/sites/answer/116262?hl=ja
目につくから鬱陶しいのであって、人が見ないところでひっそりとやっていれば気にすらならないし、日を浴びなくなればいずれ自然に枯れる。
NAVERまとめの流入の大半はSEOだ。検索エンジンから根をこそげば流入はストップする。検索エンジンは一種インターネットの神様みたいなものなのでいくら大企業とはいえGoogleに見捨てられればこの地に生きるすべはない。
NAVERまとめごときで人が死ぬとは思えないが、これを原因に死者が出ればいっぺんに社会現象になるのでは。「死んだ」という事実はなんだかんだインパクトがある。各メディアもこぞって取り上げたがる。
インターネットをクリーンにするための人身御供を買って出る優秀な増田やブックマーカーが待たれる。
結局今はたまたま矢面に立っているのがNAVERなだけで、DeNA、NAVERとデカいところが死滅していったところで、その部分に零細が滑り込むだけであって、単なるいたちごっこなんじゃないか。
http://anond.hatelabo.jp/20161210211949
SEO及び検索エンジン一神教である今のインターネットの根本構造を変えない限りは根本的な解決にはつながらないと言える。
かといって、極端に厳しすぎる著作権システムや、メディア概論がまかり通ってしまうと、SFにありがちな、極端な正義しか許されない清潔ディストピアのような状態になることだろう。
そうなってしまえば反乱軍がそのまま山賊化し村々を荒らした末誰も住めないインターネットはたやすく完成することだろう。
場当たり的に役に立ったまとめ、キュレーションは確かにあった。アレ自体が完全な悪とも言えない。基本情報の全てをWikipediaに任せるのもちょっと味気ない。
某検索エンジン大手は、検索エンジンの結果をアドセンスのクライアントのために操作することはない。
正確に言うとヒルズの奴らはやりたくてもマウンテンビューのやつらが邪悪になるなと言って許さないし、システム的にもわざわざやることが難しい。
それでも数字をあげたいヒルズの営業部隊は、日本語特有の文化として、まとめサイトみたいなのが必要だと訴えてみたり、
日本語に関わる開発はヒルズでも一部主導権を持ってるので、そのようなサイトを優遇していくことでクライアントの広告収入が結果的に増えることに気がついた。
他のやり方としては、HTML5に準拠したソースコードのページを優遇することで、老朽化した個人サイトを突き落として大手を優遇することに成功した。
その大手はつまり最新のアドセンス改定についてけるような開発体制がある会社ということ。
まあ、その結果どうなったかは皆さまご存知だろう。
もう1つ言うと、ヒルズの日本法人はマウンテンビューと組織が完全に別なわけではなく本社と人の行き来はかなりある。
その点はヤフーとか他の外資とは異なる。それでも日本法人のやつらはKPI求めるタイプの人間ばかりになってしまって本社ほど心に余裕がない人が多い。
それに日本法人は今回炎上した会社と恐ろしいほど社風が似ている上にコンプライアンス守る気もあまりないが、
某社と違って自分たちが圧倒的なブランドでグレーゾーンを押し切っても逃げ切れることをよく理解してる。
それにいざ、取引先が炎上しても自分たちは安全な場所に居続けることが出来ることも自覚してる。
今回も一連の事件を受けて我々は検索アルゴリズムの改良提案をしましたとか日本法人のブログでさらっと書いて第三者風にして逃げる方針。
だそうです。