はてなキーワード: グーグル八分とは
七味顔おじさん、一体何をやってグーグル八分になっているのか
楽譜.me というサイトがある。(楽器.me というサイトは別物。)
有名楽曲のコード進行が掲載されているサイトなんだけど、めちゃくちゃなコードが載っている。
コード進行って、Am7のところがAmと載っていたりっていう違いとかは当たり前に存在しているし、
キーが違ったらC F G C という流れが E A B Eと書かれていることはある。
不思議なルールによって、CのところをEmに置き換えている場合もオッケーだったりすることがある。
ギターを弾ける人は、間違ったコードが載っているというと、そういう当たり前の違いのことを想像するかもしれない。
でも、そういう次元じゃない。
ギターが弾ける人は、知っている曲を楽譜.meで検索して弾いてみてほしい。
コードが分かる人は、同様に検索して、コードを見てみてほしい。
トンチンカンきわまりない。当たり前の違いの範囲を逸脱している。
それもそのはず。楽譜.meのすべてのページのフッターに、
「当サイトはディープラーニングによる楽曲分析を行うための実験サイトです。楽譜情報の精度は保証できません。」
と書いてある。
機械学習で曲から耳コピ(?)したコードを掲載しているということだろうか。
機械学習が耳コピしたコードだから、コードが間違っていてもご了承くださいということだろうか。
詳細はよくわからない。
機械学習がコードを耳コピしているなら、精度が悪いのはわかる。
音楽データを機械学習に与えても、ノイズとなる情報が多すぎて大変そうなことが想像できる。
だから、問題はめちゃくちゃなコードが掲載されていること自体にはない。
問題は、この機械学習、本当に学習しているの?っていうところ。
このサイト、少なくとももう半年以上、メチャクチャなコードが掲載された状態が続いている。
見たところ、ユーザが、このコードは間違っているという報告をしたり、正しいコードへの訂正などのフィードバックを与える仕組みは備わってない。
逆に、このコード進行は大体あってますとか、そういうフィードバックすら与えられない。
だったら運営者側が頑張って学習を進めているのかもしれないが、そういう雰囲気でもない。今どれだけ進んだのかという情報はない。
機械学習にはお金も時間もかかるし、ドメイン買ってサイトを立ち上げてって、機械学習をすすめる気がないなら普通めんどくさくてやらない。
機械学習をちゃんとやりたいなら、せめて今学習がどのくらいいい感じになっているかのフィードバックを得たいはず。
そうじゃないとかけたコストがドブに流れていくだけ。
もちろん、当然のようにこのサイトには広告が貼ってある。その収入でサイト運営をやっているのだろう。
収入がどれくらいか我々にはわかりようがないし、機械学習のコストがどれだけかかるのかもやってみないとわからない。
だから、収入のペースがおそすぎて学習が進まないということならわかる。
でも、そもそもフィードバックの仕組みも用意していないし、精度の高い結果を出せているわけでもないし、
機械学習コンテンツとしてはインターネットで公開する意味がまるでない。
コード進行を検索することは、やはりコードを覚えてきた初心者ならやってしまうことだろう。
でも、そういう初心者は、書かれたコードが間違っているのか、自分が間違っているのか、わからない。
人によっては、間違ったまま覚えてしまったり、自分を信じられなくなって何かをあきらめたりするかもしれない。
楽譜.meは、その他のコード紹介サイトには載っていない楽曲まで網羅して載っているので、
ちょっとしたアニソンとかのコードを検索すると、だいたいここがヒットする。
そして意味不明なコードを試してみて、今日も初心者が脱落していく。
コード進行をサイトに載せて人の役に立ちたいなら、このような現実はすぐに何とかしたいと思うのではないのか。
現状、アーティスト名と楽曲名だけを利用して、中身はインチキなコード進行を掲載して、広告収入を集める、「釣り」みたいなサイトになっている。
歌詞とかが載っているわけではなく、法的に対処するのは難しそうだけど、なにもわからん素人が「だまされた!!!」って感じるサイトって、やっぱり悪質なんじゃないのか。
インチキな情報で何かをするとき、「ディープラーニングです、ご了承ください」という文言は本当に便利で、無敵の盾になっている気がする。
そういうの、ディープラーニングの品位が下がるから本当にやめてほしい。はやくグーグル八分にしてほしい、と個人的には思っている。
ぐぐってみると、「コードを自分で耳コピしないのはクソ」とか、
そもそも楽譜.meじゃなくて楽器.meについての話だったりとか、
どうも楽譜.meのおかしさについての情報があまり見つからない。
不思議なチカラで消されるのかもしれない。
1.ひろゆき・2ch発の「荒らしはスルー。少しでもかまえば餌やりになって増長する」というルールをネットマナーとして浸透させる。なんならスルー力検定を文科省が本当につくればいいよw検定ビジネス大好きだから。もともとはてなブクマってそれができない人のためのものではあったけど、2階建てブクマとかやりようは自然発生したのに、まだまだみんな純朴。
2.小泉政権がゆうせい潰しのためにつぶした労働組合を、もうちょっとまともな形で再生。富の再配分をヨーロッパくらいうまくやれるようにする。あのときの公約されたはずのセイフティーネットは「ない」っていう認識がはせがわ某らをかりたてている。
3.パソコン中級者はhagex本やらトピシュの本でも読んで、グーグル八分とか、ウェブサイトの通報行動を有効につかう
ってあたりですねえ。
dropbooks、その充実度・利便性はエロ漫画サイトの到達点とも言われている。総ファイル数36万、数百MBのzipに直リンク、商業本上げ放題 10年前のネットユーザーに教えても信用されないかもしれない。
権利者対策はどうなっているのか。サーバー所在地はブルガリアのソフィア。サーバー管理人の連絡先は中米ベリーズのベリーズシティ。まさに無法地帯というか、日本からでは手が出せない国を選んでいるようだ。ただzipや画像などの重いファイルは、普通にアメリカに置いてあるようだ。
微妙にグーグル八分を受けている(トップページがヒットしない)が作家名やタイトルなどでググると、公式サイトを差し置いてトップに出てきたりするのでよく分からない。
広告が若干悪質であり今時ワンクリック詐欺だったり、怪しいポイントサイトだったり、強制遷移で見せてきたりするが、それすら許せる。
板橋区にあるのだが、『板橋区 シェアハウス』で検索しても検索結果に出てこない。
そんでもって先日、住人同士のトラブル(婉曲的な表現)があった。
ムチ打ち、小指の骨折をした者が出たらしい。
そんな馬鹿な話はない。
喧嘩程度の『傷害事件』でムショにブチ込まれるのなら、今頃ブタ箱建設ラッシュでブタノミクスである。
おそらく警察にドナドナされた加害者は留置場で絞られたあと、追い出されただろう。
この世の最底辺たちが集まる我がシェアハウスで、『警察、検察、留置場、拘置所、逮捕、起訴』の違いが分かるのはたぶん私だけである。
初音ミクがグーグル八分にされたときの、「ググらないでMicrosoft Live Search使おう」
って騒動を思い出した。結局喉元すぎればナントカで、みんなググってそう。
鏡音リンもグーグルとヤフーのイメージ検索ではほとんど表示されない。
しかしMSNだときちんと表示される(MSNの結果)。鏡音リンもグーグル八分にされているのだ!「初音ミクのときと同じだ。やっぱ技術的な理由なんだ。」なんて考えちゃいけません!理由はないけど!電通の圧力(笑)に違いない!根拠はないけど!「技術的な理由だ」なんて考えるのは電通の思う壺。すべてのボーカロイドファンは断固としてこの電通の陰謀に屈してはならないのです!これからはMSNを利用し、同時にグーグルとヤフーに抗議することでこの陰謀に立ち向かっていかなければならないのです!
まぁ、普通に考えればやっぱり技術的な理由だけど、ボーカロイドオタさんは今回もがんばって空回りしてほしいのです。
しかしまじめな話、MSNのイメージ検索で鏡音リンのエロ画像が一つ目にでるのはどうなんだろう。今検索すると
http://shop.melonbooks.co.jp/img/212001011182.gif
(18禁につき注意)
が出てくる。大本も