ブックマークの傾向、ブログの内容などを解析し、はてなユーザを勝手にグループ分けする機能。
「はてサ」「はてウヨ」「こじらせリパブリック」「増田ーオブパペッツ」「ライフハック・キングダム～俺達がライフハックを愛するたったひとつの理由～」のような。一目でそのグループの属性が分かる、イケてるグループ名を用意する。
一ヶ月ごとにグループ分けを行う。移籍が発生することもある。グループ人数の分布図はいわばはてなにおける勢力図であり、一ヶ月ごとに勢力分布の変化を追うことが可能になる。
それぞれのユーザは、どのグループに属しているのか他のユーザに公開される。
一ヶ月ごとに、「グループ１人当たりの(獲得はてなスター)-(獲得ブラックスター)」(GHP:Gross Hatena Product) が最も多いグループには、「グッドはてなグループ賞」として、メンバー全員に有料ブラックスターが100個ずつ配布される。
はてな社内では、どのグループからどのグループへブラックスター（orはてなスター)が贈られる傾向があるとか、どのグループは多方面からブラックばかりもらう傾向にあるとか、そういう情報が蓄積される。ビッグデータ！
それを研究機関とかコンサルとかに売ったり提供したりする。（ヘイトグラフサービス）

こちらからは以上です。

Permalink | 記事への反応(1) | 11:08

2013-05-30

■http://anond.hatelabo.jp/20130529231546

「今やビッグデータは常識ですよ。ビッグデータを扱うにはサーバーやストレージをより強力なものにしないと時代に乗り遅れますよ」

って顧客を煽ってそれらの製品を買わせるために必要なのです。

Permalink | 記事への反応(0) | 02:14

2013-05-29

■ビッグデータって言葉を使いたいだけだろ

ビッグデータって言うとかっこいいと思ってるんじゃないの。

何年か前のパンデミックみたいな。

多用しすぎと思う

Permalink | 記事への反応(1) | 23:15

■http://anond.hatelabo.jp/20130529000759

マジレスすると荻野久作って方が何十年も前に統計学的に研究して結論出してるんだが。

つーか、"統計学"的な推論は元々母集団が少なくても、有意差を検知するために開発されたんであって

排卵と妊娠の関係みたいな、母集団がほんとに綺麗な正規分布を描きそうなものにビッグデータはぶっちゃけいらんね。

逆に、特定の遺伝子発現が影響する病気だとか従来はわかってなかったレアケースのたぐいに役立てようと思っても

正直データ採取が適当にならざるを得ないし、50万人の治療者で大丈夫なんだろうか。甚だ疑問。

Permalink | 記事への反応(0) | 00:41

■女性周期・妊娠 ビッグデータ解析

結局「女性手帳」構想はポシャッてしまったが、

「国営ルナルナ構想」がもし実現して、かつ女性たちが、

自らの女性周期と、「●●をやった日」と、妊娠の有無を

「国営ルナルナに正直に申告」したとすれば、

「女性周期と妊娠についての、ビッグデータ」が纏まっていたのでは？

例えば、現在は感覚論的に

「排卵日に●●をやったら、妊娠する確率が高い『だろう』」と推論しているが、

正確なところ、「一番妊娠確率が高まる日」が、

「排卵日２日前」なのか、

「排卵日１日前」なのか、

「排卵日」なのか、

「排卵日１日後」なのか、科学的に、或いは統計学的には解明されていない。

あるいは、

「排卵日の時期に、毎日●●すると妊娠確率が高まる」のか、

「数日置いて●●する方が、かえって『濃く』なって、妊娠確率が高まる」のか、

それも科学的・統計学的には解明されていない。

なので、日本の妙齢女性２，０００万人のビッグデータで以って、

その辺の科学的事実を解明すれば、

「妊娠を希望しているが、不妊治療はちょっと大げさ」という「プチ不妊」なカップルに、

「このころに●●するのがお勧めです」と、医学的データを提供できる。

Permalink | 記事への反応(2) | 00:07

2013-05-20

■院卒で就職したが，企業における「分析」が不満だ

工学系の院でドクターをやったが，挫折して企業に就職した。大手小売り系の会社で「ビッグデータ」（笑）の分析をやっているが，いろいろと不満である。

第１に，社内での過去の分析の蓄積がない。分析は，会議などの意思決定の場にあわせて実施されるが，その場限りのものである。過去の分析結果が参照されることはない。自分が過去におこなわれた分析結果を参照しようにも，その方法が実質上ない。

第２に，それゆえ，分析は散発的におこなわれ，恣意的に活用される。自分の分析スキルが（運良く）社内の実力者に目に留まったとする。彼はこう言う。「今度の経営会議で，このような主張をしたいのだが，そのために，このようなデータは作れるだろうか？」。彼が望むデータを得る事ができれば，私の分析結果は，晴れて経営会議でトップマネージメントに披露される。そして，私は，次回の経営会議でも，彼に分析を依頼されるであろう。しかし，仮に私の分析結果が彼の望むものでなかった場合は，どうなるか。彼に対立する立場のものに引用されるのならばよい。私のデータが社内で論争を引き起こし，そして，社内の意思決定を正しい方向にみちびく事になるからだ。しかし，そうはならない。私のデータは単に黙殺される。私は自分自身の昇進のことを考え，自分のデータを，彼に都合の良いものにどの程度加工するか（ひどい場合は捏造するか）判断を迫られる事になる。

第3に，1と2のような状況にもとづいた過去の「分析」に対する不信感により，社内で分析に対する信頼感がひどく低い。売り上げ・利益・在庫といったソリッドな数字はKPIとして共有されているが，それ以外の数値は無視される。外部コンサルを含めた分析者は，実力者におもねる茶坊主として軽視され，出世をするのは，営業で目立った数字を上げた者ばかりである。分析にひつような，情報の共有に必要な投資はなされない（１につながる）。図書館などない。白書や外部のシンクタンクが発行したデータの購入もままならない。そのような状況においては，毅然として，自分の信じる分析をおこない続けるのも困難である。

Permalink | 記事への反応(1) | 02:25

2013-05-17

■[NP困難][多体問題][アローの不可能性定理]

直接民主主義を実験しているDemoex

今回総選挙の自民党の絶対得票率は、比例代表選挙で１６・９９％、小選挙区で２４・４９％に過ぎない！

ゲリマンダー - Wikipedia - ウィキペディア
一選挙区から一人しか当選しない小選挙区制を採用している場合には、特定の政党に投票する傾向の強い地区を分割し、相対的に多数が別の政党に投票する傾向のある選挙区に吸収させることで、特定の投票を無効化することができる。

2000年アメリカ合衆国大統領選挙 - Wikipedia
共和党のジョージ・W・ブッシュが、民主党の現職副大統領アル・ゴアを破って当選した。
ジョージ・W・ブッシュ
獲得選挙人 271
得票数 5045万人
得票率 47.9%
アル・ゴア
獲得選挙人 266
得票数 5099万人
得票率 48.4%

アローの不可能性定理 - Wikipedia
選択肢が3つ以上あるとき､
定義域の非限定性､全会一致性､無関係な選択対象からの独立性､非独裁性をすべて満たす
｢社会的厚生関数｣を作ることはできない､とする｡

Amazon.co.jp：選挙のパラドクス―なぜあの人が選ばれるのか?: ウィリアムパウンドストーン, 篠儀直子: 本

「合理的無知＝コストパフォーマンス的に、政治の勉強に膨大な時間を費やすより、適当に暮らしてた方が合理的。」

合理的無知

NP困難 - Wikipedia

[多数論証][アローの不可能性定理][多体問題][じゃんけん]

[民主主義][選挙][数理モデル][ビッグデータ][統計]

Permalink | 記事への反応(0) | 20:05

2013-05-08

■

ビッグデータがバズワードになって久しいけど、情報がある程度集まったら匿名性（引いては個人のプライバシー）なんて保つのは不可能じゃないの？という記事から、未来予想さえ可能になるかもよという論文の紹介。

The greater the amount of personal data that becomes available, the more informative the data gets. In fact, with enough data, it's even possible to discover information about a person's future. Last year Adam Sadilek, a University of Rochester researcher, and John Krumm, an engineer at Microsoft's research lab, showed they could predict a person's approximate location up to 80 weeks into the future, at an accuracy of above 80 percent. To get there, the pair mined what they described as a "massive data set" collecting 32,000 days of GPS readings taken from 307 people and 396 vehicles.

利用可能な個人情報がより増えたら、データはより情報価値が上がる。それどころか、十分なデータ量があれば人の未来に関する情報を発見することさえ可能になる。昨年、英ロチェスター大学の研究者であるAdam Sadilek氏とMicrosoft リサーチラボのエンジニアであるJohn Krumm氏は80週先の人のおおよその居場所を80%の正確さで予測可能であることを発表した。研究を行うために、二人は*莫大なデータセット*と彼らがいうことろのものに注意を払い、307人と396台の乗り物から収集した32000日のGPS記録を収集した。

論文:

http://www.cs.rochester.edu/~sadilek/publications/Sadilek-Krumm_Far-Out_AAAI-12.pdf

"Has Big Data Made Anonymity Impossible?"

http://m.technologyreview.com/news/514351/has-big-data-made-anonymity-impossible/より抜粋

Permalink | 記事への反応(1) | 08:39

2013-04-17

■

ファーストリテイリングの会長のインタビュー記事をよんだ。

時代はグローバル化だ、そうだ。そもそもグローバル化ってなんだろう。辞書的な意味は、国家なんかの垣根をこえて自由に経済しましょう、ということだろう。境界の無視/自由という語感から、慣習からの脱却（年功序列、必ず問屋を通す？みたいな）と同一視されているかもしれない。昔にはやったデータマイニング、ちょっと前にはやったクラウド、そして旬なビッグデータと同じでバズワードじゃね、と個人的には思う。

意味も定義もよく分からないが刺激的で万能薬みたいな効果がありそうな単語を流行らせ、その単語を冠した商品を買わせよう、というやつだ。グローバル化も、そのグローバル化を声高に叫んでいるひとたちが得するわけで、その賛同者や感化されたひとが得するわけじゃない、構造はネズミ講と同じだと思っている。親とそのすぐ下の子ぐらいまでは儲けがあるじゃね、的な。

まあ、それは横道で。

年齢を問わずに実力でひとを評価しよう、と言っていた。うん、慣習からの脱却だね、年功序列の否定。でも、同じ口で、２５ぐらいまでに基本的な考えをまとめて、努力を重ねて３５ぐらいまでに執行役員に・・・という。これと同じ言葉を知っている。「吾れ十五にして学に志す。三十にして立つ。四十にして惑わず・・・」孔子というひとの言葉だとすれば、１５歳で学を志そう、と基本的な考えをまとめ、努力して３０で学の分野で責任を取れるようになった、と。たぶん、そんな感じ。とてもファジー。や、すごいね、旧弊だという儒教的な価値観のほうがそのひとの価値をバッサリと切り捨てる年の頃がずいぶん早い、ただ努力にかかる時間は長いよね。

親を敬え、という儒教的な価値観に根付いた年功序列とかを破壊したいひとの口から儒教的な価値観に縛られた言葉がでてくる。それは、そもそもの話として慣習というのは弊害がありながらも価値があるということか、人間ていうのはどんなに聡明でも「信じたいものだけが存在し、信じられないものは存在しない」という枠から完全に脱することはできないのか、どっちだろう。

最後。

よく破壊なくして創造なし、とかいうけど、新しいものを創造したらそれに噛みあわない既存が壊されるだけであって、既存の破壊の理由に創造を付けたら、それはただの破壊だよね、何も生まないし、だれも得しない。

Permalink | 記事への反応(2) | 01:09

2013-04-05

■

http://anond.hatelabo.jp/20130405172016

すみませんわかりにくくて。

100の国が実施している成功例があるとして

それを導入していない対象国が１つあったとして

100の成功例が、対象国における１つの取り組みについて

（ビッグデータが対象１つの国における成功の可能性にどう因果関係があるのかといわれたら）

100の実施国の中で、日本と同じ環境の国がいくつあるのか

国　＝　市場　＝　消費者　＝　習慣や趣向

こういうくくりで国単位でわけたとして　「日本と似た動作をする市場」　を

（気候・風土・習慣・土地など含めて100の国のうち「日本でもそれを実施すると同じ効果が期待できるのではないか」という候補単位としての国）

を略して「日本という国」

にしてました

ごめんなさい

Permalink | 記事への反応(0) | 18:15

2013-03-22

■はてブ「コメントを一覧表示するページ」改悪の件について

デザインが大不評のはてなブックマークなんだけど、

今回改悪された「コメントを一覧表示するページ」は、

まとめサイトのレイアウトに似てきているんじゃないかと思う。

結果的にそうなったのか、意図してそうしたのか、分からないけど。

まとめサイトにも色々あって、最近増えてきた、ニュースネタなんかを一部引用しただけで、

あとはそのサイト自体にコメントを書かせるタイプがあるじゃないですか？

すでに「まとめサイト」と呼ぶのも違う気がする単なるコピペサイトだけど。

はてブの「コメントを一覧表示するページ」は、構造がそれと同じになってるんだ。

コピペした見出しとそれに反応した脊椎反射コメント群のように見える。

単なる烏合の衆（ルビ：ビッグデータ）として扱われている。

僕らははてなブックマークをそんなつもりで使ってるんじゃなかった。

そう思ってたんだけど、客観的には同じようなものなのかもしれない。

見方（見せ方）の問題で、そのように見せることも出来るってことだ。

でも、まとめサイトの名無しの書き捨てコメントと、ブログや過去のコメントに紐付いた

はてなユーザーのコメントは同じものなんだろうか。

確かに、はてなのサービスを知らない人から見れば同じようなものかもしれない。

だけれど、ほんとにそれでいいのかな？

はてブのリニューアルを断行した人は分かってやってるのかな。

これは小手先のデザインの問題なんかじゃないと思うよ？

Permalink | 記事への反応(0) | 20:12

■http://anond.hatelabo.jp/20130321232717

情報系（修士）を出た身として、また私と似たような境遇にいるなと思ったので、少しでも助けになれば。

私もまた、何がやりたいかわからず、大学の図書館に行っては特に分からない、どうにもならない本で勉強したり、あるいは情報系の資格を取得しようと奔走したりと、少し行動を起こしてみるも結局何も得られていないような学部時代を過ごしました。

そんな特に何もしていない私の転換期はというと研究室配属でした。

嫌でも人と関わる（同期や大学院の先輩、そして教授等）ことになりますし、（実験レポートなんて適当なもので許されない・授業でやったことなんてあんまり通用しない）卒論を書くことになるかと思います。

研究生活という適性もある（鬱になって休学した等が実際にあった）からなんとも言えませんが、私はその研究生活に向いていたらしく、卒論や大学院の修論でめちゃくちゃ成長できたし、研究の中で培った事柄が評価され、就職も決まりました。

私と同じタイプなら、これから来る研究にしっかり取り組めば、何かしら掴めるものはあるかと思います。

そして金銭の問題が大して無いのであれば、一先ず大学院へ進むことを薦めます。

で、今何やるかですが。

まず、数学の勉強は現在のように続けたほうがいい。

必ず必要になるし、絶対に無駄にはならないと言っていいぐらいだと思います。授業でやったことや、確率統計や線形代数など、各分野に絞った薄い本、入門レベルでもいいので身につけておく。

最悪、数学的なセンスが途切れないようになってればいいです。

次に、Twitterをやってるとのことなので。

自分の学部にどんな研究室があって、研究室のホームページを見れば理論はわからなくてもどんなことをやっているのかはわかるはずですし、面白そうだと思えるものがきっとあるはずです。

面白そうな研究室が見つかれば、次はその研究室のホームページから研究業績の欄を見ます。

タイトルでググれば論文が出てきますし、様々な学会での業績が見られます。

そして、その学会でググれば他の大学の研究も出てきますし、その発表者の研究室のページへ行けばTwitterのIDも手に入るかもしれない。

ここまでくればその面白そうな研究分野の研究をしている人をTwitterの非公開リストにぶっこみます。

また、フォローしている人たちを見て、あとは芋づる式にリストにぶっこめば、最先端の技術についてつぶやくTLのできあがりです。

私はこうやって先人達の姿を見て、やるべきことや新たな発見等あったしモチベーション維持にも繋がった。

現状で簡単にできるのはこの辺りでしょうか。

ここからは私もしていなかったので、偉そうな事を言ってしまいますが、

一つのことをやり遂げること、勉強にしろ何にしろ並行してやっててもいいので、何か一つは極めたといえるもの（いや、実際には無理でもね。自信を持って言えたらいいんです）を今からでも全く遅くないのでやるといいかもです。

何も思いつかなければ、数学、もしくはプログラミングを極めておいてください。

個人的には最近ビッグデータが云々うるさいので、統計学について調べておいてください。

眠いので以上です。

Permalink | 記事への反応(0) | 02:49

「ビッグデータ」を含む日記

■【PC遠隔操作事件】ラストメッセージ全文（転載）

■外食産業はクックパッドに埋もれてる料理を新メニューとして発表せよ

■祭りの後から見る予想屋

■要するに

■ビッグデータの何が新しいのかが分からない

■情報セキュリティ界の腐敗と門外漢たちの難癖

■ビッグデータ批判されるべき/ノープロブレムって二分法じゃないと思うが…

■ビッグデータ云々

■はてな新機能の提案

■ビッグデータって言葉を使いたいだけだろ

■女性周期・妊娠ビッグデータ解析

■院卒で就職したが，企業における「分析」が不満だ

■[NP困難][多体問題][アローの不可能性定理]

■はてブ「コメントを一覧表示するページ」改悪の件について

■【PC 遠隔操作事件】ラストメッセージ全文（転載）