「データマイニング」を含む日記 RSS

はてなキーワード: データマイニングとは

2010-09-08

サービス」を作るって?

Twitter連携機能」http://hatena.g.hatena.ne.jp/hatenabookmark/20100906/1283746029を読んで、インターン参加者のことを考えました。

 はてなってインターネットでちやほやされている会社で、特にブクマは人気のサービスだから、その機能拡張担当できたというのは、インターン参加者にとって誇らしいのかもしれないけれど。

 何か「サービス」=「コードを書いて新しい機能を付け足す」という風に誤解しているんじゃないか。プログラムが得意な人が集まってきて、インターン参加者飲み会みたいなのがあって、お互いの持っている技術を紹介したりして、それをブログに書いたりtwitterに書いたり。何だかものすごく均一な人たちですね。妄想が多分に入っています。

 同じ価値観じゃつまんないと思うんです。「Twitter連携機能なんてゴミ情報を拾ってくるだけだ!」ってdisってほしい。「それよりもこれからは人力の時代だ」とか言って、ブクマ編集ユーザーに任せてしまったりして。同じブクマページをソースとして使った場合でも、id:Aの責任編集のページのほうがすっきりとしていて見やすい、と評判になれば、id:Aにとってもインセンティブになるでしょうし。Togetterをうきうきやっているような暇人がたくさんいるんですよ。そこをさあ、「データマイニングを使って自動化で」とか言いだしそうなのが、均一な人たちです。

 「俺だったらサーバー管理は全部高校生バイトにやらせるね、マニュアルを完備して。大体あんなの大卒仕事じゃないじゃん!」とか言ってほしい。「院卒なんてとんでもない!」とかも、喧嘩を吹っかける感じでよいと思います。自分以外の全員を売り渡す覚悟で。エンジニアの誇り、それっておいしいの? オペレーションコストが下がったら、サービスの向上なんだから。

 「中国人留学生ポータルサイトを作ります。将来的には彼らとのコネを使って儲けることも考慮に入れます」なんていうのはどうでしょう。ページはすべて日文・中文併記で。

 とかいろいろ書きましたが、はてな、大好きです!

2010-08-09

http://anond.hatelabo.jp/20100808204833

ちきりんは、海外が長いのと、株屋データマイニングやってたので、

海外事情データの読みが真骨頂。

逆に、それ以外は素人以下で、特に、データの読み方から敷衍しての

最終的にソリューションというか、具体的な提案レベルになると、

朝日新聞レベルとんちんかんな事を言い出す。

http://d.hatena.ne.jp/Chikirin/20100801

凋落するとしたらそのへんからだろうね。

2010-06-28

http://anond.hatelabo.jp/20100628012806

まぁネタで訊いたんですけどね…。

信号処理とか制御とか機械学習物理からネタ引っ張ってきてたり

これも実際問題(特に企業での採用とかでは)情報系の独壇場って感じだね。

金融のがまだマシ。

"Pattern Recognition and Machine Learning"のビショップ物理出身だけど、あの年代は確かにそういう色が強かったのかもしれない。

金融はまだ金融専攻がほぼ無い状態だから物理数学出身者が入り込む隙が多い気がする。

工学としては例外的に高度な(物理の道具としてはまあ普通の)数学を使ったりするので

全然高度じゃないです><

情報幾何とかは(無駄に)高度だけど、実用性はあんまないオナニー(しかも日本でしか流行ってない)感があるし。

CVレイトレーシングで経路積分使って云々というのもあったけど(その人はGoogleに言ってアドセンスかなんか作ってるらしい)、あれもまぁ適当パス空間で平均とるだけって感じがするし…。

画像処理とかでマルコフ確率場の統計物理学的な解析(イジングモデルとかポッツモデルとか出てくるアレ)でレプリカ法とか繰り込み群とか使ってるのも見たことあるけど(結構前の研究だからきっと今はもっと進んでいるはず)、企業で使うことってあるのかなあ。結局性能はあんま変わらないからもっとシンプルモデルでいいよとかなってそう。だったら物理の奴なんかいらねーじゃんみたいな。

あと勿論、理論物理の人は重工業方面でも引き合いが強いだろうしね。

これは…どうなんだろうか?

普通に日本の伝統新卒採用でそういう会社に行く人はいるけど、やってることは工学とかあるいは良くわからない専攻の人と同じな気がする。これはちょっと曖昧だけど。

ただ、採用現場では必ずしも好かれるとは限らない

これはガチだね。

特に情報系の分野は実装力で評価されることが多いし…。実装力は数値計算得意とかそういうのとは全く別のスキルだよね。プログラミングマニア的な要素が必要。

あとはまぁお決まりの暗号分野とかもあるけど、暗号じゃそんなにイス無いだろうし…。

最近はやっぱデータマイニング系に流れてるのかなあ。あれも数理的な素養というよりは職人芸的な色彩が強いけど。

という感じで実際問題厳しいなあと思います。

2010-04-05

発達障害

みたいな2択問題をたくさん用意して、発達障害の大量の当事者に答えてもらって、

そのデータ機械学習+データマイニング技術で解析すれば、

各症状とそれが社会生活で引き起こす問題の相関が分かったり、

精神科医よりもよっぽど上手く発達障害の診断ができるソフトウェアが作れたりしそう。

という妄想をした。

こういう研究をしている人はいないのかなー。

2009-02-25

http://anond.hatelabo.jp/20090225212936

もし市場に、こうした質の良いマグロのさくが「少し」欲しいってニーズが沢山あって、

営業をきちんとすればマグロ一本分の注文が集まるとすれば、上手い事やれないかな?

いや、これは結構おもしろいと思うぞ。

取引のクセが問題なら標準化しちゃえばいいんだよ。発注する側も受ける側も。

受注する側があたかも一つの会社で働いてるかのような感覚で多数の発注元の仕事をこなせるシステムを作れば良いわけだ。

オブジェクト指向的な感じで。ていうかこういうデザインパターンありそうw Mediatorとかかな?

まあ派遣会社システムと言えばそれまでだけど、もう少し柔軟でオープンな仕組みにできそう。

発注者・受注者のスケジュールや各種データ組み合わせ最適化の手法とかデータマイニングとかをかければ色々面白いことができるんじゃないだろうか。

2009-01-15

http://anond.hatelabo.jp/20090115205329

ついでに提供された各人のゲノム情報データマイニングして優秀である可能性が高い組み合わせのみ受精させるようにするのがいいと思う。もちろん一切人の手を介さずに機械的に行う。

2008-12-09

http://anond.hatelabo.jp/20081208235909

あくまで社会系の人を念頭に置いた話をしてるんですよ。

工学系はそりゃきちんとやるでしょう。データマイニング系とかもね。

もっと人間チックな、例えば人事とか組織論とか、営業とか企画とかの人も、そういう考え方持ってていいんじゃないかなあと思うということ。

もちろん持ってる人はいるだろうけどね。俺の見た限り、そうでない人もやっぱりいっぱいいるなと思う。

2008-11-28

もはや体温計はいらない。

http://www.google.co.jp/search?num=30&hl=ja&&q=%91%CC%89%B7&btnG=%8C%9F%8D%F5&lr=lang_ja

体温でググったら37度って言われた。

ネットは便利だ。もう体温計いらないな。

しかし、どうやって俺の体温はかったんだろ。

さすがにグーグル衛星が上空から遠赤外線で温度測定するようになるのは後2年ぐらい後だろうから

現時点では、体温と相関する何かを測定しているはず……。

検索履歴をデータマイニングして体調の変動を測定しておいて、

直近のキーワードからベイズ統計学の手法で体温の信頼区間でも求めているんだろうか。

(ちなみに、体重ではダメだった。「サイリウムハスク」とか「麻黄 ダイエット」とかヒントになりそうな内容で検索した事があるので、ある程度の情報は蓄積されていそうだが、やっぱり体重センシティブな問題だから「間違ったときのリスク」を考えて、そういう機能は搭載しない事にしているんだろうか。体重正規分布じゃない事が推測の障害になっている可能性も考えたが、正規分布になると知られている「身長」で検索しても身長は表示されなかった……)

2008-04-13

http://anond.hatelabo.jp/20080413225222

むしろ物理系の人の方がよっぽど簡単に入っていけるように思いますが。おそらくパターン認識とかデータマイニングとかそういう分野の方だと思いますが、物理やってた人は多いですよ。物理の人は統計力学やってるから色々計算方法のノウハウもわかってるし、エントロピーをはじめ、統計量を「物理量」として具体的なイメージと共に体でわかってるからとても強いと思うんですけれど。

特に変分法なんて、汎関数は全部(相対)エントロピーラグランジアンのどちらかに決まってるんですから。

2007-08-14

http://anond.hatelabo.jp/20070814200115

プログラミングの?

株とかのデータストレージしながら学習させていくのはある種の遺伝的アルゴリズムだとおもう。

遺伝的アルゴリズムいうとあまりピンとこないんだけど、

リアルタイムデータマイニングやー!いうとなんとなく馴染める。

って、まったく違ったらどうしよう。

こういうのがちゃんとアルゴリズム化できたら、ロボットの歩行とかそういう、パラメーター勝負なところがずいぶん楽になるんだけどねー。

自己学習はむずいよ。

あとちょっとで、できそうなんだけどね、、、

あー、もっと大量のデータを処理したいよー。

オラクルがおうちに欲しいよー。

データが欲しいよー。

データを管理してくれる子がほしいよー。

秘書さんもほしいよー。

お手伝いさんもほしいよー。

嫁さんもほしいよー。

子供もほしいよー。

利己遺伝子アルゴリズム発動。

ログイン ユーザー登録
ようこそ ゲスト さん