はてなキーワード: データマイニングとは
最初は、やりたいことが形になって、友達の輪が広がって、よい技術にふれられる機会がふえて、憧れていた技術者が自分のイベントで発表してくれて楽しかった。
そのうち、色んなイベントに発表者として呼ばれる機会が増えてきた。
ノルマが付き纏い、自分のイベントの告知をしていかなくちゃいけなくて
来てくれた発表者のイベントに遊びにいって週末に何件も勉強会をハシゴするようになった。
仕事も週末も忙しくて休むヒマがなかった。
一緒に勉強会している仲間内でも「告知をする人」と「ほとんどしない人」がでてきた。
あくま趣味なのでそこまできつく言う事もできずせめて自分が動いてるのを見て動く気になってほしいと思いながら動いた。
それでも動かない人は何かと理由をつけて動かなかった。
ふらふらで明け方、山手線寝過ごして何周もしながら何をやってるのかよくわからなくなった。
好きなことなのに疲れてしまった。
勉強会のために未翻訳の原書を買い勉強会のために勉強会にいくひとが多いのかもしれない。
どんな有名な人を呼んでいてもそれは周りの友人達を惹きつけるためで
結局内輪で発表者無限ループ。
行けばそれなりに楽しめるけど、最後に残るものがみつからない。
プログラムがずっと好きで、かっこいいコードを書いてた技術者に憧れていただけなのに。
明け方のサーバールームで生まれる不思議な一体感に憧れていただけなのに。
なにがしたいのかがわからなくなっている。
「Twitter連携機能」http://hatena.g.hatena.ne.jp/hatenabookmark/20100906/1283746029を読んで、インターン参加者のことを考えました。
はてなってインターネットでちやほやされている会社で、特にブクマは人気のサービスだから、その機能拡張を担当できたというのは、インターン参加者にとって誇らしいのかもしれないけれど。
何か「サービス」=「コードを書いて新しい機能を付け足す」という風に誤解しているんじゃないか。プログラムが得意な人が集まってきて、インターン参加者の飲み会みたいなのがあって、お互いの持っている技術を紹介したりして、それをブログに書いたりtwitterに書いたり。何だかものすごく均一な人たちですね。妄想が多分に入っています。
同じ価値観じゃつまんないと思うんです。「Twitter連携機能なんてゴミ情報を拾ってくるだけだ!」ってdisってほしい。「それよりもこれからは人力の時代だ」とか言って、ブクマの編集をユーザーに任せてしまったりして。同じブクマページをソースとして使った場合でも、id:Aの責任編集のページのほうがすっきりとしていて見やすい、と評判になれば、id:Aにとってもインセンティブになるでしょうし。Togetterをうきうきやっているような暇人がたくさんいるんですよ。そこをさあ、「データマイニングを使って自動化で」とか言いだしそうなのが、均一な人たちです。
「俺だったらサーバーの管理は全部高校生のバイトにやらせるね、マニュアルを完備して。大体あんなの大卒の仕事じゃないじゃん!」とか言ってほしい。「院卒なんてとんでもない!」とかも、喧嘩を吹っかける感じでよいと思います。自分以外の全員を売り渡す覚悟で。エンジニアの誇り、それっておいしいの? オペレーションのコストが下がったら、サービスの向上なんだから。
「中国人留学生のポータルサイトを作ります。将来的には彼らとのコネを使って儲けることも考慮に入れます」なんていうのはどうでしょう。ページはすべて日文・中文併記で。
とかいろいろ書きましたが、はてな、大好きです!
まぁネタで訊いたんですけどね…。
これも実際問題(特に企業での採用とかでは)情報系の独壇場って感じだね。
金融のがまだマシ。
"Pattern Recognition and Machine Learning"のビショップも物理出身だけど、あの年代は確かにそういう色が強かったのかもしれない。
金融はまだ金融専攻がほぼ無い状態だから物理や数学出身者が入り込む隙が多い気がする。
全然高度じゃないです><
情報幾何とかは(無駄に)高度だけど、実用性はあんまないオナニー(しかも日本でしか流行ってない)感があるし。
CVのレイトレーシングで経路積分使って云々というのもあったけど(その人はGoogleに言ってアドセンスかなんか作ってるらしい)、あれもまぁ適当なパス空間で平均とるだけって感じがするし…。
画像処理とかでマルコフ確率場の統計物理学的な解析(イジングモデルとかポッツモデルとか出てくるアレ)でレプリカ法とか繰り込み群とか使ってるのも見たことあるけど(結構前の研究だからきっと今はもっと進んでいるはず)、企業で使うことってあるのかなあ。結局性能はあんま変わらないからもっとシンプルなモデルでいいよとかなってそう。だったら物理の奴なんかいらねーじゃんみたいな。
これは…どうなんだろうか?
普通に日本の伝統的新卒採用でそういう会社に行く人はいるけど、やってることは工学とかあるいは良くわからない専攻の人と同じな気がする。これはちょっと曖昧だけど。
これはガチだね。
特に情報系の分野は実装力で評価されることが多いし…。実装力は数値計算得意とかそういうのとは全く別のスキルだよね。プログラミングマニア的な要素が必要。
あとはまぁお決まりの暗号分野とかもあるけど、暗号じゃそんなにイス無いだろうし…。
最近はやっぱデータマイニング系に流れてるのかなあ。あれも数理的な素養というよりは職人芸的な色彩が強いけど。
という感じで実際問題厳しいなあと思います。
もし市場に、こうした質の良いマグロのさくが「少し」欲しいってニーズが沢山あって、
営業をきちんとすればマグロ一本分の注文が集まるとすれば、上手い事やれないかな?
いや、これは結構おもしろいと思うぞ。
取引のクセが問題なら標準化しちゃえばいいんだよ。発注する側も受ける側も。
受注する側があたかも一つの会社で働いてるかのような感覚で多数の発注元の仕事をこなせるシステムを作れば良いわけだ。
オブジェクト指向的な感じで。ていうかこういうデザインパターンありそうw Mediatorとかかな?
まあ派遣会社のシステムと言えばそれまでだけど、もう少し柔軟でオープンな仕組みにできそう。
発注者・受注者のスケジュールや各種データに組み合わせ最適化の手法とかデータマイニングとかをかければ色々面白いことができるんじゃないだろうか。
http://www.google.co.jp/search?num=30&hl=ja&&q=%91%CC%89%B7&btnG=%8C%9F%8D%F5&lr=lang_ja
体温でググったら37度って言われた。
ネットは便利だ。もう体温計いらないな。
しかし、どうやって俺の体温はかったんだろ。
さすがにグーグル衛星が上空から遠赤外線で温度測定するようになるのは後2年ぐらい後だろうから
現時点では、体温と相関する何かを測定しているはず……。
検索履歴をデータマイニングして体調の変動を測定しておいて、
直近のキーワードからベイズ的統計学の手法で体温の信頼区間でも求めているんだろうか。
(ちなみに、体重ではダメだった。「サイリウムハスク」とか「麻黄 ダイエット」とかヒントになりそうな内容で検索した事があるので、ある程度の情報は蓄積されていそうだが、やっぱり体重はセンシティブな問題だから「間違ったときのリスク」を考えて、そういう機能は搭載しない事にしているんだろうか。体重が正規分布じゃない事が推測の障害になっている可能性も考えたが、正規分布になると知られている「身長」で検索しても身長は表示されなかった……)
プログラミングの?
株とかのデータをストレージしながら学習させていくのはある種の遺伝的アルゴリズムだとおもう。
遺伝的アルゴリズムいうとあまりピンとこないんだけど、
リアルタイムデータマイニングやー!いうとなんとなく馴染める。
って、まったく違ったらどうしよう。
こういうのがちゃんとアルゴリズム化できたら、ロボットの歩行とかそういう、パラメーター勝負なところがずいぶん楽になるんだけどねー。
自己学習はむずいよ。
あとちょっとで、できそうなんだけどね、、、
あー、もっと大量のデータを処理したいよー。
オラクルがおうちに欲しいよー。
データが欲しいよー。
データを管理してくれる子がほしいよー。
秘書さんもほしいよー。
お手伝いさんもほしいよー。
嫁さんもほしいよー。
子供もほしいよー。