「データ」を含む日記 RSS

はてなキーワード: データとは

2012-02-11

http://anond.hatelabo.jp/20120211102443

データの塊やらパッケージやら円盤やらを買っている訳じゃない。本質的にはそのデータだの円盤などがもたらす「楽しい時間」を買っている訳だ。

その「楽しい時間」を買うためのコストが確定してない、ってことでしょ。

そして「楽しい時間」だけじゃなくて、サンクコスト効果を狙って、さらに金を引っ張ろうとする意図も見え透いてていけすかないしね。

http://anond.hatelabo.jp/20120211100238

そもそも「ゲームに求めるサービスを全て得る」と言う発想がよく分からないんだけど。

人がゲームに求めるのは「楽しい時間」でしょ。それ以外に得るものなんて無いしね。

データの塊やらパッケージやら円盤やらを買っている訳じゃない。本質的にはそのデータだの円盤などがもたらす「楽しい時間」を買っている訳だ。



ソーシャルゲーと言うか基本無料ゲームは、そういう所はパッケージ売りのゲームより良心的だよね。

自分で金に見合う「楽しい時間」を買えていると思うのなら金を払えばいいし、そう思わないのなら金を払わなければいい。

でもパッケージ売りのゲームは基本中身が分からない状態で買わないといけない。

何千円も出して買った円盤に全く楽しめないゲームが入っている可能性もある。その場合その何千円はドブに捨てたのと一緒だ。

2012-02-08

http://anond.hatelabo.jp/20120208230620

10年ぐらい前の経験なのでちょっと古いデータになるけど、

ネット賃貸情報誌に載ってる物件は、架空物件ではないけど客寄せ物件て感じで

実際不動産屋まで行ってみると埋まってたり内見できなかったりすることもあったよ。

ネットの下調べに時間かけるよりは、実際に現地へ行って、周辺を確認しながら駅前の不動産を回る方が早いと思う。

条件提示すると、わんさかってほどではないけど雑誌で紹介してない物件をいろいろ紹介してくれる。

不動産屋によってマンション系とか一戸建て系とか得意分野もあって、ある店で良い物件がなくても他にはある場合もある。


あと詳しいこと忘れたけど、確か不動産業を営むための資格みたいなのがあって、

その更新回数が多いほど老舗なんだけど、そういう古くから地元で商売してるとこの方が物件も多くて付き合いやすかった。

新しくて大きいところはノルマが厳しいのか、内見なしで決断を急かされたり、しつこく手付け金の支払いを勧められたり、

ちょっと強引な感じのとこが多かったな。

店構えだけで判断せず、複数の不動産屋をチェックしてみると良いと思う。

家選びは大変だけど、頑張ってね!

2012-02-07

彼女等が若くして突然亡くなる話しと、人口動態統計によるがん死亡データ

最近2ch彼女等が若くして突然亡くなる話しが流行っていますよね。

それで人口動態統計によるがん死亡データ見てみました。

http://ganjoho.jp/professional/statistics/statistics.html

エクセルダウンロードできるので、シートのnumberを見ると、部位でソートできます

例えば、膵臓がんで、2010年2009年に死亡した20から24歳の女性ゼロ人です。

もっと若い人や、数名いる年もありますが、やはり少ないですね。

でも全部位で見ると、年間24歳以下(4歳ごと集計)でも、50人ぐらいいます

男女合わせると100人ぐらいですね。

そう見ると、結構多いですね。2ch等に出てきそうな気もしますね。

データを見ても人口減少の深刻さは不明。 なぜ人口を増やす政策を総動員したいのか

http://diamond.jp/articles/-/16007

何十年か前は人口爆発による資源食糧不足のほうが心配されてたわけで

後知恵で「なんで増やさなかったんだ」というのは滑稽なように思う

たぶんそういう過去の経緯もろくに知らずに書いてるんだろうけど

それと一人当たりGDPスルーして国全体の数字で豊かさを見るのもおかし

GDPの大きさで豊かさ決まるなら精度やら産業構造今のままで形式的に47都道府県ごと別の国にしたら生活苦しくなるなるとか思ってんだろか

中国インド貧乏だし出生率の高い中東アフリカ貧乏な国ばかりなのになぜ人口増加=豊かと思えるのやら

日本国内で見たって高出生率低所得沖縄、低出生率所得東京ってな状況なわけだし

そもそも失われた20年ですら労働者一人当たり成長率は平均2%ぐらいあるわけで50年で総人口が半減しても国全体のGDPは減らないし

あと「人類の5000年の歴史の中で、1人が1人を支える社会が存立し得た事例は寡聞にして知らない」とかかいてるけど

養われる人口が老人だけだと思い込んでるからこういう勘違いをしてしま

子供妊婦も養われる側なので少子化高齢化が同時に進むと総人口に占める労働者の比率は大して変わらない

実際日本を含め就労率が50%前後の国は普通にあるわけですでに一人の労働者が一人の非労働者を養ってるのが現実

http://anond.hatelabo.jp/20120207162032

一言 見積もりだから 多めに取るもの と書いたはずだけど

多めに取る と 書いてあって、実際にデーターが50M超えてたら 多めに取るじゃなくて、少なめに取るだろ?

2012-02-05

やるきがでない

課題をやる気が出ない。

これができないと留年の可能性があるが、やろうと思ってPCに向かい課題データを開いたとたんに緊張感というか、不安というか、嫌悪感というか、なんか苦しい気持ちがこみ上げてきて、とたんにネットサーフィンに逃げてしまう。自己啓発(笑)系の本を読んで、実行してみた時期もあった。しかし、今となってはそれらを実行するやる気も起きない。明日こそやるぞ!と思ってとりあえず寝てみても、次の日は結局何かするわけでもなくだらだらと過ごすだけだ。いったい何が原因だというのか?昔は原因を紙に書き出して考えたこともあったが、今は原因を考えるやる気すらない。

僕の友人には課題をなんでも期日までにこなすやつがいる。興味のある課題でもない課題でも早めにやらなきゃ気が済まないという。あと、課題が終わった後のご褒美を設定すると課題を終わらす気になるとか言い出す。まるで自己啓発本にでてくるような文言だ。

ご褒美を設定したところで今の課題が嫌なのには変わりないから、そのご褒美を先に堪能してしまいそうにならないのか?と僕は尋ねた。しかし彼はならないらしい。意味がわからない。これはもう性格の問題か。

今日の僕もしばらくしたらあきらめて眠りにつくだろう。

そして今日と同じように朝を迎え、とりあえずPCの電源を入れ、また課題から逃げるのだろう。

うあー。

2012-02-04

立春の本掃除

立春心機一転

本の大掃除をした

投げ売り堂の2012年1月の結果と雑感。

来月には1周年を迎える投げ売り堂増田への2012年1月の結果と雑感を書き込みます

1月12月Google Analytics データ

目名 1月 12月 増減
ユニークユーザー 4822 4854 -33
ページビュー 32813 34212 -1399
平均ページビュー 1.55 1.66 -0.11
平均滞在時間 1:51 1:54 -0:03
新規訪問数 13.07% 15.87% -2.80%

詳細はいものように以下の Analytics の PDF に書いてあります

投げ売り堂の2012年1月の Analytics PDF



雑感。

1月は全く更新できず・・・。本当に申し訳ないです。

仕事で忙しい等の理由はあったんですが、主要な原因はネット界隈を賑わしているモバマス・・・

まんまと嵌ってしまいました。

杏ちゃんかわいい。でもきらりんもっとかわいい

両方とも SR なんて手に入らないけども・・・

ログイン機能などをボチボチ実装はしています

でも先に別の機能リリースする感じかもしれません。

2012-02-03

琉球大学木村政昭名誉教授地震予測

木村政昭氏の地震予測一部の人が知って偉く驚いてるようだけど、なんか過剰評価にしか見えないので。

まともに素人向けに検証したサイトないの?

TwitLonger — When you talk too much for Twitter

ざっとネットで調べても、どうも木村政昭氏の地震の目理論というのがよくわからないんだけど。ちゃんと見るものを見ればわかると思うんですけど今はパス

精度を調べると、多少見たところ「少なくとも一般の利用者にとっては現時点でそんなには高精度じゃない」というのが私の結論。

せめて 科学的・論理的な姿勢で原発の廃止を求める原発懐疑派のブログ  ネット反原発派の極北・「@tokaiama 東海アマ管理人」氏の地震予知は真実かデマか? 並みにチェックしたかったんだけど(これでも本来不十分だけど少なくとも東海アマ予測がでたらめであることだけははっきり分かる)、そこまではできなかった。

ざっと見たところ、東海アマレベルよりは比較にならないほど当てになる可能性は否定できなかったが、上記ブログにあるような「木村先生阪神淡路大震災以降、ほとんどの地震予測成功されていて、」っていうのは「え、ホントかいな?」というのが私の見解

まず、見てみよう。

彼の公式サイトのうち、2011/3/11もっとも直前2011/02/18の日本列島地震予測図だ。

My Blog

2007年には一度予測していたはずの、三陸沖の予測が書かれていない。

日本付近の地震予測図(M≧6.5)

木村説に基づく私案 (2009年8月6日公表)にも、やっぱり三陸沖はない。

そして、2011/3/9、後から「前震」であったとわかった地震直後

My Blog

これの目があったと突然言っている。

2011/3/11が終わってのち、

My Blog

目があったと言っている。しかし、それまでの上記引用すべての図と違うように見えるのだが。

2011/3/9の前震の予兆と2011/3/11予兆を取り違えることはあってもおかしくはないかもしれない。また、この比較だけをもって、地震の目理論の中身をデータ比較して検討しなければ「地震の目」理論そのもの妥当性(多少なりとも役に立つかもしれない、という可能性も含めて)を否定することはまったくできない。が、現時点で「木村政昭氏は2011/3/11三陸地震を的確に予想していた」と言われると、まったく予測してなかったこと断言できる情報には欠けるが、的確な予想が出来ていたというのは無理ではなかろうか。実は予想してたんだけれども政治的理由等で隠していたとか言われたらちょっとまぁ私には手に負えないが。

で、本当はもっと過去予測と実績を予測履歴と比較すべきなのだが、ぱっとぐぐっても私には見つからなかったので、

みつかったうちの最も古い前述の「木村説に基づく私案 (2009年8月6日公表)」でみてみよう。

再掲)日本付近の地震予測図(M≧6.5)

このうち、台湾付近(2009±2)のは当たってれば来てるはずなので、とみてみると

NEIC: Earthquake Search Results

…なさそうに見えますが。M5.5以上検索。2009/8/1~本日。当たっていればLAT21付近にあるはずなんですけど(このシステムデータ漏れがあったらわかりませんが)。そんな地震があったというエビデンスがあったら教えてください…。他のは予測期間が終わってないんで判定できませんが。。。

千葉周辺はなんか最近の他の学者が言ってるのと似てないこともない気がしますので、これは当たるのかもしれません(既に311余波で起こってたりします?)

鹿児島南東沖はまだ予測範囲終わってませんが、気象庁 | 震度データベース検索とかで見る限り、鹿児島震度1以上で震源地とマグニチュードが一致するものは見当たりません。

で、2011/8/9版をみると

My Blog

随分変わってますね。

まぁ、3/11で大きく事情が変わったとかいうのが地震の目理論に当てはまるかわかりませんが(311でまったく過去データが使い物にならなくなってたとすると多分私が見た数ページからして地震の目理論はたぶん、当分の間精度ががくおちです)。

過去のは図から抜いてるだけで予測撤回してないって話だと過去のも全部並べて重ねないと予測意味がだいぶ減ってしまいそうですが)

外れが多かろうとも、一定の精度があるのであれば、まぁ備えることに無意味とは必ずしも言えないので、私が見た限り、「東海アマみたいに信じるのがバカ」レベルであるという判断はできませんでしたが、警戒情報として参考にするならともかく、現時点であまり祭り上げるのはどうだろうかと思うわけですが。

また、上記検証では理論の正しさは何も検証してないので、この理論の今後についてもなんら評価してませんので、将来この手法が精度を上げて実用化される可能性を否定するものではありません(とりたてて肯定もしませんけど)。

2012-01-30

googleプライバシー ポリシー改悪が俺の中で話題に

http://www.google.co.jp/intl/ja/policies/privacy/preview/

Google が収集する情報

Google は、すべてのユーザーによりよいサービス提供するために情報を収集しています。その内容は、お客様の使用言語などの基本的情報からお客様にとって最も役に立つ広告オンラインで最も重要視している人物などの複雑な情報まで、多岐にわたります

情報の収集は以下の 2 種類の方法で行います:

お客様から提供いただく情報 たとえば、多くの Google サービスでは、Google アカウントのご登録が必要です。ご登録に際して、氏名、メール アドレス電話番号、クレジットカードなどの個人情報提供をお願いしていますGoogle提供する共有機能をすべてご活用いただく場合は、公開される Google プロフィール作成していただくようお願いすることもあります。これには、名前写真などを掲載することができます

サービスのご利用時に Google が収集する情報 Google は、ご利用のサービスやそのご利用方法に関する情報を収集することがあります。たとえば、Google広告サービスを使用しているウェブサイトアクセスされた場合や、Google広告コンテンツを表示または操作された場合です。これには以下の情報が含まれます:

端末情報

Google は、端末固有の情報(たとえば、ハードウェア モデルオペレーティング システムバージョン、端末固有の ID電話番号などのモバイル ネットワーク情報)を収集することがありますGoogle では、お客様の端末の ID電話番号をお客様Google アカウントと関連付けることがあります

ログ情報

お客様Google サービスをご利用になる際または Google提供するコンテンツを表示される際に、サーバー ログ内の特定の情報自動的に収集および保存されます。これには以下の情報が含まれることがあります:

お客様による Google サービスの使用状況の詳細(検索キーワードなど)

電話ログ情報お客様電話番号、通話の相手方の電話番号、転送先の電話番号、通話の日時、通話時間SMS ルーティング情報、通話の種類など)

インターネット プロトコル アドレス

端末のイベント情報クラッシュシステム アクティビティ、ハードウェアの設定、ブラウザの種類、ブラウザ言語お客様によるリクエストの日時、参照 URL など)

お客様ブラウザまたはお客様Google アカウントを特定できる Cookie

現在地情報

現在地情報を有効にした Google サービスお客様がご利用になる場合Google は、お客様現在地に関する情報携帯端末から送信される GPS 信号など)を収集して処理することがありますGoogle は、たとえば、お客様の端末のセンサー データから提供される近くの Wi-Fi アクセス ポイント基地局に関する情報など、他にもさまざまな技術を使用して現在地を判定することがあります

固有のアプリケーション番号

サービスによっては、固有のアプリケーション番号が割り当てられています。この番号とお客様インストール情報オペレーティング システムの種類、アプリケーションバージョン番号など)は、お客様が当該サービスインストールまたはアンインストールする際に Google に送信されることがあります。また、当該サービスGoogleサーバーに定期的にアクセスする際(自動更新の際など)にも送信されることがあります

ローカル ストレージ

Google は、ブラウザ ウェブ ストレージHTML 5 など)やアプリケーション データキャッシュのようなメカニズムを使用して、収集した情報個人情報を含む)をお客様の端末にローカルに保存することがあります

Cookie匿名 ID

お客様Google サービスアクセスされると、Google はさまざまな技術を使用して、情報を収集して保存します。その際、Google からお客様の端末に一つまたは複数の Cookie匿名 ID を送信することもあります広告サービスや他のサイトに表示される Google 機能のように、Googleパートナー提供しているサービスの利用の際に、GoogleCookie匿名 ID を使用することもあります

引用終わり

2012 年 3 月 1 日に発効

凄い!!!!!!さすが!!!小学生並みの感想

2012-01-29

反橋下派が議論で勝てない理由

橋下はこの一回の議論で負けたらお金も地位も名声も失うというスタンスで臨んでいる。

相手の勉強をし、データを整理し、バックアップ体制を固め、どうやったら強みを全面に出せるか、弱みを隠せるかの作戦を立て、闘いに出ている。

弁護士スゲーと思わせるところがある。

他方、相手のやる気のなさ。

まず第一に、相手を甘く見てる。

学者官僚政治家民間人

というような序列が頭の中にあって、橋下は政治家ではなく民間人カテゴライズされてる。

民間人ときがッ!

という意識がある。

それに、議論に負けてもまったく痛くない。

反橋下派は、反橋下派のグループ内で生きているので、仲間内での評判さえ落とさなければ痛くないのだ。

たとえば君が代日の丸反対派の中での序列は、どれだけ君が代日の丸を激しく叩くかで序列が決まっているので、いか日の丸が、君が代が悪かを説くかに固執する。

悪という前提から始まるので議論にならないし、聴衆のジャッジでは負けるのだが、本人達はそれで満足してる。

二番目に、学者はとにかく保留しておくことが好きだ。

現時点で正しいとされていることを覆すことで真理に近づけると思ってるので、たとえ今は正しくても、といって実行に移したがらない。

そもそも、学問を世に還元するより、学問を追求したいか学者などをやっているわけで。

これは自分の個人的が想像だけど、学者10人に1人くらいは嫌儲思想だ。

50代、60代の古株のなかには、民間就職するなんて資本家の手先になることだ!という理由で学者になった人間もいる。

文系だととくに顕著だったはずだ。

もちろん、学生運動逮捕までされちゃったような過激な連中は途中で退学しちゃったわけだが、口先は一流、実行力はない、という人間学者になってる(場合もある)。

あんまり過激だと出世の道もなかったんだけど、社会党が強かった北海道なんかは、思いっき左派思想でも出世できたし。

理系だって嫌儲主義は一定数いる。

科学科学の発展のためだけに存在するべき、という消極的嫌儲主義。

原水爆と相性がいい。

共産主義が勢いがなくなり、平和主義看板を変えはじめたころから歩を同調させている。

まあとにかく、グダグダが好き。

権力不干渉アカデミアの楽園を目指してる。

俺が思うに橋下の

「そうはいっても予算と人を引っ張るのは金も労力もかかるし、その原資は税金だし、グダグダ言ってても前に進まないから」

という主張はもっともだ。

それに対して

「いや、教育学問世界はそういうものではない」

という反論もありだとはおもう。

ただ、正しいことだから堂々と主張する!悪いのは橋下!

という態度は、橋下に言われた通り、税金で食わされてるのにその態度はなに?

と聴衆に判断されてしまう。

それから君が代日の丸の強制は教員だけということなので、子供教育に~という話にできないのも大きい。

だって大阪私立高校無料だし。

嫌なら違う高校に行けばいいって話で、小学校中学校は私立は無料じゃないけどさ。

でも、騒いでるのってほとんど高校教諭だよね。

橋下にだって、突かれると痛い部分はあると思う。

俺は大筋で賛成だけど、大阪の抱える諸問題がクリアされるとは思えない。

大阪都構想経済地盤沈下をどうにかできるというわけでもない。

ただ、そこんところは代案がないのなら、聞かせて欲しい、という態度で聞くべきじゃん。

教育基本条例犯罪率が下がらなかったらどうするんですかッ!?

じゃダメだろJK

2012-01-27

http://b.hatena.ne.jp/entry/www.techdoll.jp/2012/01/26/womenpower_2012/

自身の為じゃなくて妻、母として購入している部分が分析に挙がってきてない。

へ?

「従来の男性商品に関しても、その50%以上を女性が購入している」「家庭の買い物を主に行うのは自分だと答えた女性が75%」「ママ市場」辺りから

そういう部分が大量に含まれている事は十分読み取れるだろ。

つーかその程度は皆「常識」で分かっていると言う前提でわざわざ強調してないだけじゃね?



でも

自分収入女性を関係させなければ支出抑制できるというデータ

こんな馬鹿コメント書いてる奴もいる(しか結構星がついている)辺り、読み取れてない奴多いのか?

2012-01-26

ソフトウェア開発プロジェクト一定規模以上)がトラブルが起こって

ソフトウェア開発プロジェクト一定規模以上)がトラブルが起こって納期までに終わりそうにない、赤字が出てでも終わらせないと困る時の別解

色々な方法があるんだけど、その中でもなぜかこういう方法をとるところが案外少ないように思われるので…。この方法はもちろん万能じゃないので、「こんな欠点がある」って突っ込みはいっぱいあるでしょうが、「いついかなる時でも使えない」話ではないレベルです。

・増員する、ただし、雑用係専用部隊を大幅に。

→業務メインをやる人が増えるとコミュニケーションコストが増大してかえって遅延する現象は散見されますので、そういうコストが相対的に起きにくい仕事になるべく人を投入するという発想です。

 ただ、これは、「低時給バイトさん」「事務職」ではだめです(チームの中にそういう人を入れるのはい場合も多々ありますが、「低時給バイトさん」「事務職」ばかりを多数入れてもソフトウェア開発では大抵困ります。つまりPG/SEレベルの、ソフトウェア開発の一般常識のある単価の高い人を敢えて雑用や事務に投入するんです。これの一つのデメリットSE/PGにそんな仕事をさせるとモチベーションが下がって当然なので、長期には向きません。プロジェクトが長いなら少しずつメンバーを入れ替えながらがベターかと。

例)「このデータ加工しといて」と振ってExcelベース関数とかVBAは使えてよ)なりスクリプト言語なりで加工する人

例)コピーを頼まれたらそれに徹する人 …ここだけ見ると単価高い人をそんな仕事に、と思うかもしれませんが、変にチームに投入して遅延を拡大させるのとどっちがいいんですかって話ですよ。

 議事メモではなく議事録が必要なら、録音してテープ起こしするのの草稿を別の人がやる(ここ例えメインの仕事に入ってなくともSE/PGかどうかで品質が随分違う。もっというと、草稿の草稿は音声認識ソフトやらせる手もある 録音レベルが悪いときついけど)…これは普通プロジェクトでやってもまずコスト的に割が合わないでしょう。あくまでここに書いているのはすべて「赤字が出てでも早く終わらせる」みたいな特殊な状況なのでやってみるといい場合があるんじゃないの、というお話です。

例)必ずしも雑用ではないが、特にキーマンには秘書をつけてしまえ。その人のスケジュール管理から色々とね。秘書検定もってるエンジニアかいたら最高ですが(どんだけおるんや) この人に用事があるんだけど今取り込み中…みたいな時って用事がすんでからタイムリーにってなかなかいかないんですよね。秘書がいたらなんとかできませんかね?

人を横断して作業効率化を図れる書類の自動化とか可能なら専任作ってExcel VBAでもスクリプト言語でもなんでもいいので作ってしまえ。

・アメニティの充実を図る。

 機材のせいでボトルネックになってませんか?PCの性能は大丈夫ですか?ディスプレイは大きいですか?プリンタコピー機の数は足りてますか?プリンタコピー機の速度は十分ですか?カラー印刷出来ますか?ファイル共有サーバが遅かったりしませんか? ※PCを変更すると環境移行コストはかかりますが、一時的なものです。

 事務専門でも出来る所では「コピー用紙がなくなってから補充までにタイムラグとかないですよね」とか

 ドリンク飲み放題でもいいじゃないですか

 ポットに沸かしたお湯が空っぽとかないですよね? …まぁこれはエンジニアじゃない人に任せてもいい領域。

 ホワイトボードに書いたもの電子データPCに送れるとかいまどき常識ですよね?丁寧に書いてあったらOCRも可能ですよね?

 経費で、高いのでいいかうまい弁当オフィス配達してしまえ ※税金の問題等色々あるし、自分で選んだり外食に行く方が効率上がる人もいるので全員ってわけにはいかないんですけど。希望者だけでも。

赤字覚悟で増員してるのに、人を増やしたけど「予算がないかPCにいいのが調達できなくって」って話は実在するようですが、何かおかしくないですか?

1人月60万とか100万とか何人も入れるのに。会計上の問題とか壁があるので表面的な金額では決められないんですけど、でもおかしくないですか?

あ、上記のようなことを実際にやって酷い目にあったエピソードがあったら教えてください。「うまくいかない場面」なんて当然いくらでもあると思うので。

2012-01-25

http://anond.hatelabo.jp/20120124142332

http://www.itarda.or.jp/itardainfomation/info20/info20_1.html


そのデータ、相互車両事故データじゃねーかよ。

しかも、セダンって1500以下の値じゃねーか。1.21だろ。セダンタイプは。


しかも、相互車両事故の相手車両の車種構成では圧倒的に軽が少ない。

というか、軽同士の死亡比率がセダンと軽の死亡比率より低いとかどうなのよw


単独車両事故なら、軽26.19、セダン51.5、ワゴン43.58 だろうが。

セダンワゴンは軽の2倍も自殺してるって事になる。


むしろ車種よりシートベルトの装着率の方が死傷率に響くし、

軽に乗るとセダンの2.3倍、ワゴンの2.5倍死ぬんだな。

とか言われてもな…w


ちなみに、衝突相手死亡事故台数(2000)だと、

軽は0.33、~2500が0.66、2500~が0.91。

重量に比例して死傷率上がるとか。


軽の方が他人にかける迷惑面では安全じゃねーの?

2012-01-23

ネットやってて意外と少ないなぁ~と思うのは

2012-01-22

異性と付き合うサイクルが極端に短い男性、というのがたまにいる。

この人達には共通の特徴がある。

「内心語」が多いのだ。少し古い例だけど、『東京大学物語』の村上くんのようなタイプ

彼らはけっして頭は悪くない。

しかし、頭の中の推論とデータに頼るあまり、目の前の相手との対話をほとんど拒絶している。

そして俺はモテナイとうそぶき、不毛セックスを繰り返し、女性不信を高めていく。

gettingrealbot 「小さなチーム、大きな仕事」   
すごい製品サービスを生み出す最も単純な方法は、あなたが使いたいものを作ることだ。自分が使いたいものを作ると、作り手は作るものと恋に落ちる。問題も、解決の価値も、よく知っている。それは何者にも代え難い。

いやいやいや。自分感覚で作っちまうと高確率で失敗するので避けた方が無難。常にデータを信頼せよ。

[]マネーの話

円高の正体 (光文社新書) - 安達誠司

マネー進化史 ファーガソン

貨幣論 (ちくま学芸文庫) - 岩井 克人

お金から見た幕末維新――財政破綻と円の誕生祥伝社新書219) - 渡辺房男

歴史が教えるマネー理論 - 飯田 泰之



経済学思考の技術論理経済理論データを使って考える - 飯田 泰之

農業で稼ぐ!経済学 - 浅川 芳裕

世界一シンプル経済入門 経済は損得で理解しろ! 日頃の疑問からデフレまで - 飯田 泰之



紫式部の欲望 - 酒井 順子

徒然草REMIX - 酒井 順子

格闘家に学ぶ体脂肪コントロール―なぜ格闘家は3時間で3kg体重を落とせるのか? - 佐々木

http://anond.hatelabo.jp/20120121115303

楽天の商品ページを日本語処理する際の概要について。

これは、「事務職リーマンwebサービス作ってみた話」のトラックバックに対するトラックバックです。


サイズデータ抽出の正確性について

もちろん、この手のアルゴリズム処理に「完璧」は存在しません。

ですが、拾った結果の品質を数百個ばかり、サンプリングで調査した範囲では、商品サイズを拾える商品のうち、9割を大きく超える率で、正しいサイズを拾えていますので、

「たまにはミスってますが、おおよそ役に立つ」

レベル認識率は十分に達成していると思ってます

もちろん、検索できる商品数が尋常じゃないので、サイズ抽出ミスっていそうな商品を狙い撃ちで探すと、結構見つかったりはしますが。


ちなみに、上記の「商品サイズを拾える商品」という表現には、レトリックがありまして、結構楽天ではサイズ画像のみで記載されている商品もありまして、そういうものは、当然、検索できない商品となっています

まあ、これは仕方が無いところです。




商品サイズ抽出について

サイズは、正しくサイズを拾えるよう、複数の書き方パターンサイズ候補を抽出しています

おおまかには、

  ・幅XX × 奥行YY × 高さZZ(センチ)

  ・幅×奥行×高さ(単位センチ・・・・・・XX × YY × ZZ

 の2パターンで、このパターンを軸に、さまざまな派生対処しています

 この派生(というかノイズ要因)が滅茶苦茶いろいろなパターンであって、相当手を焼きました。



拾ったサイズ候補に対応するサイズ単位センチミリ)の抽出

 実はこれも、簡単そうに見えて、結構、面倒なところでした。

  ・サイズ記載部分から遠く離れた部分に(単位ミリ)とか書いてある場合がある

  ・センチミリを混在してサイズ記載している場合がある

 など、さまざまなパターンがあり、結局、サイズ記載箇所の前後を見て、距離などから重み付けを調整して、サイズ単位を拾っています

 また、そもそもサイズ単位が記載されていない(意外とよくある)場合は、サイズ値の大きさを見て推定したり、(例えば、家具カテゴリサイズ表記に小数点があれば、それはきっと、ミリではなくセンチだろう、など。)全く見当が付かん、というときには、決めで処理したり、仕方なくあきらめたり・・・といった処理をしています



正しい商品外寸の指定

 サイズを拾うだけでは、梱包サイズとか、引き出し内寸とか、ノイズが多いので、これらは、重み付けを行い、一番重み付けが高いものを外寸サイズとして拾っています

 この辺の重み付けは、ある程度、作りこんでいますが、もちろん、完全ではないので、今後のブラッシュアップが必要な部分です。



型番など等で、そもそも違う数字を拾ってしまうこと対策

 こちらは、型番等で誤反応を起こしやすい、W/D/Hでの記載サイズのレーティングを少し下げて対処しているのですが、初めのほうにトラックバックを頂いた方もご指摘されているとおり、それでもある程度引っかかっちゃいます

 タイトル中の型番を検索外すとかの手も無くはないのですが、型番って意外と本文中にも多くて、例えばテレビ台とかで、本文中にテレビ型番をズラズラ列挙されて、それが反応した時もあります

 一応、異常値についてはレーティングを下げたり、サイズ数値取れずで処理はしています・・・みたいなところではありますが、検討すべき改善箇所です。



意外と多い、店舗側のサイズ記述間違い対策

 ex)「幅800×奥行400×高さ100センチ」の棚・・・など。

 こちらは、最終的なサイズ数字を見て、「サイズ単位の書き間違い・拾い誤り推定」の判定を入れておりまして、判定に抵触したサイズについては、正しいと思われる単位に変更・救済しております

 もちろん、フォローにも限界があったり、フォローを行って二重遭難する場合もあるんですが、検証してみたところ、ほんのわずかな二重遭難よりも、誤り救済を行ったほうがはるかに結果がよかったので、処理を入れてます



楽天自体がサイズ検索対応することリスクについて

このリスクは、着手する前によく検討しました。

ただ、結論から言うと、サイズ情報に対する、楽天市場側の動きはほとんど無いと読んでおります

なぜなら、圧倒的にニーズが高く、ハードルも低いと思われる、送料込み価格検索すら、彼らは実現できてないからです。

恐らく、楽天側では、出店側に登録させる情報を、いじりたくないと思っているのではないでしょうか。

しかも、サイズ情報は、楽天が扱っているほとんどのジャンルの商品にとっては、それほど重要性の高くない情報です。

ごく一部のジャンル向け以外は重要性の高くない追加の登録情報なんて、楽天はあまり実装したくはないのではないでしょうか。


・・・と、そういう読みをしてますし、さらに、読みが外れて楽天対応を行ったとしても、別に私は片手間でやっているだけなので、それほどペナルティが大きい訳ではありません。

ということで、「許容できるリスク」と判断しています



以上、カグサイズのページ処理の内容部分の説明でした。

それではー。


----------

幅x奥行x高さ(家具サイズ)で商品を検索できる、楽天市場家具カテゴリ専門の検索エンジン

カグサイズ検索

http://kagusize.com

2012-01-21

http://anond.hatelabo.jp/20120121113906

正確性をとろうとすると簡単じゃないね・・・

自由に記載された中から外寸を単位そろえて縦横高さと拾うのはけっこう骨が折れる



俺がやるならとりあえず数字が書いてある前後をすべて拾って

パターンをある程度絞り込んでデータ抽出する

うまく取れる気がしないね



大変な上に、売れ始めたら楽天入力情報として縦横高さを別項目にして検索機能を搭載するであろうことから

労力が報われないことうけあい

http://anond.hatelabo.jp/20120121094900

こんなデタラメデータだしてバレてないなんて思ってるはずネーヨwwwwwwwww

http://anond.hatelabo.jp/20120121094839

お前データ信じてたの?

プゲラッチョwwwwwwwww

3回目くらいでオレは気づいたよ

オレも適当だけど、こいつもけっこう適当に言ってるだけだなって

双方データも出さずにただ言い合うのが楽しかった



どっかのバカが茶々いれてきやがったよ

空気よめ

- 転職ならen
- 派遣ならen
123ページ中1ページ目を表示(合計:3060件)