適当に増田のキーワードリンクをつついていたら「増田の流行語を調べてみたら、やっぱりお前らは○○コンだった」というエントリにたどり着いて面白いなと思ってしまった。
http://anond.hatelabo.jp/20140127113403
これならできるかもと思い立ち、5時間を費やして完成した2017年3月版(1日から22日)がこれ。
シロウトなのでどれがノイズか分からないし、単語の切り分けもMeCab+JUMAN辞書とお手軽に済ませてしまったので、同等のものだとは思わないでね
一日中張り付いて書いてる人がいるよね
好きとか言わない人達かと思ってた。失礼だった。
5割がた増えた
数は減っているが、集計日数的にも減ってるので2%減の横ばい
13位 意味 = 799
14位 会社 = 752
15位 関係 = 745
16位 世界 = 734
18位 女性 = 716
19位 死 = 712
20位 家 = 695
21位 普通 = 694
22位 社会 = 676
23位 金 = 662
25位 相手 = 606
26位 気持ち = 604
27位 アニメ = 598
29位 頭 = 558
30位 理解 = 544
ちなみに
JavascriptとかRubyとかPythonとかでweb系の仕事してる。SNSとか、ブラゲーとか、それなりのものなら作れると思う。 例えば、萌えキャラの目覚ましアプリとか、イタズラ用のブラクラとか、T...
きっかけ 増田で「増田のデータをクラスタリングしたら面白いんじゃね?」って話になった ■暇だからリクエストされたプログラム作るけど、需要ある? クラスタリングはメタデータ...
適当に増田のキーワードリンクをつついていたら「増田の流行語を調べてみたら、やっぱりお前らは○○コンだった」というエントリにたどり着いて面白いなと思ってしまった。 http://ano...
とりあえず増田で使われている単語数を調べてた。 http://anond.hatelabo.jp/20140127113403 特徴を表すメタデータが集まったらクラスタリングもやる。
漏れがやろうとして出来てないことなんだけど、 ・1記事ごとにmecabで使用されてるワード抽出 ・使用頻度上から5つのワードを100%分の使用割合にする。 ・100%を3ビットくらいの閾値...
最近、Googleの画像検索から商品を購入することが多いんだけど、 候補の商品をいちいちブクマしたり、値段でソートしたりするのが面倒で仕方がない。 これをもっと簡単にできるように...
需要あったみたいだな。寝るとこだった。 へ〜Googleで商品検索してるんだ。面白いね。 ちょっと確認 1)価格でソートできる、画像検索のブクマを作ればいいんだな? 2)対応させ...
性能とかわりとどうでもいい家電とか服だと、デザインでしか見ないから画像がすべて 1)価格でソートできる、画像検索のブクマを作ればいいんだな? うん、ブクマってことは自...
了解。サンプルができたら教える
返信おくれた。もう見てないだろうけど、一応。 俺っちが作ってもよかったんだが、Googleという会社がすでに商品検索エンジンを作っていたようだ。価格別に表示したりできるっぽい。...
増田に蓄積された文章の特徴をクラスタリングして何人くらいの人が書き込んでるのかを明らかにして欲しい
クラスタリング!ビックデータだな。おもしろそう。 完全に特定できるかは分からんが、ひらがなの割合とか、文章の構成順とかで、カテゴリ分けはできると思う。 例えば、ガチ高学...
需要あったみたいだな。寝るとこだった。 へ〜Googleで商品検索してるんだ。面白いね。 ちょっと確認 1)価格でソートできる、画像検索のブクマを作ればいいんだな? 2)対応させ...