2009-04-02

例のアレについて

やりたい事:

2chの各方面の板及びスレにて、ある日のある時刻を境に、特定単語の出現頻度が急激に変化した、という話(真偽は不明)を聞いたので、それを、誰もが客観的に確認できる状態にしておきたい。何故なら、これを行う事で、何か面白い事が世の中に発生する事が期待できるかも知れないので。

確認方法:

  1. 調査したい「特定単語」を決定する。
  2. 2chの各方面の板にて、現行のスレ(のdat)、または、dat落ちしたスレ(のdat)から、任意の数のスレを取り、それら対して一つずつ、以下の操作を行ってみる。但し、datファイルを集める際には、何者かによって改竄されたdatファイルを含んでしまわないように気をつける必要がある。
  3. 該当スレを、「ある日のある時刻」の前(Aと呼ぶ)と、「ある日のある時刻」から一定期間の間(Bと呼ぶ)と、残り(Cと呼ぶ)、の、三部分に分割する。
  4. Aの中の、日毎の「特定単語」の出現数をカウントする(当日のみ特殊な処理が必要)。
  5. Bの中の、日毎の「特定単語」の出現数をカウントする(当日のみ特殊な処理が必要)。
  6. Cは使わない(時間が経過するにつれ、徐々にBのカウント値はAのカウント値に近付いていく事が予想される為)。
  7. 対象に選んだ全スレに対してこの処理を行い、グラフ化したりしてみる。


問題点

  • 調査に使用するdatが改竄されていないかどうかの保証が必要。
  • この調査によって、何らかの傾向が判明したとしても、それは何かの話を100%証明した事にはならない。ほとんど関連性は明らかとは言えるかもしれないが。
  • 前述の「関連性は明らか」な状態にする為には、「客観的」に「(やろうと思えば)誰でも」この確認ができる必要がある。その為には、以下の二条件が満たされる必要があるように思える。
    • 調査に使用するdatが誰でも閲覧可能である事。
    • 調査に使用するdatが改竄されていない保証がある事(これが難しい)。
  • 元増田は面倒なので、この作業はやらない。
  • http://shadow-city.blogzine.jp/net/2009/04/300_1300.html これが本当の話かどうかは分からないが、本当に「ネトウヨ」等の特定単語の出現頻度がアクセス制限の前と後で大きく変化しているかは、集...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん