「母集団」を含む日記 RSS

はてなキーワード: 母集団とは

2022-03-03

anond:20220303091240

ありがと勉強になった

ビジネス

クリームスキミング」も参照

チェリーピッキングは、大規模な母集団から収益性の高い顧客のみを選ぶビジネス戦略を指すこともある[6]。たとえば、健康保険会社健康な人に保険を売り、不健康な人や不健康になりそうな人に保険を売ることを拒否するチェリーピッキングを行うことで、収益性の高い顧客選択できる。

もし自動車保険会社チェリーピッキングにより優良運転者のみ保険を売ることになれば、すべての運転手保険を売っている会社よりも収益上優位に立てる。自動車保険会社チェリー・ピッキングを行い優良運転者のみに保険を売り、劣等運転者が無保険になるという事態が起こらないよう、アメリカ合衆国の多くの州ではリスク割り当てを行い、自動車保険会社がある程度の数の劣等運転者にも保険提供するよう求めている。

2022-02-07

anond:20220207011120

いやそういうことじゃなくて、偏差値定義分かってる?どういう母集団でその統計量を計算することができるの?

2022-02-01

anond:20220201211630

ある母集団から「AかつBの集団」を抽出すれば、少なくとも「AとBを兼ねている人が多いか少ないか」という情報はそれ単体でわかるけれど

「AまたはBの集団」を抽出したら、単体ではどっちにヒットしたかからない謎の結果が出てくるだけだよ

2022-01-25

anond:20220122010439

もうなんか間違ったこしか書いてなくて増田が何でこんなもの書こうと思ったのかちょっと意味が分からないんだけど

一応気になったところだけ訂正・説明を入れておく。(ほぼ全文にわたっているが…)

途中で「なんでこんな中間テストの採点みたいなことやってんの…」みたいな気分になったけど

万が一これを読んで本気にしている人がいるといけないので義務感で最後まで書きました。

まりの衝撃に最初からテンション高いですけどね。もう疲れたからこのまま上げます

なんなんやいったい...

      

遺伝病の断種は、遺伝病の根絶について特に有効ではないと考えられています。まず、潜性遺伝病の場合どうでしょうか。これは、両方の染色体に、多くは遺伝機能欠失型の遺伝変異があると起こります。親は、片方しか持っていなければ健康なのですね。すると、両方の遺伝変異を持つ遺伝患者を断種させたところで、片方だけを持つ親が世の中にたくさんいるわけです。どれくらいの数いるか?実はね・・・地球上の全人類で、これを持ってない人はいないと考えられています。今、個人の全ゲノム塩基配列決定とか普通にできてますからね。観察的にそうです。さてそれでも、両方の遺伝子欠失を持つ遺伝病の人を断種させれば、徐々に遺伝病は減っていくでしょうか?実はね・・・そうならないと考えられますハーディワインベルク法則って言うんですけどね。

  

まず、

ハーディワインベルク法則って言うんですけどね。」じゃねーよ。

選択があるのに対立遺伝子(A、a)や表現型(AAAaaaの組み合わせ)の頻度が変化しなければハーディワインベルク法則じゃないだろ。 

潜性のホモ接合aa(つまり発病してる人)を継続的人口から取り除いていけば人口中の対立遺伝子Aに対する対立遺伝子aの頻度は低くなるにきまってるだろ。

対立遺伝子aの頻度が低くなるんだからAAAaの組み合わせに対するaaの組み合わせの頻度(発病する人の割合)は低くなっていくにきまってる。

まり両方の遺伝子欠失を持つ遺伝病の人を断種させれば、徐々に遺伝病は減っていくんだよ。ハーディワインベルクによれば。

学部レベル以下の知識がないぞ自称ゲノム科学者。というか論理的思考が出来てないだろう。どうやって大学はいったんだ?

頑張れ。もっと頑張れ。

      

さてそれでは、顕性遺伝病の場合どうでしょうか。これは、染色体の片方にでも遺伝変異があれば発症するもので、つまり遺伝病を発症している人を断種させれば理論的に根絶できます、が、実はね・・・ヒトゲノムには突然変異が起こるのです。もちろんこれが進化原動力なわけですが、これにより、顕性遺伝病も発生します。つまり、両親が健康で、遺伝変異を片方持つわけではない場合でも、子に突然変異が発生して顕性遺伝病は起きるのです。デノボ突然変異って言います

  

「実はね・・・」じゃねーよ。今どき突然変異が起こることを知らねー人間存在するのか? 進次郎か。プラスチックの原料か。

そもそも突然変異の発生率がとても低くて、ひとつ遺伝子につき平均で一世代で一万分の一から百万分の一(*1)。しかアミノ酸のコドンには冗長性があるからベースペアが一ヶ所変異してもアミノ酸は変わらないことの方が多いし、アミノ酸ひとつ変っても即タンパク質の働きに影響が出るわけではないか機能不全が新たに発生する率は実際にはひとつふたつ低いオーダー(十万分の一から一億分の一)。

から新しい変異による発病はほぼ無視できるんだけど、実際の変異率がいくつにしろ発生率より速いレートで変異を取り除いていけば全人口中の有病者の割合が下がっていくのは当たり前のことだし、変異を取り除かない場合の有病者割合の増加率は継続して取り除いた場合に比べれば絶対高くなる。当たり前の話だ。

そもそも(十万分の一から一億分の一の確率で)「子に突然変異が発生して顕性遺伝病は起きる」ことと「顕性遺伝疾患を持つ親の子供は100% 50%-100%の確率で(素で間違えた。恥ずかしい)おなじ遺伝性疾患を持つ」ことは別の話だ。子に突然変異が発生して顕性遺伝病が起きたら当然「その子が」生殖することを許さず新たな有病者の発生とそれによる社会負担の増加を防止しようというのが優生思想だし、それは可能なんだよ。

優生学は「特定個人病気を持つかどうか」の話じゃあない。優生学集団遺伝の話(集団中の有病者の割合・それがどう変化するか)なんだよ。この違いが分かってない生科学者なんて存在するのか?

  

まり断種政策遺伝病の抑制有効ではないと考えられます

  

有効だよ。上に書いた通り。「抑制」は「根絶」じゃないしそもそも根絶は目指してないから。

問題は「個人遺伝病が起こるか起こらないか」じゃないんだよ。問題は「全人口の中の有病者の割合をどう抑えるか」だよ。

しろどういう理屈有効じゃねえんだよ。

  

さて、ここまで読んでくれば読者は気づいたでしょうが運動能力、見た目の美醜、学歴、といったものは、これは単一遺伝子型ではありません。もし、学歴を問わない父親と、東大卒母親からまれた子の1/2が東大卒になると言うなら、これは単一遺伝子型の顕性遺伝と言うことになりますが、そんなわけはありません、経験的に。誰も行かないこともあるし、佐藤ママみたいに4人全部行くこともあるでしょう。単一遺伝子型なら、こういうばらつきは起きません。ばらつきが起きるが、一定遺伝性はあるように見える形質、これは多遺伝子型です。

  

ちょっと待て。

単一遺伝子型なら、こういうばらつきは起きません。」じゃねーよ。

たとえ「東大卒業する」が顕性単一遺伝子だとしても子供がその顕性遺伝子をもつかどうかは確率問題で、必ず「生まれた子の1/2が東大卒になる」わけじゃねーだろ。ひとりひとりの子供が「東大卒業する顕性単一遺伝子」を持つ確率が1/2なら「子供4人中誰も東大卒業しない」も「4人全員が東大卒業する」も6.25%の確率で(ばらつきが)起こるだろ。

染色体ひとつ遺伝子じゃないけどXとYはクロスオーバーしないから単体として遺伝するだろ? 男が生まれ確率子供がYを持つ確率)は常に1/2だな? それでも全ての家庭で常に「生まれた子の1/2は男」になるか?経験的に。誰も男じゃないこともあるし、佐藤ママ(誰やそれ)みたいに4人全部男のこともあるでしょう? 遺伝というのは確率から顕性だろうと単一だろうとばらつきは起こるんだよ。

ゲノム科学者かどうか以前に、おまえ大丈夫か?

  

この多遺伝子型の形質には、単一ではないとするならどれくらいの数の遺伝変異が関与するでしょうか。これはここ10年くらいで確定してきた最新のところではあるのですが、どうも最低数千あるようです。それぞれの形質に、それぞれ数千です。こんなにたくさん因子があるとどうなるかというと、中心極限定理により正規分布します。多遺伝子型の形質は、正規分布するのです。すると何が起こるでしょう?

   

平均への回帰です。

  

「平均への回帰です。」じゃねーよ(笑)溜めをつくって関係ねーことを言うな。渾身のボケか。(ちょっとウケた)

無数の試行の平均が母集団平均値回帰するのは母集団が(またはサンプルが)「正規分布から」じゃねーよ。大きい値も小さい値もランダム抽出するからだよ。

親と子の身長に相関があり、長身の親(正規分布の一方の端)だけ取り出したら(つまりランダムではない。これが優生理論)、その子供の平均身長は「長身の親の平均値」に近づくにきまってるだろ。「長身も低身長も含めた母集団平均値」に回帰するわけがない。

おまえ本当に大丈夫か? なんかわざと間違ったこと言おうとしてる? ツッコミ待ちか?(たぶんそうなんだろうなぁ...)

    

いみじくも優生学創始者ゴールトンが明らかにしたのが、親の身長とその子身長比較すると、極端に身長の高い親の子は、どちらかというと平均側、普通っぽい身長の方にシフトする、と言う現象です。それで回帰というわけですね。平均に戻る、ってことです。

  

ゴルトンの観察が平均に回帰した(ように見えた)のは実験の条件が一定じゃなくて子供サイズが親のサイズよりも環境から受ける影響の方が大きかった(つまり親のサイズという変数に対して無作為抽出になっていた)からだろ。だいたいゴルトン自身が気付いて生物学根拠のない統計上のアーチファクトだって言ったものを掘り出して差し上げるな。晒し上げか。

  

どういうことでしょうか。メジャーリーグMVP大谷翔平の子は、みんなメジャーリーグとかよりもずっと普通っぽい才能になるだろう、ってことです。ええ、皆さん、知ってますよね。長嶋茂雄の子もそうだった。野村克也の子もそうだった。あれが理論通りなんです。教育環境がいいから、それでも普通よりはいい方に行くわけですけど、親と同じような超絶スーパーエリートにはならなくて、それは統計学的に予想通りでして、確率統計の基礎の基礎、正規分布性質により説明できます。大体さ、大谷翔平の親はどうなのよ。メジャーリーガーだったわけじゃないわけですね。

  

大谷翔平長嶋茂雄野村克也が周りより一歩も二歩も抜きんでてたのは遺伝形質(身体特性)に加えて本人が努力たかに決まってんだろ。努力の結果が遺伝するわけがない。遺伝疾患や体格と一緒にするな。わざとか。どっかの詭弁テンプレートにこういう例があるのか。

  

まあ、それでも、意味があるじゃないかっていうかもですね。平均への回帰って言っても極端だったのが極端でなくなる、ってわけで、身長が高い親の子平均値は、身長が低い親の子平均値よりは高いです。平均だけの話で、大幅にオーバーラップしますが。それでも平均を徐々に上げていけばいいじゃないかと。

  

から初めから優生学対象特定個人能力大谷翔平の子供は野球が上手いかどうか)じゃなくて集団全体の性質だって言ってるだろう。もともと「全体の平均を上げること」「全体の中で望ましい(くない)もの割合やす(減らす)こと」が目的だ。「背が高いことが社会にとって良いことだ」となったら(どういう理由でそうなるのか知らんが。軍事強化?)長身の者に優先的に生殖の機会を与えて国民平均身長大きくするのが優生学目的手法だろう。しろそれ以外になんだと思ってるんだ? 

いずれにしろ身長が高い親の子身長身長が低い親の子身長も平均に回帰する」というのは単純に間違い。もしそうなら長身の者だけに生殖させても平均値が高くなるわけがないし(どういう理屈で「平均への回帰」と「平均を徐々に上げていく」が両立できるんだよ?)長身のものが優先的に子供を残せば集団の平均身長が高くなるのはすでに事実としてわかってる。(*2)

  

ところが、多遺伝子型には数千もの遺伝変異関係するというのはどういうことかというと、単一遺伝子型のように、どれか一つの遺伝変異はどれか一つの遺伝病に対応する・・・ということになりません。重複しちゃうんです。ある遺伝変異は、ある形質にも、別の形質にも、関係する。多面的関連と言います。例えば身長を高くする遺伝変異は、同時にがんになりやすくする多面的関連を持つことが多いことがわかっています。するとどうなるか。身長を高くするように、集団結婚相手操作していくと、がんが多くなって寿命が短くなるでしょう。では学歴はどうか?学歴を高くする遺伝変異は・・うつ病になりやすくすることがわかっています

  

ここの部分は必ずしもすべて間違っているとは言えないが、身長の高さとガンの発生にについてはそれぞれが関連する遺伝子座の間に統計的な相関が見つかったというだけで身長を高くする遺伝子がガンの原因になるというわけではないし、長身集団が低身長集団に比べ短命であるという証拠もどこにもない。後者学歴)に至っては関連が指摘されているのは「うつ病」と「低学歴」だし(*3)、それが共通遺伝子の多面作用によるものだという考えは否定されている(*4)のである

ていうか今気付いたけどこいつ遺伝変異ってずーっと 「mutation(突然変異)」の意味で使ってない? 遺伝変異は variation だから「数千もの遺伝変異」とか「どれか一つの遺伝変異」とかないんだけど...

おまえマジで大丈夫か?(三度目)

これ、マジでまちがい探しかなんかか? なんで書いてあることがことごとく間違ってるんだ? 罠?

  

どうでしょうか。基本的優生学というのは、国家文脈で語られます学歴の高い国民をより多数生み出し、国家生産性を上げたい、というわけです。しかどうでしょうか。うつ病が増えると、生産性どうでしょうか。私はうつ病の人は生産性が悪いと言いたいわけではありません。しかし、優生学論者のロジックは成立しますか?(明示的に成立するとは言えないのではないですか?)と言いたいのです。

  

遺伝子型の遺伝構造はまだわかっていないことも多く、「優生学操作」をしてどうなるかすらわかっていないんですよ。形質に遺伝的因子があるなら、優生学操作をすれば人類は必ず優秀になる・・・というのが元増田議論の開始点だと思いますが、そこ、すでに間違ってるんです。

  

からなんで話を「まだわかっていないこと」だけに限定するんだよ。じゃあわかってることには優生学手法を使ってもいいのかよ。国や医療システムにかかる負担を軽減するために「遺伝患者子供つくっちゃいけません」っていいのか? 問題はそこじゃないんだよ。

  

優生思想ダメなのは科学的に間違ってるから」でも「有効じゃないから」でもないんだよ。優生論の生物学遺伝学的手法有効なのは動植物繁殖で既に実証されてるから元増田優生学とは何かをそもそも理解していないのは確かだが、おまえの言ってることもほぼすべて間違ってる。

  

結論としてすでに社会的に受け入れられてない優生思想否定したいんだったら、ウソを書いてまで「科学的」根拠でっちあげる必要がないだろう。

なにが目的だ?

まさかゲノム科学者自称がこれらの間違いを本当に信じているはずがあるまい。

特にうつの「高学歴」と「低学歴」入れ替えてるところなんてワザとじゃなきゃどうやって間違えるんだよ...

やっぱ間違い探し? なんかのテストなの?

  

*1 https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/mutation-rate

*2 https://www.science.org/content/article/did-natural-selection-make-dutch-tallest-people-planet

*3 https://www.nature.com/articles/s41598-021-83801-0

*4 https://pubmed.ncbi.nlm.nih.gov/25917368/

2022-01-12

anond:20220112103404

長年、知名度のない中堅企業採用(主に母集団形成)やってる身からすると、採用なんて営業職と大差ないんだわ。

 

大学回ってキャリアセンター挨拶して、学内説明会声かけてもらって、来てくれた数名の学生名刺渡して、その後も連絡して良いか確認して、毎月フォローメール送って、応募してもらって…ここから先は筆記試験とか適正試験とかだからお互い実力勝負だけど。

 

採用代行会社経由も同じだよ。向こうの営業と仲良くなって、事細かにフォローして、少しでも良い展示会ブースを回してもらったり、良さげな条件で提案もらったり。

 

会社知名度低いのが原因だとは百も承知してるけど、上から目線採用担当ばかりじゃないことを知って欲しいわ。

2021-12-19

建設工事受注動態統計への立憲民主党の追及はきっと尻すぼみになる。

代表枝野から泉に交代して、追及型野党をやめたから?違う。

立憲民主党事務能力的にまともな追及はできないから?それはあるかもしれないが今回は違う。

そういったことではなくてもっとお家芸の、ブーメランになるから

今回の問題は、互いに関連しあう2つの問題にざっくりと分けられる。

1つは、統計法によって定めを行った期限より事業者が遅れて出してきた個票に手を加えて、受注タイミングを改変したというもの

もう1つは、受注が二重に計上されていて、実際よりも上振れてしまったというもの

このうち、遅れて回答してきたものに書かれていた本当の受注の数字を全部、提出後の翌期の数字としてまとめる改変はかなり以前から行われていた。というのも、未提出の企業の受注は実績なし、つまり0として計上しているとそもそも公表しており、しかも遅れてきた回答を反映するような定例的な遡及しての改訂が無かったからだ。

https://www.mlit.go.jp/sogoseisaku/jouhouka/sosei_jouhouka_fr4_000006.html

平成12年4月平成25年3月までの推計方法

調査結果については、建設業許可業者全体への復元母集団推定)を行う。復元母集団は、調査実施の前々年度末における建設業許可業者の名簿である。この母集団に対して、各標本毎に定められる抽出率の逆数を各標本の調査結果に乗じることにより、母集団推定値を算出(復元)する。(未回答業者は実績なしとして取り扱う。)

これはつまり民主党政権をとっていた時代にも、国交大臣がきちんと監督ができていなかったということを意味する。公明党大臣監督できていなかったことには間違いないから追及自体はされるべきであるが、民主党政権時代自分たちも見過ごしていたとなると、いくら基幹統計といっても作成の細部まで政治家管理することは難しいという話に収束してしまい、追及は尻窄みになるだろう。

次に、政策決定にも直接的な影響があり得る、受注が二重に計上されてしまった問題だが、こちはいっそう立憲民主党は追及しにくい。だんだん報道でも着目されるようになってきたが、二重計上の問題2013年から行われた建設工事受注動態統計での作成方法の変更に端を発している。もう一度、先ほどの

https://www.mlit.go.jp/sogoseisaku/jouhouka/sosei_jouhouka_fr4_000006.html

平成12年4月平成25年3月までの推計方法

調査結果については、建設業許可業者全体への復元母集団推定)を行う。復元母集団は、調査実施の前々年度末における建設業許可業者の名簿である。この母集団に対して、各標本毎に定められる抽出率の逆数を各標本の調査結果に乗じることにより、母集団推定値を算出(復元)する。(未回答業者は実績なしとして取り扱う。)

を見てみよう。"各標本毎に定められる抽出率の逆数を各標本の調査結果に乗じることにより、母集団推定値を算出"、とある。これが、2013年度以降では

母集団に対して、各標本毎に定められる抽出率の逆数及び回収率の逆数を各標本の調査結果に乗じることにより、母集団推定値を算出(復元)する。

と変更されている。変わった点は、2013年度以降については回収率の逆数を乗ずるプロセスが追加された点だ。これが二重計上を招いてしまった理由である

たとえば日本建設会社が1万社あるとして、その全ての会社調査することは費用時間が嵩み、月次で発表する統計としては難しい。そこで、このうちから100社をサンプル調査するとしたとしよう。対象となった会社には統計法によって回答が義務付けられるものの、忙しかったりすることで実際にはすべての会社がきちんと回答してくれるわけではない。ここでは50社が期日までに回答を行い、20社が遅れて翌月に回答、そして残りの30社は音信不通だった場合を考える。当然ながら期日までに回答を行った50社の数字を足し合わせただけでは日本全体の受注額にはならない。1万社から100社をサンプルとして抽出したのだから、この受注額に100倍(1万÷100)をする必要がまずある。これが2013年度より前に行われていた推計方法だ。しかし、これでは当然ながら回答率が50%しかないので、実態よりもかなり過小になってしまう。そこで、回収率も考慮するように変更するようになり、2013年度以降では回収率の逆数(1÷(50÷100))も乗ずるようになった。ここで問題となってくるのが、期日までには回答をしないものの、遅れて、あるいは四半期や半年にまとめて提出してくる会社存在。従来は、期日までに提出されなかった分は実績なしとして0と計算しつつ、遅れた分を翌期にまとめて計上するだけだったので、30社の音信不通会社の受注はどこにも反映されないという過小推計が発生していた一方で二重計上は起きていなかった。一方、2013年度以降は、回収率の逆数を乗じた時点で、遅れた20社、音信不通の30社の分も期日までに提出した会社と平均的に同じとした数字が計上されている。ここに、遅れた20社の受注が従来通りに翌期にまとめて計上されたので、今度はその分が二重に計上されるという過大推計が起きるようになってしまった。(なお、当然ながら上記の社数は例示であって実際の数字とは異なる。実際の回収率は60%程度

https://www.soumu.go.jp/main_sosiki/singi/toukei/meetings/iinkai_47/siryou_4a.pdf

とのこと。)

さて、立憲民主党の追及の観点からこのことを見てみよう。二重計上を生んだ推計は2013年度、つまり安倍政権に移行して以降に行われた。しかし、当然こういった基幹統計での変更は簡単には行えない。国交省の内部で議論をするだけでなく、統計委員会にその変更で構わないと認めてもらうなど時間の掛かるプロセスを踏む必要がある。具体的には

https://www.mlit.go.jp/sogoseisaku/jouhouka/sosei_jouhouka_fr4_000006.html

本推計方法は、平成23年9月統計委員会から答申(府統委第115号) に基づき、より的確な推計を行うために変更しています

とある。つまり平成23年という民主党政権をとっていた真っ只中だ。当然、国交省内部での議論や、実際の推計方法テストもこの前後を中心に行われたであろう。つまり、回収率の逆数を乗じるように変更を行うのであれば必要となる、期日までには回答しないが後で回答してきたものをどう扱うかといった問題を見過ごしてしまったのは、民主党政権の国交大臣や、あるいは統計全般管轄する総務大臣ということになる。ここが今回の件の根本問題である。これでは、立憲民主党はとても追及はできない、少なくとも自公のみを追及することは困難だ。

以上のことからして、建設工事受注動態統計への立憲民主党の追及が尻窄みになることはほぼ間違いない。というか現時点で毎月勤労統計の時と比べてすでに迫力がない。本来は毎月勤労統計の件を受けて再チェックをした上での問題なので今回の方が深刻なのに、だ。そして、今回の件の報道を率先した朝日新聞もこのことに気付いたのか、これをブーメランではなく泉代表の非追及型野党路線のためだとするような報道を始めだした。立憲民主党の追及の手が弱くてもそれは路線問題で、別に民主党の見落としが原因を作っていたというようなやましいことがあるからではない、としてあげたいのだろう。このまま、この件は(政治的には)毎月勤労統計の時のような大きな動きにはならず萎んでいく可能性が高い。だが、そんなこと許してはならない。

2021-12-15

建設工事受注動態統計は単なるバグ

業界人間なので、あまりにも無責任ブコメが多いので現時点で分かっている内容と解説記載しておく。

国の統計調査の基本知識

動態統計

国の統計は大きく動態と実態に分けられる。

実態日本の全体が知りたいのよ。調査票のボリュームいっぱい、調査対象いっぱい。年に1回とか5年に一回とかでいいから。(国勢調査とか)

動態:トレンドが知りたいのよ。調査票のボリュームは少なく、調査対象の数は少なく。その代わり毎月答えてね。

公表予定

https://www.mlit.go.jp/toukei/yotei/e-stat_JUTYUU.xml

いつ調査結果を公表するのか、月単位で日にちだけじゃなく時間まで指定されているのよ。

現場役人は厳守するよ

基幹統計

回答義務あるのよ

https://elaws.e-gov.go.jp/document?lawid=330M50004000029

(報告の義務及びその方法

八条 動態調査指定建設業者(大手指定建設業者を除く。)は、前条第一第一から第七号までに掲げる事項を、国土交通大臣が定める調査票により、第六条規定する調査の期日の属する月の翌月十日までに当該動態調査指定建設業者の営業所のうち国土交通大臣指定したもの所在地管轄する都道府県知事に報告しなければならない。

調査項目の説明

https://www.mlit.go.jp/sogoseisaku/jouhouka/content/001408445.pdf

調査票には一か月分の受注実績を記入してください。

原則として調査月は契約を行った月としてください。

公表時の推計の仕方

https://www.mlit.go.jp/sogoseisaku/jouhouka/sosei_jouhouka_fr4_000006.html

[1]建設工事受注動態統計調査

■令和3年4月以降の推計方法

(令和2年1月~令和3年3月までは参考値として再集計)

調査結果については、建設業許可業者全体への復元母集団推定)を行う。復元母集団は、調査実施の前々年度末における建設業許可業者の名簿である

建設工事受注動態統計調査は、調査実施の前々年度末における建設業許可業者のうち、建設工事施工統計調査の回答業者の中から抽出を行っている。

この母集団に対して、各標本毎に定められる抽出率の逆数、建設工事受注動態統計調査の回収率の逆数及び建設工事施工統計調査における未回答業者の欠測値補完方法(※)に基づく乗率を各標本の調査結果に乗じることにより、母集団推定値を算出(復元)する。

(※)建設工事施工統計調査の未回答業者の欠測値補完方法は、行政記録情報経営事項審査結果)を活用して補完を行った後に、残った部分に関して経済センサスとの照合結果を踏まえたウェイトの調整により補完を行う。

また、報告者のやむを得ない事情等により提出期限から遅れて提出があった調査票については、可能な限り当月分の調査結果に反映させるよう柔軟な運用を行っているところであるが、それでも間に合わない調査票については、毎年度の年度報の公表に合わせて遡及改定を行い反映することとする。

なお、本推計方法の変更は、令和2年10月30日の第8回統計委員会評価分科会でも報告している。

推計の仕方の統計学者の意見

令和2年10月30日 第8回統計委員会評価分科会

https://www.soumu.go.jp/main_sosiki/singi/toukei/hyokabunkakai/kaigi/02shingi05_02000440.html

https://www.soumu.go.jp/main_content/000714741.pdf

○「平成28 年度統計施行状況審議結果報告書統計精度検査関連分)」概要平成30年3月30日総務省統計委員会

建設工事統計調査は、回収率が約60%だが、全部非回答に対して欠測値対応を行っておらず、調査結果が過少と見込まれる。

・一方、未回答業者には実績のない業者が多大に含まれている可能性があり、回収率の逆数を乗じると課題推計の恐れがある。

・このため、まずは未回答事業者実態について検証を行う必要がある。また、回収率向上に向けた方策検討必要である

・そのため、経済センサス等との比較検証を行い、平成30年度に推計方法調査方法見直しに関する結論を得る必要がある。

増田邪推

想像する経緯
今回分かったこ

システム屋さんの変更を、現場理解しないで現場ルールを使い続けた、位の話で過剰に売上計上したい、なんて崇高な目的なんかないと思われる。

別にこのミス擁護するつもりはサラサラないが、不正したつもりは現場はないよ。マニュアル作って都道府県にばらまいているんだものあーやってもうた、というやつだな。

2021-12-13

「弟がいる長女は文系を選びやす収入が低い」きょうだいの組み合わせが人生に及ぼす意外な影響

https://president.jp/articles/-/52455

全くピンと来なかった……。

「「長女・弟」の場合ほど、母親と過ごす時間が増えるだけでなく、女の子らしく振る舞うことを意識するようになります。このため、「長女・弟」の場合ほど、伝統的な性別役割分業意識を持ちやすくなるわけです。」

ってのも、???

そもそも子供は同性の親と過ごす時間が長くなるという前提からして疑問だし。母親は息子、父親は娘を猫かわいがりするってケースの方が多いような。

それに同性の親と過ごす時間が長いと、どうして性別役割分担意識が強くなるんだ。

どちらかというと、異性と過ごす方が性別役割分担意識には囚われやすくならない?父親と娘だと娘が家事を一手に引き受ける場合って珍しくないだろうし。女子校だと女子だけなので何でもやるけれど、共学だと嫌でも男子の目を意識するみたいな。

あとホント文系への差別って酷いんだな。

「具体的に言えば、学業面では理系よりも文系を選びやすく、職業面では男性よりも女性比率が高い職種を選びやす可能性があります。また、これらの職種相対的所得水準が低い場合が多いため、所得もやや低めになっていることが予想されます。」

仮にそれが事実だとすれば、文系給与理系よりも低い事や女性比率が高い職種給与が低い事の方が問題だよね。

学業面では理系よりも文系を選びやすく、職業面では男性よりも女性比率が高い職種を選びやすい」という、それ自体は何ら問題ではない事に焦点を当ててわざわざ研究し騒ぎ立てるって謎。

少子化が進む先進国において弟がいる長女と妹がいる長女という、そもそも母集団の数自体に疑問のある統計を元に決めつけ結論を出すよりも

それよりももっと大きな問題である文系給与理系よりも低い事や女性比率が高い職種給与が低い事の方を大々的に取り上げて是正すべきでは?

問題にすべきは「ブラザーペナルティ」なんかじゃなく、文系差別女性差別だろ。

2021-11-29

エクセルで100個ぐらいのデータ

2通りのやり方で標準偏差を求めたんだけど、その大きさが約2ずれてるんだよね。()内が計算結果

関数を標本から求める方にすると誤差が0.0000いくつまで縮まるんだけど、これは母集団から適切な関数ではない。

これはエクセルの誤差として認めるべきものなのか、お前の計算が間違ってるのか、意見求める。

2021-11-27

anond:20211127104621

母集団が違っているから、学力が下がっても偏差値はさがらんよ

偏差値相対的な物って知ってる?

2021-11-20

anond:20211120153124

頭悪いと言ったら、社会人失格。

議論の負け。

で、支持率6割で、得票率いくらな訳?

議席数との乖離は?

家電調査は?

最近施策に対する動向は?

竹中採用移民法、水道民営化

金融外交経済対策

あきらかに空気感支持層から批判出てるよね。

自分母集団?それ君の集団の話じゃない?

失礼な言語使う。

そう言う失礼な方々には

批判な支持者が多いよね。たしかに。

anond:20211120141512

1000人の標本よりも自分の周りの意見の方が母集団に近いと言う書き込みにそれはおかしいと言ってるだけだけど。

自民党批判するならしたらいいんだがなんで統計学デタラメと言うことにするのさ。

流れ弾にしてもひど過ぎる。分からないなら流れ弾飛ばすなよ。ホント頭悪いな。

2021-11-12

anond:20211111204538

大半の女が自分の性を売ることに抵抗があるとしても、

決して無視できない程度には自分の性を売ることを楽しんでいる人はい

例え0.01%でも母集団千万人なら数千人だ

2021-11-07

飲食業はほんとうに低学歴が多い

決してバカにするわけではないが、

低学歴反社会的な人の受け皿となりやすいのが飲食業である

飲食といってもピンキリで、一流料亭とチェーンのバイトでは天と地ほど違う。

しかし全体的な母集団として非常に民度が低いことは間違いない。

今までで一番驚いたのは、タイムカードを切って、いきなり賄いを3人分くらい食らう女子大生いたこである

他の10人くらいいるバイトの目の前でである。(まかないは業務後に余ったものを食うのがルール

店長お気に入りらしく、「ごめん、ごはん今日少ないかもな」とか言っているのが気持ち悪かった。

無言で3人分がっついているのも気色が悪かった。

このように、奇妙な人間が奇妙な集団として存在しても許されていて、

かつ、小集団独裁化しやす業界飲食業である(非常に低レベル世界だが)。

学習を重ねなかった人間の集まりであり、回復しようのない民度の低さがある。

「いやこれは変だろう」という発想になれない。戦前農村部のようなものである

教養にともなう宗教的知識もないため、共産主義的な、属人的独裁的な退廃した世界が生じやすい。

これから飲食業にいくなら、一流の料理人レストランだけにしぼることをおすすめする。

飲食業にかぎったことではないが。

2021-11-01

anond:20211101183500

いやパレート最適的な考えと母集団民度とは排他的存在するから、今の日本民度でこういう事件が起きるのは驚くのは当然だと思うが

今回の選挙結果は一方向性マスメディアの衰退を表している

自民党絶対安定多数と言えども議席を減らしている。そのため、自民党への全面信任というわけではない。

野党共闘で大々的にパフォーマンスを行った立憲民主党議席を大きく減らしている一方、野党共闘距離をおいた維新国民民主党議席を伸ばしている。

ここから結論付けられる民意は、「今までの与党政策をある程度は評価している、立憲民主党などの極端な左派は支持を失った、それ以外の野党が支持を得た」であろう。

面白いのは、新聞テレビといった大手マスメディアの予想が大きく外れたこと。自民党単独過半数ギリギリどころか絶対安定多数まで議席を伸ばし、立憲民主党は散々な結果に終わった。

出口調査による分析すら大きく外していた。これは、大手マスメディア調査に答える層と、全国民という母集団乖離していることを示す。

立憲民主党支持者によく見られる、投票率の低さが自民一強を招いているという論理は通らない。彼らに言わせれば「頭の悪い」大衆は何も考えず自民党投票するらしい。投票行動を取る者は少なから一般より政治に関心があるため、その説で言えば自民党は不利になる。

それにも関わらずこの結果ということは、現実はより厳しいという結論になるだろう。結局、この選挙結果民意を反映しているのだと思う。

野党共闘が実を結ばなかったのは、モリカケなどを利用したネガティブキャンペーンに終始し、具体的な政策が見えてこなかったからだ。

そもそもNHK出口調査によると「政治とカネ」に重点を置いている有権者わずか7%で、経済政策が最多の31%であるモリカケに関心のある国民は彼らが信じているほど多くはなく、むしろ辟易している。多くの人は、自分と関わりのない「政治とカネ」の問題に興味が無いのである

立憲民主党はかつての民主党政権での不景気NISAへの課税言及など「経済オンチ」というイメージが強く、その結果「声は大きいが具体策の無い集団」という判断がなされたのだろう。

そして、野党共闘によるネガティブキャンペーンを大々的に報道し、政権交代扇動した大手マスメディアは、全くの肩透かしを食らった。出口調査と最終結果の乖離からも分かる通り、新聞テレビといった旧来の一方向性メディアは信頼を失いつつある。

これは、SNSYouTubeといった双方向メディアの普及により、多方面から意見に触れる機会が増えたためだと考えている。

今回の選挙結果を受けて大いに反省すべきは大手マスメディアであるが、彼らがまだ自らに大きな影響力があると考え続ける限り、それは期待できないだろう。

2021-10-23

母が死んだ 言えなかった一か月

https://www3.nhk.or.jp/news/special/hikikomori/pages/articles_15.html

親が死んでも言い出せず 相次ぐ事件(中略)高齢の親と中高年で無職の子ものケース。ことしに入ってから半年間にかぎっても、NHKの各放送局放送した事件だけで約20件に上っている。

20件程度で相次いでるいるとか特に目立っているとか感じるもんなのか。

日本の一日の死者数はざっくり3000人

人口1億2000万人に対して引きこもり60万人(200分の1)

半年は約180日なので3000*180=54万人

これは全人口に対するものなので引きこもりがいる世帯に対して同程度の確率で死者が発生しているものとするとその数は540000/200=2700

この2700という数字は、そのうち事件として取り扱われた20件と比べれば増減しにくいものと思われる。(とういうよりは、事件化されるケースの方が「目立ってきている」といわれるぐらいなのだから一定しないものなのである。)

その割合20/2700ということで0.7%程度である。(しかも例年はこれよりも割合が低かったとおもわれる。)

少なくとも母集団をそういった引きこもりに限っている以上多少なりとも死亡届などの届け出が遅れる傾向にありそうなものなのでその割には低い割合と言える。

少し遅れただけでなんでもかんでも死体遺棄の容疑をかけるのではなく悪質と判断したものに限っているのだろうか。素人目には報道されているケースも悪人による死体放置というよりは不憫コミュ障の末路にしか見えないのだが…。

私の知っている限りでは死後4日間の放置の事例で逮捕というのがあったが、同じ「引きこもり」で残り99.3%もの人が3日以内に警察通報とかすると仮定するのは無理があるというか割合が高すぎないかと思う。やはり単に放置期間だけではなく「警察から見た悪質性」というのがあるものなのだろうか。

2021-10-18

anond:20211018180712

国語は旧帝二次ならともかく小学校から高校定期テスト程度まで満点で通してないと言語能力になんらかの障害を負っていることになってしまうのだろうか。

勉強しなくても国語は満点、むしろ国語に限っては学校勉強が役に立つって時点でガイジだと書いてる人がいた。

でも俺の公立中学時代は同学年150人ほどの規模だが3年間に満点は1人も出なかった。トップクラスで97点前後だった。

小学校から進学する時点で5%ぐらいは受験してどこかに行ってしまうが、それをそのまま上位5%と仮定しても95%はガイジということになってしまう。

公立中学の成績分布はどこの偏りなく同じような状況にあるはずだから、いわば統計学でいう標本に等しい。

まり日本国民の95%はガイジということになる。

さすがに「国語で満点とれない奴はガイジ」という仮定の方に無理があるのではないか普通より一段と劣っているのだから障害者として規定する意味があるのであり、「普通より劣っている」とは量的には母集団の半数未満であるべきだろう。ガイジの人数が全人口の95%というのは量的に矛盾していると思う。

https://anond.hatelabo.jp/20210921135427#

あなた自分基準で考えすぎですよ

2021-10-11

anond:20211011173239

それに新卒が出社して会社の気風を味わいたいのは当然かつ必要経験で、アンケート母集団が誤りだろ

テレワーク必要なのは育児が大変なミドル層だぞ

2021-10-04

anond:20211004202940

時事通信が集めたデータからな。

それだけで世論、と決めつけるのは早計でないか

調査母集団がどうやって集められたのか。

適当ランサーズで集めたデータかもしれない。

何人から集めたとかすらも書いていない。

どの程度の偏りがあるのか。

データ違和感持たず、すぐに信用するのはどうかと。

2021-09-30

世界よ、これがクソデータサンプルだ

国内企業のDXの実態、8割がテレワーク促進 平均年間予算4.8億円の使い道は?

パーソルプロセステクノロジー調査によると、国内企業のDX推進では、テレワークの促進に加え、バックオフィスマーケティング営業活動領域における取り組みが多く、年間予算は全体で平均4億8891万円であることが分かった。主導するのは「経営者役員」が最多だった。

 パーソルプロセステクノロジー2021年9月28日企業のDX(デジタルトランスフォーメーション)推進に関する実態調査の結果を発表した。

 同調査は、DX推進に取り組む従業員50人以上の企業経営者役員部長クラス以上の役職に就く600人を対象に、2021年9月14~23日に実施。各企業が今期、社内のDX推進で具体的に何に取り組み、どれくらい予算を確保しているのかなどを調査した。

併せて読みたい関連記事

見えてきた日本企業がハマるDX失敗の4パターン “ダメックス”企業はこうして生まれ

IT抵抗を持つ職員”が半数 デジタル庁は前途多難な「自治体DX」を後押しできるのか

欧米との比較で見えた、日本企業のDXが抱える最大の“矛盾”とは――最新の「情報通信白書から読み解く

DX推進で何に取り組み、どれくらい予算を確保しているか

 調査の結果、社内のDX推進で実施している取り組みは、79%が「テレワークの促進」が最も多く、続いて59.2%と半数以上が「バックオフィスにおけるDX」、46.2%が「営業活動におけるDX」、39%が「マーケティングにおけるDX」に関する取り組みが多いことが明らかになった。

Photo

社内のDX推進において実施していること(n=600、複数回答)(出典:パーソルプロセステクノロジー

 また、DXの取り組みに対して今期1年間で確保している予算は、「バックオフィスにおけるDX」が平均2億6263万円と最も高く、続いて「営業活動におけるDX」が平均2億4197万円、「マーケティングにおけるDX」が平均1億8120万円、「テレワークの促進」が平均1億7879万円という結果で、平均4億8891万円となった。

Photo

DX推進の取り組みに対する今期(1年間)の予算:「テレワークの促進」の場合(n=474、単一回答)(出典:パーソルプロセステクノロジー

Photo

DX推進の取り組みに対する今期(1年間)の予算:「バックオフィスにおけるDX」の場合(n=355、単一回答)(出典:パーソルプロセステクノロジー

Photo

DX推進の取り組みに対する今期(1年間)の予算:「マーケティングにおけるDX」の場合(n=234、単一回答)(出典:パーソルプロセステクノロジー

Photo

DX推進の取り組みに対する今期(1年間)の予算:「営業活動におけるDX」の場合(n=277、単一回答)(出典:パーソルプロセステクノロジー

具体的な取り組み内容とDX推進の主導者は?

 DXの取り組みの具体的な取り組み内容は、「テレワークの促進」「バックオフィスにおけるDX」「マーケティングにおけるDX」「営業活動におけるDX」の全てで「ITツールシステムソフトウェアなど)の導入」を実施している企業が最も多く、8割を超えた。

 さらに、「テレワークの促進」では「機材導入」が73.1%と2番目に多く、「営業活動におけるDX」では「人材育成採用」が49.4%と約半数が実施していることが分かった。

Photo

DXの取り組みで具体的に実施していることは何か(複数回答)(出典:パーソルプロセステクノロジー

 また、社内のDX推進を主導しているのは、「経営者役員」(29.2%)が最も多く、「部門長」(25.5%)、「事業責任者」(23.8%)と続き、「DX推進担当者」(20.2%)との回答が最も少なかった。

パット見てこれのなにがクソデータかが分かればいっぱしだと思う

ヒント:母集団

2021-09-27

偏差値80は頭脳労働運転免許

備忘。

 

偏差値80台くらい頭脳労働をするには当然で、それでようやく「参加資格あり」程度である、という説明をするにあたって、

高校球児甲子園に当てはめたたとえ話にしても数値的な違和感が無いのかを確認した。

 

硬式野球部員数(高校3年生)=4.4万人

甲子園は毎年なので、部員数も3年生の数値を取った。

理屈で言えば1,2,3年の加重平均あたりの方が妥当かもしれないが、どちらにしても結論にはたいした影響がない。

http://www.jhbf.or.jp/data/statistical/index_koushiki.html

 

甲子園出場=49校×18名=882人

試合ごとの選手の入れ替えが可能ならもう少し多いかもしれないが、こちらも結論にはたいした影響がない。

 

甲子園出場者の割合=882÷4.4万=2.01%

甲子園偏差値=70.5

したがって、「偏差値71くらいでは、野球で言ったら甲子園にようやく出場する程度。それで食っていくには程遠い。」

(cf. 正確には、偏差値71だと上位785.5人になるので、甲子園出場者から100人程度足切りされることになる。)

 

 

ただ、母集団硬式野球部員に絞るのは、狭すぎるかもしれない。

逆に目一杯拡げて120万人から882人に絞ると考えると、甲子園出場者の割合は0.0735%で、偏差値は81.8。

したがって、甲子園過大評価させてしま可能性はあるが、

偏差値82くらいでは、野球で言ったら甲子園にようやく出場する程度。それで食っていくには程遠い。」

の方が文脈的には手堅い。

(cf. 正確には、偏差値82だと上位824.6人になるので、甲子園出場者から50人程度足切りされることになる。)

2021-09-21

国語は旧帝二次ならともかく小学校から高校定期テスト程度まで満点で通してないと言語能力になんらかの障害を負っていることになってしまうのだろうか。

勉強しなくても国語は満点、むしろ国語に限っては学校勉強が役に立つって時点でガイジだと書いてる人がいた。

でも俺の公立中学時代は同学年150人ほどの規模だが3年間に満点は1人も出なかった。トップクラスで97点前後だった。

小学校から進学する時点で5%ぐらいは受験してどこかに行ってしまうが、それをそのまま上位5%と仮定しても95%はガイジということになってしまう。

公立中学の成績分布はどこの偏りなく同じような状況にあるはずだから、いわば統計学でいう標本に等しい。

まり日本国民の95%はガイジということになる。

さすがに「国語で満点とれない奴はガイジ」という仮定の方に無理があるのではないか普通より一段と劣っているのだから障害者として規定する意味があるのであり、「普通より劣っている」とは量的には母集団の半数未満であるべきだろう。ガイジの人数が全人口の95%というのは量的に矛盾していると思う。

ログイン ユーザー登録
ようこそ ゲスト さん