はてなキーワード: データとは
もっと具体的に言えば、統計を「平均」のことだと思い込んで、「分散」を考慮に入れて議論することができないから。
個々のデータと平均値の差の2乗の平均のこと。分散が大きいとデータのバラツキが大きい。
分散の平方根を「標準偏差」という。平均値を50とし、標準偏差を10とするようにスケールし直したデータをおなじみ「偏差値」と呼ぶ。
分布が正規分布に近い場合、凡そ68%が偏差値40〜60の間に収まる。また95%が30〜70の間に収まる。
もともとの日本の「一億総中流」のような、多様性を否定する信仰がさらに「平均以外に意味はない」というバイアスを強めている可能性がある。
日本人にはもともと「普通」を定義しその中に収まるという強い欲求があるために、たとえ義務教育で統計の基礎を学んでいても、その中から「平均」という普通の定義だけを学び、「分散」という多様性の定義を学ばない心理的取捨選択があるということだ。
増田自身、男女の能力差に関して「統計的に考えろ」とここに書いたら、「女は男より(平均で)下だと統計が言ってるんだ」と騒ぐやつばかりで話にならなかったことがある。
統計的に言えば、「普通」と言うのは、例えば偏差値40〜60のように平均以上以下に幅を持って定義しなければ意味がない。平均の周囲どれだけに何%が収まるのかという分散の発想なしに「普通」は本来定義できない。
「生活保護基準」と「相対的貧困ライン」は、それぞれ別の定義で、別の目的で作られた概念だが、結局は同じ層だよねってなることが学術的に知られている。
https://cir.nii.ac.jp/crid/1390853651279758080
相対的貧困ラインは「可処分所得(手取り)」が中央値の半分を下回る水準であり、これは収入格差が大きいほど当然拡大する。
欧州などは10%程度に抑えられているが、日本のように16%もの相対的貧困層がいる場合、「生活保護の本当に必要な人」は1000万人〜2000万人は見積もる必要があると統計を理解していれば必ずわかるのだ。
お得意のデータなし
“日本人は特にいじわる”とデータが証明?行動経済学が明かす「スパイト行動」 | データで越境者に寄り添うメディア データのじかん
あと
日本人のマスク着用率の高さは、意地悪な性格の裏返し?スパイト行動とは(Yahoo!ニュース オリジナル 特集)
こちらの2ページには、韓・中・蒙それぞれの人にも同じ実験を行った、とある。
相手を出し抜こうとする行動が結果的に平等を担保するってのは面白い話だが、正直疑問もある。
「ゲーム仕立てにすれば相手に勝とうとするのはある種当然では?」と思ったし、最初の記事の1つめのゲームのセオリー
これが2つめのゲームでは
愛着障害だな。
外注すなわち愛着の問題を抱えるとは一概に言えない。データが足りない。血が繋がった毒親を持っている愛着障害者の割合と比べたデータはない。
パリ在住フランス人研究者が「日本語の起源」を追究する理由。文字なき時代の古(いにしえ)の姿はここまでわかった! - 社会 - ニュース
https://b.hatena.ne.jp/entry/s/wpb.shueisha.co.jp/news/society/2024/05/28/123352/
日本語は、大昔はどのような姿だったのか? 文献の記録がない時代はどんな発音で、どんな単語があったのか? そんな疑問に答える本が出た。
われわれが話す日本語の祖先の姿に迫る画期的な方法をまとめたこの本の著者のひとりは、なんとパリ在住のフランス人、トマ・ペラール氏。
@ThomasPellard
Research scientist @CNRS 🇫🇷 historical-comparative linguistics, archaeolinguistics, phylolinguistics, geolinguistics, endangered languages, languages of Japan.
https://x.com/ThomasPellard/status/1796166752012824685/photo/1
https://x.com/ThomasPellard/status/1796474339052896519
週プレのインタビューがプチバズっていますが、日本語の起源についてもっと知りたい方は
@yosukeigarashi さんとの対談記事「日本語と琉球諸語のルーツをひもとく」もあわせて読んでください⬇️ (こっちはグラビア👙なし)
特集「危機」と「ルーツ」② : 日本語と琉球諸語のルーツをひもとく
https://kotobaken.jp/digest/13-1/d-13-02/
どのような変遷をたどったのでしょうか?
また、それらはどのようにして分かるのでしょうか?
五十嵐陽介さんに聞きました。
ペラール:もともと日本の伝統文化に興味があって、人類学や民俗学をやろうと思っていました。途中で、言語の研究の面白さに気付いたのです。そして、日本語がどのように変化してきたのか、今の日本のことばがどのように成立したかについて研究を始めました。
すると、日本語の歴史を研究するには琉球諸語のデータが絶対に必要だと分かり、琉球諸語の研究を始めたのです。五十嵐さんと初めて会ったのは、フィールドワークで訪れた宮古島でしたね。五十嵐さんは、まだ日本語の歴史については手を付けていなかったと思います。
ペラール:琉球列島で話されていることばは、長い間、日本語の方言と見なされてきました。しかし日本語と通じないほど違うため、現在では日本語とは異なる言語とみなされています。また、琉球列島の中でも島や地域ごとに互いに通じないことばがあることから、まとめて「琉球諸語」と呼んでいます。
琉球諸語につながる言語と日本語は、いつ分岐したのでしょうか。
ペラール:奈良時代(8世紀)以前ということは、研究者の意見が一致しています。
文献から、奈良時代にどのような音の区別があったかが分かります。
さらに、文献にある言語の状態からそれ以前の言語の状態を理論的に推定する「内的再建」という歴史比較言語学の手法を使い、奈良時代以前には音の区別がもう少し多かったことが推定されています。
奈良時代の文献ではすでに失われてしまったがそれ以前には存在していたと考えられる音の区別が、琉球諸語には見られます。
ということは、琉球諸語の共通祖先に当たる「琉球祖語」と日本語が分かれたのは、日本語でその音の区別が失われる前、つまり奈良時代以前と考えられるのです。
稲作が伝わる以前に分岐していたらそうならないので、稲作が伝わった弥生時代(紀元前10世紀ごろ〜紀元後3世紀まで)以降と考えるのが自然です。
ここからは研究を進めているところで、まだ私の個人的な推測なのですが、弥生時代末期から古墳時代あたり(3〜6世紀ごろ)に分岐したのではないかと考えています。
ペラール:弥生時代から日琉祖語の話者が日本列島に移住し、弥生文化の担い手になったと考えられます。
考古学、遺伝学の研究から総合的に見て、日琉祖語の話者は東北アジア、中国北部、朝鮮半島あたりから来たと考えられます。
古代の朝鮮半島の歴史を記録した文献に日本語と音と意味がとても似た地名が見られることから、日本語と系統関係にあった言語が古代の朝鮮半島で話されていた可能性が高いです。
意見がないというより、人の意見が全部正しく思えて、どれを自分の考えにすればいいかがわからない。
政治とかでも、与党を支持する意見を見れば「たしかにその通りだ」と思うし、反対意見を見れば「たしかにその通りだ」と思う。
色々とデータを見て自分で判断しないといけないんだろうけど、家事育児仕事に追われてそんな余裕も時間もない。
面倒くさくなって考えるのをやめる。
当然のことだった?
こんなにはやく落ちぶれたのか―、と思ったよ。
以下は計算。
https://data.worldbank.org/indicator/NY.GDP.MKTP.CD?locations=CN
https://data.worldbank.org/indicator/SP.POP.TOTL?locations=CN
ということは、上位1.4億人で7.8兆ドルの所得を得ている。
https://data.worldbank.org/indicator/NY.GDP.MKTP.CD?locations=JP
やっぱり必要なのは、仕事の中で人間の仲裁と調整を行うAIだわ。
毎日のようにオフィスで繰り広げられる些細な争い。会議の度に意見がぶつかり合い、プロジェクトの進行が滞る。上司と部下の間に生まれる微妙な不和。同僚同士のささいな誤解や対立が、仕事の効率を著しく低下させているのを見ていると、自然とそんな考えに至る。
そんな時に登場するのが、最新の調整AI「メディエーター」。このAIは、全ての社員の言動や感情データを解析し、最適な解決策を導き出す。人間の感情を理解し、冷静に判断を下すことで、迅速かつ公平な仲裁が行える。誰もが納得する形で、問題を解決してくれる存在だ。
ある日の会議、再び意見が対立し、場が険悪な雰囲気になった瞬間、「メディエーター」がスムーズに介入した。淡々と、しかし的確に双方の意見をまとめ上げ、全員が納得する結論を導き出した。驚いたことに、普段は口論を繰り返すメンバーも、AIの指示に従った。
これが「メディエーター」の力だと感心した。人間同士だと感情が絡み合い、どうしても対立が生じる。しかし、感情を持たないAIが間に入ることで、冷静かつ効率的に物事が進むのだ。人間の複雑な感情や関係性に振り回されず、公平に判断を下す存在が、オフィスに新たな秩序をもたらしてくれる。
AI先生に対してだったら、しぶしぶでも従うようになるだろう。それが素晴らしいところ。
モデルAは特徴量を10000個使っていたが、追加で4000個の特徴量を付与したモデルBを作ったとする。
モデルAとモデルBをテストデータを使ってテストすることも可能だが、使用感を確かめるなどの目的の場合は、入出力を明確化してデモにするとわかりやすかったりする。
例えばそれは「検索エンジン」のモデルだったりするわけだが、モデルAとBを切り替えるボタンを検索エンジンのデモに用意しておき、検証可能にしておくのである。
具体的には、検索クエリを入力し、その結果をモデルAとモデルBで比較できるようにするということだ。
それにより、各モデルがどのように異なる結果を生成するか、また新たに追加された特徴量が結果にどのように影響を与えるかを直接確認できる。
ただし、このデモを設計する際には、結果を解釈するのを助けるために、各モデルの主要な特徴と動作原理についての説明も提供する。
そういや花王の不買運動までやってた自民党支持者って統一教会の件についてどう思っているんだろうね
匿名掲示板だから仕方ないんだけど横に広いデータは取るの簡単で、個人に張り付いて縦のデータとるのは難しいよな(いや、横に広いデータも自作自演があって信用ならないか)
愛国主義者だが、右派の人間が国のためになることをしてるの、あんまりみたことない。国の中で最もでかい組織のためになることをしてるのは頻繁に見る。長い目で見ると国のためにはなってるのかもしれないが。
いや、別に難しくはないんだけど。
素人はいかに聞き齧りの思い込みで知ったつもりになっているかという話。
君は何故光ファイバー通信が高速にデータをやり取りできるかを理解しているか。
そう思い込んでいなかったか。
厳密に言えば、媒質の誘電率で電磁波の伝わる早さは変わってくるが、そんなのはこの際小さな問題だ。
光ファイバーを通る光線も、電線を通る電磁波(電流じゃないぞ。電流より遥かに高速に伝わる電場の変位が有線通信の信号だ。)も、空気中を伝わる無線通信も、実は全部同じ電磁波。波動の伝播速度自体は光速cだ。
じゃあ何が違うのか?
勘の良い人、ちゃんと考える力のある人は、有線と無線の違いを並べたことで予想がつくかも知れない。
無線通信が有線通信よりノイズが乗りやすいことは、ある程度思考力がある人ならなんとなく理解しているだろう。
有線通信でも、銅線中を通る電磁波と、ガラスファイバー中を通る電磁波(光波)は、ノイズの乗り方が大違いなんだ。
それに、光ファイバー通信は、電線の通信よりも圧倒的に抵抗が少なく、信号が減衰しない。