はてなキーワード: 情報量とは
決定木は、質問を使って答えを見つけるゲームのようなものです。木の形をした図を使って、質問と答えを整理します。例えば、「今日は外で遊べるかな?」という大きな質問から始めます。
まず「雨が降っていますか?」と聞きます。「はい」なら「家で遊ぼう」、「いいえ」なら次の質問に進みます。次に「宿題は終わっていますか?」と聞きます。「はい」なら「外で遊ぼう」、「いいえ」なら「宿題をしてから遊ぼう」となります。
このように、質問を重ねていくことで、最終的な答えにたどり着きます。決定木は、こうした「もし〜なら」という考え方を使って、物事を順序立てて考えるのに役立ちます。
決定木は、機械学習における重要な分類・回帰アルゴリズムの一つです。データを特定の特徴に基づいて分割し、ツリー構造を形成することで、新しいデータの分類や予測を行います。
4. 枝:各ノードを結ぶ線、条件を表す
2. その特徴に基づいてデータを分割
3. 各サブセットに対して1と2を再帰的に繰り返す
4. 停止条件(深さ制限や最小サンプル数など)に達したら終了
決定木の利点は、解釈が容易で直感的であること、非線形の関係性も捉えられること、特徴量の重要度を評価できることなどです。一方で、過学習しやすい傾向があり、小さなデータの変化に敏感に反応する欠点もあります。
決定木は、分類および回帰問題に適用可能な非パラメトリックな監督学習アルゴリズムです。特徴空間を再帰的に分割し、各分割点で最適な特徴と閾値を選択することで、データを階層的に構造化します。
決定木の構築プロセスは、以下の数学的基準に基づいて行われます:
ここで、H(S)はエントロピー、Svは分割後のサブセット、piはクラスiの確率、yiは実際の値、ŷiは予測値を表します。
1. 事前剪定(Pre-pruning):成長の早期停止
2. 事後剪定(Post-pruning):完全に成長した木を後から刈り込む
決定木の性能向上のために、アンサンブル学習手法(ランダムフォレスト、勾配ブースティング木など)と組み合わせることが一般的です。
決定木は、特徴空間の再帰的分割に基づく非パラメトリックな監督学習アルゴリズムであり、分類および回帰タスクに適用可能です。その理論的基盤は、情報理論と統計学に深く根ざしています。
決定木の構築アルゴリズムとして最も一般的なのは、CART(Classification and Regression Trees)です。CARTは以下の手順で実装されます:
決定木の拡張:
これらの高度な手法により、決定木の表現力と汎化性能が向上し、より複雑なパターンの学習が可能となります。
決定木は、特徴空間Xの再帰的分割に基づく非パラメトリックな監督学習アルゴリズムであり、その理論的基盤は統計的学習理論、情報理論、および計算学習理論に深く根ざしています。
決定木の数学的定式化:
Let D = {(x₁, y₁), ..., (xₙ, yₙ)} be the training set, where xᵢ ∈ X and yᵢ ∈ Y. The decision tree T: X → Y is defined as a hierarchical set of decision rules.
For classification: P(y|x) = Σᵢ P(y|leaf_i) * I(x ∈ leaf_i)
For regression: f(x) = Σᵢ μᵢ * I(x ∈ leaf_i) where I(·) is the indicator function, leaf_i represents the i-th leaf node.
決定木の最適化問題: min_T Σᵢ L(yᵢ, T(xᵢ)) + λ * Complexity(T) where L is the loss function, λ is the regularization parameter, and Complexity(T) is a measure of tree complexity (e.g., number of leaves).
H(Y|X) = -Σᵧ Σₓ p(x,y) log(p(y|x))
I(X;Y) = H(Y) - H(Y|X)
2. ジニ不純度:
Gini(t) = 1 - Σᵢ p(i|t)²
MSE(t) = (1/|t|) * Σᵢ (yᵢ - ȳ_t)²
1. 一致性と収束速度: 決定木の一致性は、Breiman et al. (1984)によって証明されました。収束速度はO(n^(-1/(d+2)))であり、dは特徴空間の次元です。
2. バイアス-バリアンストレードオフ:深い木は低バイアス・高バリアンス、浅い木は高バイアス・低バリアンスとなります。最適な深さは、バイアスとバリアンスのトレードオフによって決定されます。
3. 決定木の表現力:任意のブール関数は、十分に深い決定木で表現可能です。これは、決定木がユニバーサル近似器であることを意味します。
4. 計算複雑性理論:最適な決定木の構築はNP完全問題であることが知られています(Hyafil & Rivest, 1976)。そのため、実用的なアルゴリズムは貪欲な近似アプローチを採用しています。
5. 正則化と構造リスク最小化:L0正則化(葉ノード数のペナルティ)やL2正則化(葉ノードの予測値に対するペナルティ)を用いて、構造リスク最小化原理に基づいたモデル選択を行います。
6. 情報幾何学的解釈: 決定木の学習過程は、特徴空間上の確率分布の漸進的な分割と見なすことができ、情報幾何学の観点から解析可能です。
7. カーネル決定木:非線形カーネル関数を用いて特徴空間を暗黙的に高次元化し、より複雑な決定境界を学習する手法です。
8. 量子決定木:量子コンピューティングの原理を応用し、古典的な決定木を量子系に拡張した手法です。量子重ね合わせを利用して、指数関数的に多くの分岐を同時に評価できる可能性があります。
これらの高度な理論と技術を組み合わせることで、決定木アルゴリズムの性能と適用範囲を大幅に拡張し、より複雑な学習タスクに対応することが可能となります。
本格的な運動開始まで沈黙を守ったのは、情報量をコントロールすることで、あえて「渇望」を作るためだった。
「ダムのように水をためて使うことで、エネルギーに変える。情報を流し続けたら飽きられるだけ」。7月7日の投開票日にピークがくるように日程を逆算し、露出や情報に関する戦略を練った。
1回当たりの演説は10~15分程度。「政治の見える化」「教育分野への投資」など主張の骨子を説明すると
登録者約5万人のチャンネルを持つ東京都八王子市の無職男性(35)も投稿者の一人。街頭演説をスマホで撮影し、動画を共有する北海道の仲間が「支援者爆増」「票を独占」などとファンをあおるテロップを入れて配信した。
ちょっと腹が立つことがあってやけ食いのためにセブンで初購入した。「デカ豚ラーメンワシワシMAX」ってやつを。
家系ラーメン?自体が初めてで勢いで買ってきたんだけどもこれすごくなにか…ストレスが飛ぶというか…普通に腹立ってたこと全部どうでもよくなった。
油のせいなのか時間が経ってきても熱いままの濃い味のスープとうどんも凌ぐレベルの太麺、ジャキジャキの野菜と親指くらいのサイズで塊になってる背脂を口いっぱいに含む…というか、なんか絡まり合ってるから勝手に具がついてきて口いっぱいになる。
熱いしょっぱい脂と麺のモキモキと野菜のジャキジャキ、あとラーメンのネギと間違えたのか?みたいな量入ってるニンニクで口の中の情報量がすごいことになる。熱い!しょっぱい!臭い!に思考が持っていかれる。胃に塩と脂を流し込む以外考えなくていいみたいな気持ちになった。
食べ終わって水がぶ飲みしたらめちゃくちゃさっぱりした。みんなこの不思議な爽快感みたいなものを求めて食べに行ってるんだろうか。
店でも食べてみたいけどちょっと調べてきたらそもそも近所にないっぽい。あとなんかすごい量でコンビニサイズで満腹になってる人間には無理なんじゃないかこれ
あと絶対体に悪いことは確信できたので店で食べるのはだいぶ先になりそうだな…。
そしてじわっと眠くなってきた。油強い。
フロッピーディスク問題が散々言われてきたのに一切更新しないんだ。
適当に「メモリーディスク」とか名前をふんわりさせておけば「ぶっちゃけもうディスクでもなんでもないけど、長年記憶媒体はディスク系だったからこんな名前になったらしいですよ。当時のメーカーが商業的な都合を実態より優先させた結果ッス」で終わるのにね。
ほんま浅いわ。
異世界でジャガイモ出てくるのは「たまたま同じような品種が存在した」で終わるけど、科学技術が大幅に発達し流通情報量が少なくとも何十倍にも膨れ上がってるはずの22世紀の地球でハードディスクを普通に使ってるのは流石に大嘘すぎるでしょ
「洋画の日本版ポスターで文字が多くなる問題」、その他のジャンルのポスターやパッケージデザインもその傾向があると思うんだけど、日本ではビジュアルイメージの力があまり信じられておらず、「言葉を書いておけば伝わるに違いない(文字でないと誤解される恐れがある)」という考えを前提に、リスクヘッジが優先されるからだと思う。
デザインが組織内で確認されていく際に、誰かが「これ書いてないとまずくない?」「これでは伝わらないのでは?」「こういう部分で差別化したい」などの指摘をしていき、それがある度に情報量が増えていく。
個人的には、広告の文字をわざわざ読むか?大抵のポスターは瞬間的に視野に入った一瞬で何らかの印象を残すものであって、メインコピーすら碌に目に入らないものだと思うので、言葉によるリスクヘッジはあまり意味がないように感じられる。
『モテたければ人として接しろ』というアドバイスはまちがい。正確には『個人として接しろ』 - 自意識高い系男子
これ読んで、日本語の「人」はpersonの意味とhumanの意味の両方があるんだな、と気付いた。
元増田は、暗黙に、人をperson、人間をhumanという区別をしていると思う。
ただ、日本語の「人」はどっちの意味でも使えるので、誤解が生じるような文脈で、
personの意味で人と言いたい場合は、個人や人格と言った方がよいのだと思う。
別の増田で、
・「人間扱い」とは、十把一絡げの「女性扱い」ではなく個人個人に合わせた扱いのことだよ派(抽象度を下げろ派)
・「人間扱い」とは、性差を意識した「女性扱い」ではなく男性と同じように/無性かのように扱うことだよ派(抽象度を上げろ派)
個人的には「人間扱い」といったら人間一般に適用できる後者を指すべきで、前者は「個人扱い」とでも呼ぶべきじゃないかと思うが
ってのがあるけど、まさに前者がperson、後者がhumanだと思う。
いずれにせよ、「人」は多義的なので、「個人」や「人格」と言い換えた方が正しく伝わる、というのはその通りだと思うけれど、
「人」にはpersonの意味もあるので、「人として扱う」という言い方もまちがいではないと思う。
実際、自分もpersonの意味で読んでいて、上述の記事を読むまで、その多義性に気付いていなかった。
さっき「誤解が生じるような文脈で」と書いたけれど、
個人的には、恋愛や人間関係についての話のなかででてくる「人として扱う」が「personとして扱う」以外の意味を持つとは思ってもみなかった。
3つある
それぞれについて説明していく。
縦読み漫画が少しずつ勢力を伸ばしている背景として「見開き表示の難しいスマホでは既存の左右セットの漫画は読みにくいことがある。ならば1ページごとスクロールする方式にすれば、スマホでも読みやすいのでは」という考えがある。
そういった所を目指して作られている。
TIKTOKなどのUIがスマホ向けに構築されているのと同じ文脈の中に縦読み漫画はある。
そうなると結果として「スマホでも読みやすいことを目指す」ということがどうしても条件付けられていく。
1スクロールの情報量を絞るということは、漫画が今まで積み上げてきた視線誘導やコマ割りの技術が全く使えなくなるということだ。
重要な場面もどうでもいい場面も同じぐらいの大きさのコマで表示されては、漫画の持つ独特のリズム感が失われてしまう。
多少コマ割りを工夫したところで、単に台詞の数が多いだけのページと重要なページのコマが結局一緒になるのだから焼け石に水だ。
漫画の情報量を扱うのに現代のスマホの機能が低すぎるのである。
これには「漫画の読み方がわからない人でも、スクロールを追っていくだけなら読めるのではないか?」という発想が根底にある。
先ほど言ったように、そもそも縦読み漫画は既存の漫画ロジックを使うことが難しいという欠点を持つが、これが既存の漫画ロジックを知らない漫画原始人でも読みやすいという予測に繋がったのである。
漫画の基本ロジックを知らないということは、そもそも漫画というものに対してのあらゆる知識が乏しいということである。
現代の漫画には多くの約束事があるが、読み慣れた読者と描き慣れた作者にとってはそれらの約束事が情報の精度と速度を高めるための補助として大いに役立つわけである。
コマの形だけで、モノローグ、内心、驚き、悲しみ、といった情報を伝えることが出来ることで、「悲しそうな雰囲気で楽しそうな言葉を言う」といった描写も簡単に出来てしまう。
だが漫画初心者にはこれが通じないかも知れない、そして縦読み漫画がターゲットとしている層に漫画初心者が含まれる、つまり、こういった漫画技術を縛って書く必要が出てくるのである。
漫画的な知識が乏しい読者を相手にすることで起きるのは何も技術の制約だけではない。
既存の名作漫画を知らないということは「知る人が見れば名作の下位互換でしかないような作品」であっても、「初めて見るような凄い作品」として受け入れられてしまうということだ。
これにより縦読み漫画の世界では散々手垢のつきまくった名作を雑に真似ただけのような作品が次々と生み出されていく。
横読みなら手垢がつきまくりオリジナリティ皆無とされるような漫画が、漫画をろくに知らない読者には新鮮に映るのだから、それで簡単に評価されてしまう。
適当にやっても簡単に評価されるし、むしろ手が込んだものを作れば理解されないとくれば、粗製乱造が界隈の当たり前になる。
そういった漫画を好まない読者は横読みに流れていき、そういった漫画を好む読者だけが縦読み漫画に残る。
結果として、縦読み漫画という表現形態そのものが「手垢のついた展開の簡易版を読んだり描いたりする場所」として立ち位置を固めてしまったわけだ。
今後、縦読み漫画の中でも少しずつ名作が増えていくに連れこのような状況は緩和されるのかも知れないし、縦読み漫画は漫画初心者の入門用としての立ち位置になり、ある程度読み慣れた読者は自然と卒業するものになるのかも知れない。
俺に分かるのは、現状の縦読み漫画はつまらなくなるべくしてつまらない漫画まみれになっているということだけだ。
30kgくらいのダイエットをした。
散歩極めた。
自炊も極めた。
35年住んだ実家を売った。
中古マンション買った。
15年ニートやってたけど、そろそろ働かなきゃと就労移行支援に通った。
なんだかんだで就職決まった。最低賃金アルバイト。そこそこ有名な企業。オフィスがやたら綺麗。みんな優しい。
車買った。バイエルンのエンジン屋さんのやつ。速くはないけど軽い。めっちゃヌルヌル曲がる。
NISA買った。4ヶ月で40万上がってて怖い。
キャンプはじめた。日帰りデイキャンプ。焚き火やるの楽しい。外で食べるカップヌードル最高。
カメラ買った。今までAPS-Cしか触ってこなかったけど、思い切ってフルサイズ買った。絵の情報量の桁が違った。
・攻殻機動隊 THE GHOST IN THE SHELL(原作漫画)
情報量が多い!コマの外にまで溢れてる。一通りアニメ見た後に読んだので、なんかキャラクターの性格が軽い感じがする。意外とギャグテイストを感じる。
・劇場版 GHOST IN THE SHELL / 攻殻機動隊
サイバーパンク感満載。劇画的なディテールの細かさと、体重を感じるような作画が美しい。アーティスティックな部分と、アクションの派手さがうまいバランスで成り立ってる。シリーズ入り口はやっぱこれだわ。
・攻殻機動隊 STAND ALONE COMPLEX(S.A.C.)
テレビ版だから作画が粗いところもあるけど、1話完結の話も色んな映画オマージュを感じられて楽しい。公安9課のメンバーそれぞれにスポットがあたるから、だんだんと彼らが好きになる。少佐ってなんだかんだ面倒見がいいし、先生みたいなところあるな。
笑い男の社会風刺的な側面も特徴的で、物語に現実感を持ち込んだのは後のシリーズにも影響が大きいのでは。
・攻殻機動隊 S.A.C. 2nd GIG
悪役がなんか面白い男。今の時代に放送されてたら、だいぶバズりそう。ファーストシーズンよりも政治的な話を扱っていて、難民問題とか今の世の中にも通じるという意味では未来を予見してるのかも。
難解、難解とは言うけど、まぁ耐性ついてるから大丈夫だろ→初見、途中で寝てしまう… 一緒に見ていた友達も寝てた。作画がすごいのは分かる、金と時間がすごくかかってるよね、でももう少しなんというか手心を…!
・攻殻機動隊 STAND ALONE COMPLEX Solid State Society(S.A.C. SSS)
よくまとまっていてバランスがいい。難解さは少なくエンタメしているので、初見がこれでもいいのかも。
・攻殻機動隊 ARISE
少佐の声がいつもと違うけど、若い頃だから違和感ないわ。むしろ好き。あと公安9課の面々も、いつもとデザイン違うけど、若いんだからそんなもんかもな。だがサイトー!お前はそんなに軽いキャラクターから寡黙な男になれたのか!?
現実的なテクノロジーの先にある未来を予感させてくれるし、一貫したテーマ性が感じられて好き。過去のシリーズへのオマージュも好きだが、やややり過ぎ…?
・攻殻機動隊 SAC_2045
3Dアニメが嫌いなわけではないんだけど、やっぱりキャラクターの表情が乏しいという点で、他の作品に比べて入り込みにくい感じがある。
ポストヒューマン、持続可能戦争とか、出てくる言葉にはすごくワクワクさせられるが、それらが何の意図でどういう背景で現れたのかという点が飛び飛びで情報開示されるので、いまいいち頭に入ってこない…
少佐はいつもより若い(幼い)デザインに見えるが、サイボーグの特権だわな
・攻殻機動隊(仮)
楽しみにしてます!