はてなキーワード: モデルとは
モデルAは特徴量を10000個使っていたが、追加で4000個の特徴量を付与したモデルBを作ったとする。
モデルAとモデルBをテストデータを使ってテストすることも可能だが、使用感を確かめるなどの目的の場合は、入出力を明確化してデモにするとわかりやすかったりする。
例えばそれは「検索エンジン」のモデルだったりするわけだが、モデルAとBを切り替えるボタンを検索エンジンのデモに用意しておき、検証可能にしておくのである。
具体的には、検索クエリを入力し、その結果をモデルAとモデルBで比較できるようにするということだ。
それにより、各モデルがどのように異なる結果を生成するか、また新たに追加された特徴量が結果にどのように影響を与えるかを直接確認できる。
ただし、このデモを設計する際には、結果を解釈するのを助けるために、各モデルの主要な特徴と動作原理についての説明も提供する。
朝ドラ(基本オリジナルでありモデルがいたとしてもあくまで「元ネタ」であって改変OK)の違いも知らんのか
今の朝ドラは「現役弁護士ですら知らないようなマイナー史実を持ち出してくる(それだけ脚本家が勉強している)」のを弁護士から褒められてたのは見たが
モデルのラブリから性被害にあった女性マネージャーの訴え↓なんて、力関係を利用した性犯罪なのに、世間でもはてブでも増田でも一切取り上げられずにスルーされてたぞ
https://news.yahoo.co.jp/expert/articles/b0a818f41fadd4561a3d40ecddd12404ea6d7de7
bingchatとやりとりして、審査のレポートをどうかくべきかが定まってきた。
要するに、どれだけ中身をよまずにかけるかってこと。よまなくてもかける。これが理想というか生命線。
採用したモデルの妥当性というか立ち位置みたいなものに言及すると
いいみたいなことを示唆された。たしかにこれだと よまなくてもいけそう。
あとは強みにふれる・・・うんぬん だけど、これは アブストラクトがあるので、そこから
あとマテメソを詳しくした方がいい的なこと
あとは、The study design and operationalization of conceptsがらみで
いくつかの個所でoversimplification of complex conceptsのきらいがあるってなこと指摘しとこう。
具体的にどこやねん?については かかない
あとは、データサイエンス界隈で汎化性能とか交差検定とかいっているやつにかんすることか?
うちの分野ではこういうチェックやらないので、データサイエンスの文脈でいうところの汎化性能などに
あたる考察をくわえたほうがいい的な書き方で茶を濁そー
”財政政策が足りなかったなんて言っているリフレ派は殆どいなかったと思う” うんそうですね。
2014年に物心ついていなかった増田に親切で教えて差し上げますけど
https://wedge.ismedia.jp/articles/-/3650
第2の矢の再考を
「小泉政権下の金融緩和と緊縮財政の組み合わせという政策が成功したことを再認識すべきだ。」
「金融政策だけで景気刺激効果があるのだから、財政政策を発動しなければ、財政状況は必ず改善する。景気が良くなって税収が増えるのだから、財政支出を増やさなければ財政赤字は減少する。(略)」
「マンデル=フレミング・モデルというものがある。政府支出の増大が金利を引き上げ、金利の上昇が為替を増価させて輸出を減少させ、結局、政府支出の景気刺激効果が、輸出減少の景気抑制効果とキャンセルアウトして、結果的に政府支出の増大が景気刺激効果を持たないというモデルである。」
「金融緩和も行っているので、金利は安定し、為替も低下しているが、公共事業をしていないときに比べて為替の低下が小さい。公共事業を抑えておけば円安がさらに進んでもっと輸出が伸びていたはずである。」
原田泰氏(後の日銀審議委員、リフレ派)は『公共事業が持つ景気抑制効果』というタイトルで”公共事業を抑えておけば円安がさらに進んでもっと輸出が伸びてもっと景気が良くなっていたはず(だから政府の支出は減らせ、緊縮財政しろ)
と言っていたんですよ。
つまり原田泰氏(後の日銀審議委員、リフレ派)は「財政政策が足りなかった」とは言っていない。財政政策が多すぎる、と言っていたんですね。
今や、「木村花が死んだヤバイ番組」としか認識されていない「テラスハウス新東京編」
五輪の話題で思い出したのだが、新東京編は東京五輪にあわせたロケーションだった
五輪に出るような精鋭は流石に招けなかったものの、スポーツ色の強い人選が行われ、入居者にはプロバスケ選手の田渡凌、プロサーファーの金尾玲生がいた
リアルタイムと配信までにはタイムラグがあり、目撃情報や当事者のSNS発信から「ネタバレ」が発生することもあった
田渡の試合にテラスハウスの出演者と撮影スタッフが入り、「テラハの人たちがいた」と盗撮写真がSNSにうpされその中にピンク髪の目立つ女がいた
配信にまだ出ていない新しい入居者ではないか、あの派手髪はモデルかなにかかと話題になっていた
そこへ、プロレス事務所スターダムがこれからの機運を語るインタビューで「PRの一環でうちの子をテラスハウスに出演させる」と語り、木村花だと確定した
テラスハウス出演者は、「手っ取り早く知名度をあげたい」「なにか面白いことしたい」と自主的に応募する人だけでなく、芸能事務所などに所属し事務所命令で無理矢理出されるパターンも多い
生活に密着され恥ずかしいところも晒され、それらを大物芸能人らに副音声で逐一ツッコミを入れられるというのはけっこうなストレスで、出演自体嫌だったと後から吐露した者も複数いる
五輪にあわせて事務所命令でテラハに出演した木村花には、出演を拒否する自由もなければ撤退する自由もなかった
恋愛なり仕事なり「映えるシーン」を撮ってもらえればお役目完了で撤退、また番組作り自体があわないのか映えなくても数話で消える人もいた
木村花は8ヶ月ぐらいおり、終盤はハウス内で最も古株の牢名主のようになっていた
PRし続けることを望む事務所に撤退を許してもらえなかったのだろう
五輪を楽しみにしていた当初から、コロナの流行り始め、プロレス興行も中止続き、五輪も延期、そんなコロナ禍が克明に映されていた
興行できない分ほかでPRしなければならない、だから木村花はテラスハウスから出られなくなった
そしてSNSは怖いし苦手だと語り事務的な仕事報告にしか使っていなかったのに、コロナ中のPRとしてSNS宣伝部長を任され業務として毎日更新するようになった
「なんでこの人ダラダラずっとテラハにいるんだ」「入れ替えてもっと可愛い子に枠渡せ」と長期滞在への不満はSNSでストレートに木村花にぶつけられるようになった
個人的にSNSをやっているだけなら垢削除して逃亡というのも身を守る手段だが、仕事でやっているのでそれもできない
木村花はただ大人しく中傷を受けていただけではなく、派手なレスバもやっていた
レスバは新たなレスバを産み炎上を繰り返し、テラハなんか見てない層にも広がり、木村花がブサイクに見える瞬間やキツイ発言をしている瞬間の切り抜き動画が未視聴者にまで拡散された
テラスハウスは世界的に人気の番組なので外国語でも大量に罵倒が飛ぶ
それは集客にもなっていた、だから番組からもSNSからも逃げられない
リストカット画像を載せたり、心配した祖母が会いに来たことについて「世界中から嫌われてる孫でごめん」と書いたり、メンタルを病んでいった
露出の多いプロレスラーがあれだけ深く大量に腕を切ったら仕事に障りがあるので、拾い画像によるフェイクでアンチを威嚇しているんだ、とアンチはますます加速
実際に木村花はリストカットをしていたし、コロナがどこまで続くかわからなかった当時にもう仕事は再開できないかもしれないと思っていたのだろう
木村花の自殺はネットの誹謗中傷問題と直結して語られコロナ禍における有名人の連続自殺騒動からは外され気味だが、コロナは大いに関係あったと思うよ
はい、交差検証法はホールドアウト分割を繰り返し行う手法です。
## 交差検証法の手順
1. データセットを複数のフォールド(部分集合)に分割する。[1][2]
2. 1つのフォールドをテストデータ、残りをトレーニングデータとしてモデルを構築する。[1][2]
3. テストデータでモデルを評価し、評価指標(精度など)を記録する。[1][3]
4. 2と3を、すべてのフォールドが1回ずつテストデータになるまで繰り返す。[1][2]
5. 各フォールドでの評価指標の平均を最終的な評価値とする。[1][2][3]
つまり、交差検証法はホールドアウト分割(トレーニングデータとテストデータに分割)を複数回行い、その結果を平均化することで、より信頼性の高い汎化性能評価を行う手法なのです。[1][2][3]
この繰り返しによって、特定のデータ分割に左右されずに、より客観的な評価ができるというメリットがあります。[1][2]
代表的な交差検証法には、k分割交差検証やLOOCV(Leave-One-Out Cross-Validation)などがあり、データ量に応じて使い分けられます。[1][2]
Citations:
[1] https://shoblog.iiyan.net/cross-validation/
[2] https://ja.wikipedia.org/wiki/%E4%BA%A4%E5%B7%AE%E6%A4%9C%E8%A8%BC
[3] https://qiita.com/RyutoYoda/items/4ca997771e99d6c39ddb
はい、Kaggleのようなブラックボックスのリーダーボードで評価する現場は存在します。
機械学習モデルの評価には、一般的に以下の2つの方法があります。
1. **ホールドアウト評価**: 学習データを訓練データとテストデータに分割し、テストデータでモデルを評価する方法。[1]
2. **ブラックボックス評価**: 評価用のデータセットが公開されず、サーバーにモデルを提出して評価される方法。Kaggleのコンペティションがこの方式。[1][2]
つまり、Kaggleのようなブラックボックス評価は、機械学習の様々な現場で採用されている評価方式の1つであり、特に実運用に近い評価が求められる場合に有効な手段となっています。[1][2][3]
Citations:
[1] https://qiita.com/Shun_PI/items/896d05ed9689f4b24347
[2] https://www.kikagaku.co.jp/kikagaku-blog/kaggle-competition/
[3] https://www.kikagaku.co.jp/kikagaku-blog/signate-competition/
[4] https://www.topgate.co.jp/blog/google-service/8707
[5] https://www.jst.go.jp/crds/pdf/2023/RR/CRDS-FY2023-RR-02.pdf
## 概要
提示された文章は、機械学習モデルの評価方法に関する重要な指摘を含んでおり、おおむね正しい内容だと言えます。
## 詳細
### 精度基準の設定
## 総括
提示された文章は、機械学習モデルの評価における重要な原則を適切に指摘しており、おおむね正しい内容であると言えます。モデル評価の際には、これらの点に留意する必要があります。
ちゃんとしてないよ
トレーニングデータとバリデーションとテストデータとか基本的なことをやってたら「モデルが失敗する細かい条件を見つけ出し」なんてことにならないでしょ
それで、上司にデモを見せる。上司がモデルが失敗する細かい条件を見つけ出し「ダメだよ君ぃ、こんなものをTrueにしちゃうようじゃ」と言う。
当然○○書く前に○○うまくいくかかんがえるよね。Haskellのあの人みたいに〇やる前に書き始めるってひともいるけど・・・
それでもってたいがいのばあい、うまくいくよね。それってなぜだろう?無意識のうちにそのあたりをかぎわける嗅覚がとぎすまされてるから。
そう説明してしまうとそれで終わりだけど・・それってなぜだろう?
そもそもなぜリモートリポにそういうのが累積するんだろうか。形にしてファイナライズする時間的余裕がないから。年間にそんなにいっぱい
アウトプットだす必然性もなにもないので、数を調整しているって面もある( ^ω^)・・・
なぜたまるのか。調整しているからだよね?たまっているネタをそのまま○○にかけばいいだけでは?もうすでにうまくいっていて○○レベルなのは
わかってんだから、うまくいかない時のコンティンジェンシーは記載不要となる。書きたきゃなんかほかのこと書けばいいだけ。なんでそれができないのか。
ためこんでいて、徐々に吐き出す予定にしている成果がたいしたことないレベルが低いと無意識のうちに思いこんでる!!そうそうそうそうそうそれだよ。
○○のばあいとことなり、しっかりとしたモデルがない。解析のときに援用できるしっかりしたモデルがない。○○だと何とかモデルとかなんだとかいろいろあって
それを使って解析すると、中身がしっかりして・・・・通しやすくなる。それがない。そこがパワー不足。下調べがたりず、その手のモデルの存在をしらないだけなのか。
未知との・・・なのか。そこだよね。モデルがしっかりしていると、解析してこういう情報が抽出できますってのが見通せるけど、それがないと・・・・・・・・・・・・・・ゼンゼンブリンク