はてなキーワード: 改善とは
文字での会話(チャット)は自分の言いたいことすぐ言えるし、複雑だったり長くなるような話もある程度は筋道を立てて話せる。
例:この前こういうテーマの番組を見た→構成としてはAとBという内容の2本立て→Aはこういう結末でBはこういう結末だった→このことを受けてこのテーマに関しての感想は~ みたいな。
実際ここまでガチガチじゃないけど、こういう枠組みみたいなのをベースに
ビジネスだったらかしこまり友人同士なら砕けて話し口調で文章を組み立てられる。
これが対面や電話だと全くできない。
どうなってんだ???頭でまず文章組み立てるのはチャットでも声出すのでも同じプロセスのはずだと思うんだけど。
対面・電話だと何か複雑で長い話をしようとすると筋道が変になる。話があっちこっちへいく。
話しながら「あーだめだこりゃ」と思ってるんだけど、軌道修正できない。
例:この前番組を見た→Aはこういう結末だった→あっAっていうのはそもそも2本立ての構成なので、Bもある→Bはこういう結末だった→この番組はこういうテーマを扱っていた→で、鑑賞してみての感想は~ みたいな。
なんか…変なんだよな。
思えば「声での会話」になると相手の話も理解するのに3呼吸くらい必要な時があるな。
これどうやったら改善できるんだろう。
ただ単純にコミュ障なのかな。
「ちゃんと躾(この言葉大嫌い)されてない子供嫌い」って言う人って、ご自身はそんなに出来た人なんですかね〜ッ?むしろ間違った「躾」されちゃった結果のデカい子供に見える。
「人に、世間様に迷惑をかけるな」というご立派な「躾」を受けた結果、自分に無茶振りな仕事上のストレスかける「上」に面従腹背で反抗もできない。せいぜい辞めるか病むだけ。
既存の結婚や恋愛の価値観に違和感を持ちながらも、そうではない生き方に自信を持てずに拗らせた態度を取る。古い価値観を跳ね飛ばせるだけの自立した自我が足りてないから。葛藤や闘争を封じられてきたから。
社会に対して福祉や労働の改善を求める活動をするわけでもない癖に活動をする人を冷笑する。声を上げない事に慣れすぎて。自分の主張をして、注目されるなんて「悪い」事だと思ってる。
リアルでは周りの目を伺って大人しくして、ネットで自分より弱い子供に愚痴散らかすような人になっちゃいましたよね?
「ちゃんとした親」とやらにしてもらった「躾」大失敗してんじゃん。無産様で傷ついてた増田もそうなんだけど、抑圧されて育った結果、本当は自分が産みたいのか産みたくないのか、どうしたいのかもよくわかってないみたいな大きい子供になるんだよ。そして、泣いてる子供を見て、私は子供を嫌い、というようになる。感情を剥き出しにできる子が羨ましいんだよ。子供のままだからな。まぁ親になったってそういう奴はそういう奴のままだけど。
そして子供に間違った「躾」をする。身の程を弁えろ、異常なまでに社会性を気にしろ、人に迷惑をかけるな、と。
【ちゃんとしなさい、ママ恥ずかしいよ、そろそろ泣き止んで?みんなに笑われるよ、調子に乗らないで!みんな見てるよ、ねえごめんなさいは?周りの様子をよく見て!あなたの為なんだよ?ほらパパの言った通りになったろう?自分で決めたんだからちゃんとやりなさい、そんなことでは将来心配だなぁ…ちゃんと自分で考えて、先生の言うこときちんと聞かなさい、、、】
って「ちゃんと」の躾に呪われていくんだ。
「貧乏とは生きることに怠惰なこと」って言葉に、ドキッとした。
この増田は言う、時間の切り売りばかりして、自己の価値を高めない奴が貧乏になるのは当然だと。
俺も以前はそういう反論をしていたし、文化資本や親ガチャの言説にハマっていた。
だが最近は違う。
耳の痛い説教してくれる人間も、成長過程で必要なのではないかと思うようになった。
それは単に正社員として勤めるのが面倒だったからで、社会構造の問題じゃない。
ただ生きることに怠惰だっただけ。
貧困が政治の問題だと言っても、問題が改善されるまで待ってるわけにもいかない。
貧乏から抜け出したいなら、元増田のような姿勢を持たなきゃいけないのだ。
一時期、人の指示を全然処理できない40代を複数名、相手にしてた事がある。
その時の経験から、ちょっと気づいた事をアドバイスしてみるよ。
・聞き取れなかった部分は、相手に質問する、録音を再生する、などして欠けた情報を埋める事
これを仕事の中で出来る限り愚直にやれ。最適なのは議事録を書くこと。
※半年経っても伸びないなら小学・中学の国語ドリルを小学三年生分から全部やって、スキルアップをブーストさせる事。
この一文に問題が現れている。
・話が「理解」出来ない、と言うけど、何で話を「理解」しないといけないの?
・話を「理解」出来なかった後に「思考停止」するってどう言うこと?話聞くのをやめたの?
ということ。
もっと正確に言うと、相手の話は耳に入っているんだけど、それを素材に、自分で考え、情報を加工してしまっている癖がある。
もっと具体的な話をしようか。
指示されたことについて、
・「相手が言っていない事を加えずに」要約することは出来てる?
はっきり言うけど、これが出来ない人、多いのよ。
相手が喋っている時に、相手の言葉に自分の思考回路が反応しちゃうの。そして、自分の世界に入っちゃうの。
その結果、相手の話をキャッチする代わりに、自分の思考回路で加工した情報が頭に残ってしまうのよ。
当然「お前は指示を理解してるのか?」と、言われることになるわけ。
だって、言われてない情報に、自分で加工しちゃってるんだから。
指示した側の立場になってみれば分かるよね。
・「お前何言われてもないことしてんのよ」
となる。
それをあんたは、「話し手の意図を理解する」事でカバーしようとしてきた。相手の意図が理解出来てればズレないだろう?って。
違うんだよ。
話し手の立場になって考えてみなよ。余計な忖度して勝手に動く奴に、細かい指示なんか怖くて出せなくない?
そして、細かい指示出せないような奴に、もっとレベルの高いお願いなんか、出来なくない?という事。
・「言われたことだけ」を愚直に記録し
事なんだよ。
恐らく現状対応するべき事は、指摘者の話の中に含まれていて、それをお前がキャッチできていない可能性が高い。
少なくとも、正しく情報が聞けていれば、あとは個々のトピックの理解レベルの問題になっていき、課題の各個撃破が出来るようになるはずなのだけど、この書き込みからは、その前段階でつまづいているようにしか見えないのだよね。
人は、相手の話を聞くと、自分の頭の中で、自分の考えが走りそうになるんだ。多分これは人間の仕組み。
でも、その動きを一旦抑えて、相手が何を話したかを正確に聞き取れるかどうかで、差がついてくる。
ただ、相手が何を言ったのかを加工せずに、保持し、記録しろ。情報に欠落があれば、その点を直後に(当人でも、同席者でも)確認しろ。
そして、可能な限り、相手が話した内容について、理解できるまで質問をして補完すればよい。
最近、ホストに国語ドリル解かせる動画がバズってるのは知ってる?
1:40ごろから観て欲しいのだけど、
全てを間違えてしまう
これが全て。
家族とのコミュニケーションとか、友達と遊ぶレベルであれば表面化しないけど、仕事では結構残酷に表面化するんだよ。
今俺が言ってるトレーニングの中には、「相手の言っていない事は絶対に書き取らない」がある。
悪い癖がどうしても抜けない40代もいるのよ。
大抵は国語力が欠けていて、勝手に脳内で情報補完する癖がついてるわけ。
もし、改善スピードが上がらないのであれば、小学・中学の国語ドリルからやった方が良い、ということ。
(こう言った時に勝手に小学のドリルをスキップしないのも大事だからな。何故小学からやり直すのか、を知りもしないのに勝手に手順を変更しない事)
相手が言った事を正確にキャッチする訓練が、あんたには必要なんだ。
世の中では、コーチングとかカウンセリングをやろうって人は基本、相手の話を聞くトレーニングを教育過程の何処かでやる。いわゆる傾聴って奴だ。
ぶっちゃけスクールでは出来ない人はとても多いけど、一人前にやってけるようになった人は、みんなこれを身に付けてる。
自分もこのトレーニングをやって、それまで本当に自分が相手の話を聞けていなかった、と涙したね。
トレーニング後は、一気に仕事が回るようになって驚いたよ。上司と話をするのが簡単になったし、他部署、他企業といった他流試合もよりスムーズに回るようになった。
人の話を正しく聞けるって、本当に大きいからな。
なお、この話は余談で、この手のトレーニングを受けろ、という話ではない。
ところで、僕がここまで書いてきた事、ちゃんと頭に残ってる?
ここまで書いてきた事を一字一句、メモに取るのも練習だけど、ちょっと情報量が多いんだよね。
そんな時には要約が必要となる。
そんな時には、相手の言った事や書いたことの情報量を減らして記録する必要がある。
大事な事は、
という事。
意味が限界まで変わらないようにしつつ、情報量を圧縮する。この練習を仕事の中でやれ。
自分がただお呼ばれしてるだけの会議があったら、議事録を取れ。そして添削してもらえ。
添削時に議事録の中で表現の書き換えをしてくる奴は師匠には向いていない。だから、別の師匠を見つけて議事録のスキルアップのお願いをしろ。
(追記: 正しい表現に直すのは必要。だが、全然違う表現に直す癖がある奴に教えを乞うのはよくない、という事)
という事で全てを書いた。
要は相手の話を正しく聞けるように、癖を直すためのトレーニングを指示通りに愚直に行え、という事だ。
それが今より出来るようになる事が、読解力向上への道だ。自分の解釈を捨てて、正確に情報を取る練習をしろ。
自己流ではもう伸びない。気持ちはわかるが、今はそういうステージにいないことを理解した方がいい。
まあ、ここまで言ってもなお、自己流に固執するなら、一生もがき苦しむんじゃない?毎回人の意見の読解に失敗して、全てを間違えるんだから。
それが嫌だからここに書き込んだんでしょ。
だから、頑張れ。
バズったので補足エントリを書いた。
仕事の繁忙期と、会う回数が重なるほど増す真剣さにすり潰されていった2ヶ月目。
仕事・生活リズムの見直しにまで至り、迷走し始めてるのが自分でも分かる。
いい歳した男性の情けない姿をここに記す。
・35歳地方在住
・身長175cm、ベンチプレス100kg、スクワット145kg、デッドリフト160kgでBIG3は400
・大学生の頃から、遊びもせず、介護や仕事や勉強や家業としてるうちに、彼女いないまま30代半ばになった
・女性からの「いいね」待ちにして、最初のメッセージも相手待ちにする ⇒ 鼻息荒い童貞からアプローチ最初にくるの嫌だろうなと思って(だからずっと童貞なんだと思うけど)
・変更:人となりが分かるプロフィールの方ととりあえずコミュニケーションをとる ⇒ 写真なし、プロフィール項目が少ないところから話題広げるの大変なので
・複数のマッチングアプリを使う ⇒ 別の同僚女性に相談したところ、「マッチングアプリは3つやりなよ」と言われたので
・色んな人に相談してアドバイスを試す ⇒ 周回遅れの存在なので、あと意外と皆真面目に聞いてくれてアドバイスくれるので
・引き続き減量する → 継続。繁忙期につき停滞だけど、体重の二桁目が変わった。BIG3MAXは下がってると思う。
・地元周辺のお店情報やスポットなどを調べる → 実施。少し先の時期に合わせたスポットを抑える必要にようやく気づく。
・自分に足りないものを言葉に表してまずは認識できるようにする → 実施。 誰かと一緒に過ごすための生活の余白が足りない。仕事・生活サイクル改善中。他にもあるはずなので継続。
・年度始めの繁忙期により余暇が減少したので、マッチング→電話など実際に会う以外の方法も実施した。
・プロフィール画像がない方、プロフィール項目が異常に少ない方はマッチングをするのをやめた。
・何を送っても「そうですね」等の一言+絵文字の方は、断りを入れて自分からやめるようにした。
・自分に迷いがあり、4回目会う口約束してる人達に具体的に提案できず保留中。申し訳ない。
・既婚者の男女(夫婦ではない)に4回目躊躇する問題をそれぞれ相談した。
・結婚願望はあっても、生活に誰かと一緒に住む余白がないと気付き、仕事の仕方、労働時間、生活リズムを見直し改善中。
・コーチングお願いしてるカウンセラーにフロムの「愛するということ」を勧められて読書中
・オススメされたものを一緒に見ながら話すを実施。相手の人となりも知れて、同じ物を好きではなくても尊重することが大事(大体納得できるところがある)と感じた。
・ちゃんと断ることによって、限られた時間・エネルギーをもっと知りたい相手に使えるようになった。
・4回目躊躇する問題を通して、婚活に止まらない自分の弱い点の指摘とそのアドバイスをもらえた
・繁忙期とはいえ、連日夜遅くまで仕事してジム行って0時過ぎて元気よく「こんばんわ!今家帰ってきました!今日は足鍛えました!今週の土日は出社です!」と返すのは迷惑であることに気づくのが遅かった。即返信する。余裕がない時はその旨の断りとフォローを入れる。
・せっかく好感を持ってくれる相手に対して(この人は今の自分だけを見ているだけで、過去辛かったことも知ってくれるんだろうか?)と、疑心暗鬼になってしまった。
・仕事のように一線引いた状態で会う回数だけを増やして相手のことは知れど、心の準備ができてない自分が情けない。形だけのKPIに溺れて相手に失礼だった。
・大体付き合うかは遅くても5回目くらいまでかも。4回目となると相手も真面目に考え始める。が、3回も4回も5回も将来振り返ったら誤差。回数じゃない。
・いいから会うこと。重い。
・これだけマッチングして、全然進めない場合、自分のマインドに問題がある。
・自分の生い立ちに負い目を感じて、自分の不幸に合う人(や物)を求める傾向にある。自分に合う人を求めるべき。
・結婚するかしないかは自分で選べる余地のある選択肢。ポジティブに捉えた方が良い。
アドバイスされて別れた後ちょっと涙出た、結局普通の人にアプローチしてダメだったら、自分の生い立ちやこれまでのせいだと傷付くのが怖いのだ。いい歳をして。
・近所の猫で練習して「可愛い」と口に出せるようになった(まだ誰にも言えてない)
・婚活を深刻に考える傾向があるので、気楽に考えるべくグループ魂の「モテる努力をしないとモテないゾーン」を聴くようになった
・引き続き減量する
確かに過去の自分が自己中心的で、人の考えや意図を理解しようと努力しなかったことが原因で今の状況になっているのかもしれません。しかし、今ではその問題に気づき、改善しようとしているんです。本を読むことや行間を読むことが大切だとは思いますが、それだけでは人間関係やコミュニケーションのスキルが向上するわけではありません。
実際に他人とのコミュニケーションを通じて、相手の立場に立って考えることや、より良いコミュニケーション方法を学ぶことが重要です。年齢や経験に関わらず、人は常に成長や改善を目指すことができます。だからこそ、今までの自分を振り返り、問題点を把握して改善しようとする姿勢は素晴らしいと思います。
マニュアル通りに生きてきたことを批判するよりも、これからどのように成長していくかを応援し合うべきだと思います。皆がそれぞれのペースで進化し、学び、改善していくことが大切です。今の問題を克服するために、自分自身を助ける方法やアドバイスを求めることは、決して悲しいことではないと思います。
もし有田さんが当選したとしても、統一教会が下関を「聖地」と呼んだ事実は変わらない。
統一教会が勝手に言っていることなのに、日本政府がそれを撤回させる手段はあるのか?
絵描きを救いたい気持ちはあったことにはあったが、何故救いたかったのかを言語化すると絵描きへの特大悪口になってしまうことをお許しください。そして救う気が失せました。
***
作品の無断学習、非商用限定の画像群を学習したモデルを商用利用、フェアユース規定の無視疑惑……事実、画像生成AIは現在多くの問題を抱えています。
しかし。現行の日本の法律では、(利用範囲は定められていますが)機械学習における著作物の使用に著作者の許可はいらないことになっています。フェアユース規定よりさらに強力で、機械学習に有利すぎる条文です。
このままでは、絵描き的には大問題なわけです。自分が心血注いで作ったものが勝手に持っていかれるなんて、不快なことはなただしい。創作のモチベーションも奪われ、やがては産業自体の危機になると警鐘を鳴らす人もいます。
また、モラルなき人々にまで高い技術が与えられることで様々な被害がもたらされていることも報告されています。
世界的には、AIは規制の流れに傾きつつあります。Stable Diffusionを開発したStability AI社に対して、フェアユースの観点に対する集団訴訟が起きています。また、同時にGetty Imagesも訴訟に踏み切っています。
かのchatGPTも、EU単位で禁止になるかもと噂されています。
さらには、AIの推進に対してかの中国ですら及び腰だというのです。
署名出して法律の改善を訴えたり、訴訟起こして判例を作ったりすればAIに対してエラく歓迎ムードの日本すら変えられるかもしれない!
勝ったな!日本の絵描きは再び安寧と静寂を取り戻し、これまで通り絵が伸び伸びと描けるようになることでしょう!
しかし、そうはなりそうにない。
はっきり言います。今、日本の絵描きたちは自滅の道を辿っています。この勝ち確の流れで。
そうです。今こそ日本にAIの危険性を強く訴えるチャンスなのです。ここで上手く立ち回れば確実に勝機があります。誰から見ても自明でしょう。
でも自滅しようとしてます。
絵描きの大半は、絵を描くことすら取り柄かどうか怪しい無能で馬鹿でメンヘラの社会不適合者だからです。
Twitterでは今日も画像生成AIに対する愚痴や問題点が飛び交います。絵を描くことを忘れて画像生成AIの問題点を発信せんとする人が何人も出てきました。
多くの方は「いやそんなに文句あるならもっと行動しろよ…」と思ってるかもしれません。実際その通りです。Twitterでたらたら文句タレてる暇あるなら団結してクラファン立ち上げて訴訟費用賄えばいいのです。
動かすべきは画像生成AIなんてものを開発した悪の親玉組織ではなく、国という大きく頼れる組織。そうは思いませんか?
でも、しません。
何故なら、繰り返しますが、彼ら彼女らは無能で馬鹿でメンヘラの社会不適合者だからです。
彼ら彼女らは、明らかに知識不足としか言いようのない発言を平気でします。あの感じですと、我らが著作権法の条文すら多分読んだことがないし、画像生成AIの仕組みもロクに理解していません。
しかし、そんなエアプで語ることがまかり通ってしまっています。
何故なら、何度でも繰り返しますが、彼ら彼女らは無能で馬鹿でメンヘラの社会不適合者だからです。無知の知なんて期待するだけ無駄です。
もし、画像生成AIがオプトインを大前提としたものに生まれ変わる場合、アーティストの懸命な訴えが受け入れられたのかもしれません。
何故自分たちの作品を無断で使ってほしくないのか。自分たちにとって作品とは何か。懇切丁寧に、相手も納得できる形で説明したからこそ、その未来ではオプトインが採用されているのでしょう。
何故なら、まことに悲しいことに、彼ら彼女らは無能で馬鹿でメンヘラの社会不適合者だからです。
無能で馬鹿でメンヘラの社会不適合者に、詳しい言語化と冷静な判断が期待できるでしょうか?出来ないから『お気持ち』と揶揄されるような具体性に欠ける感情論しか発信できないのです。このままでは誰にも絵描きの感情や絵描き内のルール、絵描きの理論が理解されないまま終わってしまいます。
しかし。必ずしも絵描き自身が戦う必要はありません。人間社会はよく出来ており、役割の分担が基本なのです。大半の絵描きが苦しむ中、手を差し伸べてくれる人がいるかもしれません。それは親切なファンかもしれないし、法の専門家、法律家かもしれません。
繰り返しますが、大半の絵描きは無能で馬鹿でメンヘラの社会不適合者です。
そのくせプライドだけは一丁前にあって、少しでも正論を混ぜるとすぐにヒスる。声だけデカい割に利用規約や著作権法すら読めないので、デマに近いツイートをすぐ鵜呑みにして騒ぎ立てます。しかも自分から行動しません。Twitterで騒ぐだけ騒いでおいて。結局、国内の署名活動すら話を聞きません(海外の署名活動も全然集まってないですが)。
『真の弱者は助けたくなるような姿をしていない』という話を嫌でも思い出します。
インターネットリテラシーもなければ社会の変化に適応することもできず、ヒスって暴れて無能さをただひたすら曝け出す。かといって何か行動を起こすでもなく、延々と愚痴愚痴と文句を垂れるだけの存在。そう認識されてしまったら、確実に無視されブロックされNGリストに放り込まれ、インターネットの片隅に追いやられることでしょう。正直絵を描いててもキツいです。
誰がそんな奴らを助けてくれるというのでしょうか。
それでも絵を描ける存在を人は助けてくれると思ってるのなら、流石に絵の力を過信しすぎでしょう。作者の本性は、どんなに素晴らしい絵であっても平気で貫通します。作者はゴミカスだけど絵は本当に最高だから応援します!なんて言ってくれる人はかなり少数派ですよ。
大半の絵描きのことを散々に言ってきましたが、これは巨大な問題を孕んでいます。
何故なら、問題を言語化できる人間がいない集団は、その声を民主主義に届けることがあまりにも難しいからです。
日本はAI技術の発展を重視し、AI大国として国際競走にもう一度乗り上げることを目指しているとされます。その過程で、もし訴訟に敗北してStable Diffusionがなくなっても、国際的な規制でがんじがらめになりchat GPTがなくなっても、国産の新たなAIを生み出していくことも考えられます。著作権法30条の4が味方となって、あらゆるデータ資産を学習に使っていくことが考えられます。
日本はとにかくやる気です。
しかし、その過程で日本がアニメ・マンガ・ゲーム・イラスト……そういったサブカルチャー産業の源泉である創作者の集団が無碍に扱われ、将来的に縮小するとすれば問題になるでしょう。
しかし、彼ら彼女らは声のあげ方すら知らない。絵を描く以外能はなく、絵を描く以外の知識もないのですから。芸術をよすがに今日も生き延びているだけのコミュ障社会不適合者は、真の弱者層に位置しているのです。
それでもって、絵を描くことに執着する人間なんてのは数が少ないのですから、より国政や企業に対するアプローチが難しい……
これもう詰みでは?
もちろんわかっています。
ちゃんと知識を持ち、その上で問題点を発信している絵描きはいらっしゃいます。
自分なりに考え、画像生成AIとの付き合い方、画像生成AIの在り方を考えている方もいらっしゃいます。
しかし、それ以上に大多数の無能が足を引っ張りまくってます。頼むから、理論ガバガバの文章に踊らされないでくれ。お願いだから、話にならない無知を晒さないでくれ。本当にお願いします、簡単に不安を煽られないでくれ。何が正しいのか、何が間違ってるのか、分からないかもしれないけど、だったらジッとしていてくれ。落ち着いてまずは調べろ。Googleでいくらでも出てくるんだ。理解できなかったら他人に説明してもらうんだ。chatGPTはいいぞ。(それらのAIの恩恵を受けるなら、画像生成AIの恩恵も検討しなければならないけど)
自分たち側に無能で馬鹿でメンヘラの社会不適合者が圧倒的に多いことを事実として受け止め、できる中でより良いAIとの共存を模索する。それが、画像生成AI規制派に必要なことではないでしょうか。
推進派と規制派が持ちつ持たれつ議論を重ねることで科学の良い発展がもたらされると信じていますから、規制派にはマジで頑張って欲しいのです。
自分なりの救い方は検討していました。自分自身が絵描きの理屈やルールや感情の代弁者として立ち上がり、推進派との架け橋になる……ありきたりかつ理想的ですが、価値のある行いではあるかもしれません。
例えば、オプトイン制度に際してのコメントは以下のものが考えられます。
「そもそも、芸術行為とはどこまでも自分本位の行いであるべき。自分本位に生み出した作品は、自分のためだけに存在しているべきもので、そこで技術の発展だとか、他人の見栄だとか、そういうことに使われると芸術行為の芯に傷がついてしまうのでは。それが意欲の低下に繋がるのかもしれません」
あるいは、クラファンを立ち上げ、司法に是非を問うてみるのもありかもしれません。
でも、こんな奴ら助けるくらいだったら、その時間使って画像生成AI技術に手を出して学んだ方が遥かに有意義なんじゃないか?ぶっちゃけ自滅する泥舟に乗りたいか?そもそも救いたいという感情自体が傲慢なわけで。
というわけで、救いたいと思い言語化していたはずが、し終わる頃にはマジでやる気が失せました。
絵描きがただひたすら自滅を重ねていく様を楽しみたい気持ちすらあります。
もう知らねー
https://arxiv.org/pdf/2304.10466.pdf
試行錯誤によって方針を学習する深層強化学習アルゴリズムは、環境と積極的に相互作用することによって収集された限られた量のデータから学習しなければならない。多くの先行研究が、データ効率の良いRLを実現するためには適切な正則化技術が重要であることを示していますが、データ効率の良いRLにおけるボトルネックの一般的な理解は不明なままでした。その結果、すべての領域でうまく機能する普遍的な技術を考案することは困難であった。
本論文では、非定常性、過剰な行動分布シフト、オーバーフィッティングなどのいくつかの潜在的な仮説を検討することにより、サンプル効率的な深層RLの主要なボトルネックを理解することを試みている。
強化学習ってよく知らない
我々は、状態ベースのDeepMind control suite(DMC)タスクについて、制御された体系的な方法で徹底的な実証分析を行い、遷移の検証セットにおける高い時間差(TD)誤差が、深いRLアルゴリズムの性能に深刻な影響を与える主犯であり、良い性能をもたらす先行手法は、実際、検証TD誤差を低く制御することを示した。この観察から、ディープRLを効率化するための強固な原理が得られる。すなわち、教師あり学習の正則化技術を利用することで、検証TD誤差をヒルクライムできる。
誤差を減らすのがDeepLearningだけど、それが時間差なのか。
我々は、検証TD誤差をターゲットとするシンプルなオンラインモデル選択法が、状態ベースのDMCとGymタスクにおいて効果的であることを示す。
1 はじめに
強化学習(RL)法は、大容量の深層ニューラルネット関数近似器と組み合わせた場合、ロボット操作などのドメインで有望視されている(Andrychowicz et al、
2020)、チップ配置(Mirhoseini et al.、2020)、ゲーム(Silver et al.、2016)、データセンターの冷却(Lazic et al.、2018)。アクティブなオンラインデータ収集の単位ごとに費用が発生するため(例.
実際のロボットを動かす、シミュレーションによるチップ評価など)、限られた経験量でも効率的に学習できる、サンプル効率の良い深層RLアルゴリズムを開発することが重要である。このような効率的なRLアルゴリズムの考案が、近年の重要な研究課題となっています(Janner et al、
2019; Chen et al., 2021; Hiraoka et al., 2021)。
原理的には、オフポリシーRL法(例えば、SAC (Haarnoja et al., 2018), TD3 (Fujimoto et al., 2018), Rainbow (Hessel et al., 2018))は、データ収集のステップごとに多くの勾配ステップのポリシーと値関数を改善することを可能にするため、良いサンプル効率が得られるはずです。しかし、このメリットは実際には実現できないようで、1回の学習ステップを多く取りすぎることでを収集した各遷移は、多くの環境において実際にパフォーマンスを害する。過大評価(Thrun & Schwartz, 1993; Fujimoto et al., 2018)といったいくつかの仮説、非定常性(Lyle ら、2022)、またはオーバーフィッティング(Nikishinら、2022)が根本的な原因として提案されている。
これらの仮説に基づき、より多くの勾配ステップを持つオフポリシーRLを可能にする方法として、モデルベースのデータ増強(Jannerら、2019)、アンサンブルの使用(Chenら、2021)、ネットワークの正則化(Hiraokaら、2021)、再生バッファを維持しながらRLエージェントをゼロから定期的にリセット(Nikishinら、2022)などのいくつかの緩和戦略が提案されている。これらのアプローチはそれぞれサンプル効率を大幅に向上させるが、これらの修正の有効性は(これから示すように)タスクに大きく依存する可能性があり、根本的な問題やこれらの手法の挙動を理解することはまだ未解決である。
ICLR 2023で会議論文として発表 本論文では、より多くの勾配ステップを取ることが深層RLアルゴリズムの性能悪化につながる理由、ヒューリスティック戦略が役立つ場合がある理由、そしてこの課題をより原理的かつ直接的な方法で軽減する方法を理解しようとするものである。
最近提案されたタンデム学習パラダイム(Ostrovski et al., 2021)を用いた実証分析を通じて、TD学習アルゴリズムは、学習の初期段階において、すぐに高い検証時間差(TD)誤差(すなわち、保留した検証セットにおけるQ-ネットワークとブートストラップターゲットの間の誤差)を得る傾向にあり、悪い最終解をもたらすことを明らかにする。
このホワイト ペーパーでは、深い RL アルゴリズムで勾配ステップを増やすとパフォーマンスが低下する理由、場合によってはヒューリスティック戦略が役立つ理由、およびこの課題をより原則的かつ直接的な方法で軽減する方法を理解しようとします。 最近提案されたタンデム学習パラダイム (Ostrovski et al., 2021) を使用した実証分析を通じて、トレーニングの初期段階で、TD 学習アルゴリズムが高い検証時間差を迅速に取得する傾向があることを示します。
(TD) エラー (つまり、保留された検証セットでの Q ネットワークとブートストラップ ターゲットとの間のエラー) が発生し、最終的なソリューションが悪化します。 さらに、データ効率の高い RL 設定のために考案された多くの既存の方法が、検証 TD エラーを低く制御する限り有効であることを示します。
この洞察は、深い RL を効率的にするための堅牢な原則を提供します。データ効率を向上させるために、検証 TD エラーを山登りすることによって、特定の問題に最も適した正則化を選択するだけです。
この原則は、オンラインRLトレーニングの過程で特定のタスクに最適な正則化戦略を自動的に発見しようとする単純なオンラインモデル選択方法の形で実現され、これを検証TDエラーを使用した自動モデル選択(AVTD)と呼びます。
AVTD は、各エージェントが異なる正則化を適用する共有リプレイ バッファーで、いくつかのオフポリシー RL エージェントをトレーニングします。 次に、AVTD は、環境内で動作するための検証 TD エラーが最小のエージェントを動的に選択します。
この単純な戦略だけでも、多くの場合、さまざまな Gym および DeepMind コントロール スイート (DMC) タスクで個々の正則化スキームと同様のパフォーマンスを発揮するか、それを上回ることがわかります。 重要なのは、パフォーマンスがドメイン間で大幅に異なる可能性がある以前の正則化方法とは異なり、私たちのアプローチはすべてのドメインで堅牢に動作することに注意してください。
要約すると、私たちの最初の貢献は、サンプル効率の高いディープ RL のボトルネックの実証分析です。 これらの課題の背後にあるいくつかの潜在的な説明を厳密に評価し、トレーニングの初期段階で高い検証 TD エラーを取得することが、データ効率の高いディープ RL のパフォーマンスを阻害する最大の原因の 1 つであることを観察します。 私たちの 2 番目の貢献は、単純なアクティブ モデル選択法 (AVTD) です。これは、検証 TD エラーの山登りによって正則化スキームを自動的に選択しようとします。 多くの場合、私たちの方法は、さまざまな Gym および DMC タスクで、最適な個々の正則化スキームに匹敵するか、それを上回ります。
他人に偉そうに説教してる暇あったら生産性のない自分の人生を見つめ直して改善してもろて
国が許すってなんだよ
結局気持ちの問題でしかないのに誰かの許可が必要みたいな妄想拗らせて私が悪いんじゃなくて世間が悪い他人が悪いと責任転嫁するだけで状況を改善しようと自ら動くこともなくただ愚痴愚痴と文句垂れ流すだけ
こういうタイプは結局状況がどう変わろうとも被害者ポジを取りに行ってできない理由やらない理由をくどくどと並べたてながらつまらない人生を送っていくんだよ
よくツイッターにいる自己肯定感マシマシなエンジニアさん達、すごい偉そうな物言いをよく見かけるけど落ち着け。
プログラミングスクールの「エンジニアになれば人生勝ち組」的な喧伝に踊らされたのか知らんけど、エンジニアって別に全く何も偉くないぞ。
プログラミングできることやWebの知識があることにすごく自信を持ってるかもしれないけど、結局それってパソコンにちょっと詳しいだけの話であって全くビジネスの本質じゃない。
顧客の声を聞き、課題の輪郭を明確にし、解決可能な妥協案を見つけて適切なソリューションを選択し、報酬を得る。
これがビジネスだ。
プログラミングをするのは適切なソリューションが見つからなかったときの最後の手段。
そういう観点でエンジニアってのはビジネスにおける最下流の存在なんだよ。
もちろん技術がイノベーションを起こすってのはGoogleとかAppleを見てればわかる。
ただそんなの外れ値の話で世の中のエンジニアの99.9%は最下流の作業員なの。
メルカリのk8sでマイクロサービスがなんちゃらがエンジニアとしてすごいってよく言われてるけど、結局はアレって本質的には標準的なWebサービスだと思う。
あの技術はイノベーションを起こすものではなくてビジネスアイデアをブラッシュアップするもの(UXを改善するもの)であって、メルカリの勝利はビジネスアイデアと市況、マーケティングによるものなんだよ。
これをエンジニアによるものだと錯覚したイタいエンジニアがイキリ倒してるのを見てると本当にため息が出る。
視座が低すぎる。
お前らがバカにしてる営業こそ真にお前の給料を錬成してるんだ。
とまあ所謂イケてるエンジニア(年収1500万くらい)だった人間が起業して自分でビジネス始めて、プログラミングができること自体には何も価値がないって気づいて絶望した果てに愚痴を書いてみた。
周回遅れの議論をしているのはお前だ。
育休制度の趣旨に関してはその通りで、社会インフラの恩恵を受ける企業が一定の範囲で人口維持にコストを割くのは理にかなっています。しかし大元の増田はそれを否定しておらず的外れな指摘です。
大元の増田は『勤務年数が成果に繋がりづらい事務職においては出産・育児を経ても職員に継続して勤務してもらえるという企業側のメリットを享受できず経営者や他の職員の理解を得づらいので利害調整が難しい』という話をしているのに、突然『あえて言うなら「国という会社の利益のための制度」です』とか言って殴り始めるのは日本語読めてるか心配なレベルです。大元の増田が求めているのは育休制度そのもののメリットではなく、経営層やしわ寄せを受ける職員が納得できる理由や、理解を得やすいより具体的なメリットの発生する制度改革であるとまともな国語教育を受けていれば読み取れるはずです。
現実の『仕事』は単一の価値観に基づいて物事が決まることは少なく、管理職は経営層や職員、育休制度を含む規則など相反する複数の価値観に基づいて利害関係を調整した上で最終的な制度や手順に落とし込まれます。育休制度は複数ある制約の一つでしかなく、大元の増田も管理職であることから様々な制約の中で最大公約数的な解答を見つけるのが『仕事』であり、そこでもがき苦しんでいます。
育児休業制度の趣旨そのものは良いことであり正しいですが、『他の職員や派遣社員の労働環境の維持・改善』、『事務業務の質の向上』、『利益を出して給与を払い納税する』といった価値観もまたいいことであり正しいことなので、育児休業制度そのものの正しさを語るだけでは不十分です。また大元の増田は少なくとも育児休業制度がある社会を前提として現実の制度の落とし込むために汗を流しており(それが管理職の業務として理解ある態度を取っているのか本心なのかはわからないが、その差異については今回の問題に実質的な影響はないだろう)、そういった人に対して「何周遅れの話をしているのか」と侮蔑の言葉を投げかけるのは非常に失礼なだけではなく、無用な断絶を招く悪しき行為だと感じますので撤回か謝罪をされたほうが良いのではないかと思います。
そもそも論なのですが、価値観が多様化した現代において現実に発生している問題の殆どは利害関係の調整が難しく、現実的な落とし所としての解がみつかっていないものであると私は考えています。その中で実際に問題の解決に当たる人というのは、個別の価値観の正しさは認めた上で多くの人が納得できる解を探すことがほとんどです(担当者個人の心情はどうであれ、仕事としてはそのようにしか進まないことがほとんどだと思います)。そういった人にとっては盲目的に個別の価値観のみに則って「~する人は全員バカです」とマウントを取る人間は周回遅れであり、「それはそれで正しいけれどもいきなりは変えられないし現実的にどうやって実現できるか考えてるんだから黙ってろバカ」というのが本音であることも多いと思います。ただそういった人たちがいることで世論が動き、世間の価値観がどちらかに寄ることで着地点が見つかることも多いので、特定の価値観のみに基づく言説それ自体が悪とは思いません。ただ今回の批判増田によって大元の増田の会社の意識が変わって問題が解決することはないと思いますが。
また現実に問題を解決しようとする人がそれを理解していればいいのですが、仮に特定の思想が強い『活動家』が仕事を始めてしまった場合、自身の信じる理想にのみ基づいて仕事を進めるため大抵はうまくいきません。例えば利害が衝突する価値観に突っかかって多くの敵を作ってしまったり、理想と関係の薄い業務を軽視しがちになり税金を使っているにも関わらず経理が疎かになったりといったようなことが起こりえます。
なんだろうね
ぼく:
きょう午前中は仕事で失敗をしてがっかりしています。今日は2023年4月20日です。しし座の運勢を占いたいです。
ChatGPT(3.5):
残念ながら私は占いの能力はありませんが、あなたが失敗を経験してがっかりしていることをお伝えします。失敗は誰にでも起こり得るものであり、成功に繋がるための貴重な学びの機会でもあります。
もし、落ち込んでいる気持ちが続く場合は、自分自身を励まし、前向きな考え方を持つようにしてください。そして、次に同じような失敗を繰り返さないように、自己反省を行い、改善策を考えることが大切です。
また、しし座の運勢については、占星術に基づいた情報を提供することはできませんが、あなた自身の能力やチャンスを最大限に活用することができるよう、前向きで積極的な姿勢を保ち続けることをお勧めします。