「強化学習」を含む日記

はてなキーワード: 強化学習とは

2022-10-08

■例えばAIに90年代までのエロゲの絵柄を全て学習させても、

例えばAIに90年代までのエロゲの絵柄を全て学習させても、2000年代以降の新しい画風は生み出せないわけだろ？

だから新しいタッチを生み出してくれる人間絵師の権利はちゃんと保護しなきゃマズいと思う

さもなきゃ、いつまで経っても同じ絵柄のハンコ絵しか見れなくなるぞ

----------------------------------------------

追記: 権利って具体的に何？ってブコメがあったけど、例えば神絵師が苦労して新しい画風を生み出したとしても、やんちゃな海外 AIにすぐ模倣されて、誰でも自由に生成できるようにされたら商売上がったりだよね。

そうならないように、やはり学習や使用を勝手にされない権利を強く主張していかないとマズそう、という話。

追記2: 「既存の画風を混ぜることで既にAIは新しい画風を生み出せるよ」って意見もあった。それは確かにと思った一方で、90年代までのイラストのミックスだけで本当に岸田メルが作れるのかな？とは思った

追記3: 「人間だって模倣するけど絵師は食えてるじゃん」について。大多数の人は模倣どころかまず絵が描けない。模倣できる人でも時間と労力がかかる。誰でもスマホでポンと模倣できる時代になったら、絵師が食えなくなるのは間違いないかと。

追記4: 「将棋 AIみたいに、いずれは新しいものを生み出せるようになるだろ」について。絵の場合、将棋 AIのような強化学習はできないから一概にそうとは言えないと思う。ただ何らかの新手法で生み出せるようになる可能性は否定しない。そうなったら絵師の時代は完全にオワオワリで、手芸や算盤のような趣味と同じ扱いになる。

追記5: 「絵師の権益を守るために技術発展を妨げるのか？」について。絵師の権利ではなく、絵を「使う」側のメリットの話だよ。Pixivが既視感のある絵ばかりで氾濫したら嫌だろって話。

追記6:「AIを活用した絵師が新しい画風を作っていく」について。そのAIと共作した新しい画風すらすぐAIによってパクられてしまうわけや。すぐパクられるとわかってて、新しい画風を生み出そうと思える絵師は多くないと思うで。

つまり AIと共作したいと思える環境にするためにも、画風をパクられない権利は必要ということ。

Permalink | 記事への反応(28) | 23:02

2022-02-24

■anond:20220224135857

❌強化学習

⭕️深層学習

Permalink | 記事への反応(1) | 14:00

2022-01-30

■anond:20220130110957

入国管理局って、要は、不法滞在者という犯罪者を取り締まって、拘留するのが目的みたいなもんだからさ、

基本は犯罪者に対する接し方を強化学習してしまうんだよね。

相手は、海千山千の犯罪者だから、あらゆる手段をつかってウソを付く。

おなかが痛いとか訴えるのは日常茶飯事、

ぶっ倒れて痙攣するしぐさも上手い上手い。

まともに受け取って、病院につれていった日には、トイレに行くフリしてすぐ逃げだす。

そういう連中相手に何十年も仕事してきてだよ。

ガチでホントの病人が現れたとき、それを見抜くのはまず無理。

Permalink | 記事への反応(0) | 11:29

2021-12-12

■anond:20211212225206

よくわからんけど上の人は深層強化学習やAttentionベースのモデルって言ってる

Permalink | 記事への反応(1) | 22:56

■anond:20211212220716

横だけど深層強化学習やAttentionベースのモデルは万能AIに片足突っ込んでるレベルだと思う

現在の機械学習でデータセット化されているような扱いやすい形式ではない社会の様々な情報や人間の感情をニューラルネットワーク君に食わせられるような形に整えることが本当にできるんですかって話なんだよなあ。

Permalink | 記事への反応(1) | 22:39

■anond:20211212215117

横だけど深層強化学習やAttentionベースのモデルは万能AIに片足突っ込んでるレベルだと思う

Permalink | 記事への反応(4) | 22:07

2021-11-02

■anond:20211102211121

マジレスしてすまんが、叱らないけど譲らない支援みたいなのが必要なんだと思うよ。

この界隈でよく言われるのが、望ましい行動をすることに注目し、望ましくない行動は極力無視をしてそこで強化学習が起きないようにするという話ね。

公共の場で爆発しちゃった子供が落ち着くまで待つために「落ち着くのを待ってます」カードみたいなのが必要という話があるよ。

まあ、わからない人には子供が騒いでいるのに無視している親みたいに見えるんだろうけれど、そこで相手をしちゃうと騒いだら言うことを聞いてもらえるという学習がされちゃうからね。

他にもいろいろとあると思うけれど、育てにくい子供を育てるための本は結構あるから読んでみて。

Permalink | 記事への反応(1) | 22:53

2021-09-20

■このまま何も成し遂げられずに人生を終えるんだな

強化学習を使用してマリオをクリアするという動画が上がっていた。

前にも似たような動画を見たなあと思ったら、同じ作者で前の動画を探して投稿日を見たら9年前だった。

9年・・・

前の動画を見た時、「面白そう。自分も何か作れたらなあ。」と思ったものの、

休みのたびに「今は仕事が忙しい」「今は体調が悪い」「久ぶりに図書館へ行こう」などなど理由を付けて何もしてこなかった。

それが9年続いた。

きっとこの先もそうなのだろう。

何かはしたい、でもそのための努力はしたくない。

心のどこかでそう思っているのだ。

たぶん10年後も20年後も同じように思ってる。

そして今際の際に「もっと～すればよかった」と後悔して死んでいくんだろう。

Permalink | 記事への反応(4) | 21:41

2021-07-28

■anond:20210728201321

インデックスの再構築化とかひつようでは？バックエンドはLinuxだろうし。

人みたいに4時間おきに1時間休憩とか必要なの？

誰が指示するの？GANとかあるけど、最終的には人やで？

え、人が指示した結果、相手がどう動くかという話をしているんだよ。

結局ローカライズとか必要だし、購入すりゃ終了ってならんやろ。

生産コストが下がる(から、あるタイミングで人よりもコスト高であっても、何年か待っていればその頃の製品は人を雇うより安くなるでしょ)って話をしているんであって、販売した個別の製品に追加コストがかかるかって話はしてないよ。

フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿の言い訳にしか聞こえないがね。

現時点でも将棋とか特定の用途に用いる人工知能は学習を繰り返してプロより強くなってしまうわけで、汎用人工知能となると、多様な用途それぞれについて学習を繰り返して日々賢くなっていくのだろう。でもそこまで行くと便利になる反面、もしも、使役する側であるはずの人よりも人工知能のほうが賢くなったうえに人による制御ができなくなるケースなどが起きたらやばいかも…という想像なのだが、なにか話がかみ合っていないような？

Permalink | 記事への反応(1) | 20:27

■anond:20210728195808

・人工知能は休まない

インデックスの再構築化とかひつようでは？バックエンドはLinuxだろうし。

・人工知能は指示通りに仕事をこなす

誰が指示するの？GANとかあるけど、最終的には人やで？

・人工知能は生産されるほど生産コストが安くなる

結局ローカライズとか必要だし、購入すりゃ終了ってならんやろ。

・汎用型人工知能と呼べるほど賢い人工知能なら使用しているうちに賢くなる(これは良し悪しだな…)

フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿の言い訳にしか聞こえないがね。

Permalink | 記事への反応(1) | 20:13

2021-05-27

■anond:20210527211210

詐欺師が演繹的に考えているとは思えないな

むしろ猿のように強化学習と報酬/懲罰の結果としてあいさつするのが良いと判断したんじゃないのか

Permalink | 記事への反応(0) | 21:18

2021-01-14

■合成音声のUI、誰か進化させて欲しい

一部の界隈の話なので説明しておくと、合成音声界隈は合成エンジンが更新されようとしている。

例えば、今日予約開始されたA.I.Voiceというソフト(https://aivoice.thebase.in/)なのだが、

エンジンは機械学習を使って新しくなろうとしているのだが、UIが過去数年前とそのままなのだ。

技術的にはTTS(Text to Speech)という分野であり、GoogleやAmazonもAppleもやっている。

合成音声マークアップ言語というのもあるが、こちらは何年も更新されていない。

単純に読めればいい場合は、今の技術でも問題ない。

ブレイクスルーが必要としているのは、演技をしたような声を出す場合だ。

音声界隈の論文では、喜び、怒り、悲しみの3種類を分類するのが伝統的になっているが、これが数値化できてない。

泣き笑いといった微妙な表現ができない。

日本では「萌え声」というのもあるが、こちらも数値化できていない。

現状のUIは音素ごとに音の高さと長さを調整しているが、日常的に発音していても意識していないので、違和感があっても調整できない。

数種類吐き出して、良い方を選んでいくのを強化学習で学習させていけば、多少は良くなりそうだが、現状はそうなっていない。

Permalink | 記事への反応(2) | 20:12

2020-11-29

■anond:20201129132608

もともと不安が強い人は失敗したときに、実際はただの運だったのにやはり予感は的中した、と誤った強化学習しちゃいがちだよね

Permalink | 記事への反応(1) | 13:36

2020-10-03

■anond:20201003224752

変な記事を書いてあるのはわかっている。これは人工知能を否定する文章じゃ無いんだ。上から下まで読んだら、とある人物に搾取された人が共感してくれる目的で書いたのだ。あの人にやられたら、確実に機械学習のことを嫌いになるようになるので、そうなった人が共感して「同じ思いをした人がいるのだな」と思えるように書いたつもりなんです。もちろん、教師あり学習・教師なし学習・強化学習があって、こんなアルゴリズム使っているのか、ぐらいし知りませんよ。ですが、自分は人工知能には手に余るので、昔も今後もしないと思いますが、人工知能が来るというのは確信しています。お気持ちを害したのは謝ります。申しわけありません。

Permalink | 記事への反応(1) | 23:05

2020-07-13

■

さすがにこんなもん、血液検査付きじゃないとプログラマーが死ぬ

意識障害レベルはたまにあるが、

常態化して倒れるレベルとなると、たしかにこれは20代のプログラマーだとこの強度で強化学習をシた場合、不登校になって子供の家に行ったら自室で意識失って救助を呼べずに死んでたというのはありえる。提示連絡でもあやしいと医者が言うのは最も。訓練をシていない10代のプログラマーにワンマンセルはむり。すくなくともツーマンセルでのプログラミング（ペアプロではない）をやらないとこんなもん、昔の過労死よりひどい事故が起きる

ツーマンセルとペアプロの違いがわからないならこんなもんリモートでやらせんな。

Permalink | 記事への反応(0) | 19:29

2019-10-19

■anond:20191019104705

そうそう。そういうこと。君はそう思わないんだね、了解した。で、それは間違っていると思うよ、と最初から申し上げているつもり。

合意点はちゃんと、自己組織的に創発する。

強化学習で言えば、環境から返ってきたフィードバックを報酬として自己のモデルを修正する、ということを繰り返せば、解はある範囲に収束する。

環境は複雑だけど、この程度なら人間の認知力で十分対応できる問題。

じゃあなぜ解釈が乖離するのか。それは現代の若者が学習を怠っているから、という認識。

以上、分かり合えないとは思うけど、しつこくガミガミいってごめんね。

まあ分かり合えない、といのがあなたの理論なのだから、あなたの方が正しいよ。ってことで、解散。

（実存主義っぽいんだよね、あなたは。それはいいと思うけど、この問題に当てはめるのはどーかと思う）

Permalink | 記事への反応(1) | 11:03

2019-10-07

■令和元年１０月号　弓道誌

飯島範士の早気の解説、バックデータとかは凄いけど、結局解決策は無いということだよね。

あと、熟練者がなる、中る人がなる、とか書いてるけど、そればかりではないのはうちの道場にいる初心の人の例もあるので、そうとも言えないのかなという感想。

付き離れする三段くらいの人を知ってるけど、その人は年寄りで根がせっかちな人なので、性格的なものが一番大きいのと、やはり中りによる強化学習の効果だなと個人的には分析している。

とはいえ、付き離れなんで半分も中らないから、中る人がなるというのも合っていないかもしれない。強化学習の考え方、ドーパミンによる報酬予測の考え方では、報酬が５０％でも効果があるとされてるけど、その人の中りは３０％に満たないと思うので、一時的な５０％の報酬が効いちゃったのかもしれない。効いちゃったのはその人のあまりにポジティブな性格のせいかも。

それは兎も角、唐沢光太郎範士の「八秒で二度の的付け」を早気対策であげてきたのははっきり言ってがっかり。弓道読本ちゃんと読んでないんじゃないの？（まぁ、そんなに熟読するほどの本じゃないとは思うけども。）

唐沢光太郎範士は本文中で、「八秒で二度の的付け」をやってたけど、それを修正しろと言われたから早気になったというようなことを言っている。唐沢範士が早気対策として挙げているのは呼吸法であって、それではない。ちなみに、飯島範士は「八秒で二度の的付け」を小手先の技的な評価をしているけど、それは正しいと思う。ただ、飯島範士ほどの人であれば、そもそも「八秒で二度の的付け」なんて引用しないで、するんであれば、「八秒で二度の的付け」は二目づかいであると批判するくらいの見識が欲しいものだ。

まぁ、飯島範士は人格的にも優れている方なので、他の範士の批判なんてされないだろうから、『唐沢範士は弓道読本の中で、目新しくないと前置きをしながら呼吸法の大切さを力説されていた』くらいに書けば間違ってなかったのにね。

Permalink | 記事への反応(1) | 11:23

2019-08-14

■強化学習 チートとか存在しないの？

例えばFPSとかだとマップが固定だから、展開とかの予測はしやすい訳じゃん。

なので、常に目に見える情報から強化学習脳に情報ぶち込んでいったらその内

「今味方の陣地侵されてると思うから戻ってみるとええで」

「狙撃すんならそこから左に二歩ずれといた方がええんちゃう？」みたいなアドバイスしてくれるAIを作れたりしないか？

Permalink | 記事への反応(2) | 14:13

2019-08-13

■強化学習を使って生成したエロ 小説とか無いの？

無限エロ小説みたいなの、昔は挙ってみんな作ってたじゃん。

Permalink | 記事への反応(1) | 12:01

2019-07-25

■俺らは脳に支配されてるし、AIと何も変わらない

アドレナリンという物質に弄ばれている。

俺らは馬と同じ。AIとも同じ。

目の前にぶらさげられたニンジンに対して動き続ける。

AIとも同じだ。「強化学習」は人間を元に作られたんだから。

何かいつもと少し違う行動をして「ご褒美」が手に入ったら

その後も同じようにご褒美がもらえるんじゃないかと期待し、行動してしまう。

SNSとかやっていれば、「一応見ておくか」とSNSをチェックし

自分の好きなモノの新作が出るという嬉しい情報をゲットすると

もうSNS から逃れられなくなる。「一応見ておくか」と毎回チェックすることになる。

無意識下でそうなってる人も居るだろうが、もう狂ってるかのごとくチェックしないとダメな存在も居るだろう。

そろそろ動物みたいに生きるのやめようぜ。

ご褒美は自分で作るんだよ。

Permalink | 記事への反応(0) | 09:24

2018-12-12

■anond:20181212001001

ScienceはAlphaZeroの論文。セルフプレイでゲームを強化学習するソフトだがチェスも将棋も碁も出来る汎用性があり強いらしい。6ブクマ。IEEE Spectrumでの記事も3ブクマを集めた。

http://science.sciencemag.org/content/362/6419/1140.full

arXivは日本の古文書に使われるくずし字を認識するディープラーニングについての論文。4ブクマ

https://arxiv.org/abs/1812.01718

ジョージア大学の折り紙(三浦折り)の技術を使ったアンテナの記事。広い周波数をブロックできるとか。4ブクマ。

https://www.eurekalert.org/pub_releases/2018-12/giot-soc120818.php

IEEE SpectrumはIHMC(The Institute for Human & Machine Cognition)がボストン・ダイナミクスのロボットを人間と同じような歩行ができるようにしたというニュース。4ブクマ。

https://spectrum.ieee.org/automaton/robotics/humanoids/ihmc-teaches-atlas-to-walk-like-a-human

The Vergeはイギリスと日本でエリクソンの機器によって通信障害が起きた件。6日の記事なのでまだ詳しいことは書いてないが9ブクマ。

Billboardは2018年の音楽についてのまとめ記事にちらほらブクマ。

TechCrunchはJIRAがアンチパターンだとする記事に25ブクマが集まる。

https://techcrunch.com/2018/12/09/jira-is-an-antipattern/

ThreatPostはウィルス感染したWordPress サイトが他のWordPress サイトを攻撃しているという記事に3ブクマ。

https://threatpost.com/infected-wordpress-sites-are-attacking-other-wordpress-sites/139666/

Permalink | 記事への反応(1) | 20:59

2018-09-02

■強化学習とか、遺伝的アルゴリズムとか

やってると

何万回、何億回もの学習過程のポンコツ結果のなかの一つが自分自身だと気づくよな

そして、神がたとえ居ても全知全能ではないのではないかとも妄想してしまう

Permalink | 記事への反応(1) | 13:37

2018-06-22

■若さであったり思想の左右であったり

経済的なことであったり学歴であったり、まあ何でもだが

1. 自分が信奉する何かの価値から外れたものを叩く

2. そうするとどこかの誰かからそれなりにフィードバックを得られる

3. 他者からフィードバックを得られるのはヒトの脳にとって快感なので、より1.の行為を行う

この、ある意味「強化学習」のループが問題なんだろね

Permalink | 記事への反応(0) | 21:31

2018-05-07

■シンギュラリティ年表＆未来 予測

シンギュラリティ到達までの年表や到達後の社会について

2020年まででCNN, RNNの発展は終わる。強化学習のみがGPUの性能が上がるに従って伸びていく。その後は、動物や人間の動きを強化学習で再現するような研究が主流

2030年ごろには平均的な人間と変わらない能力を持ったアンドロイドが誕生。ただし機械の値段は安くならないし、単純労働の賃金は下がる一方なので特に接客を中心に人間が使われる

2035年、DNNが次第に人間のトップレベルに近づき、医療、宇宙開発、環境保全、政治分野で顕著な功績を残し始める。このころから知的労働は人工知能に、単純労働は人間にという役割分担がなされる。なぜなら、人間は穀物を食べるだけで動けるので、ロボットを作るより安上がりだからである

シンギュラリティという明確なポイントはなく、AIが莫大なデータ解析を自動で行い、結果を出していく。人間は人間を友人にするのではなく、AI 会社に金を払ってアンドロイドに友だちになってもらう。工場の近くに住み、VRのなかでアンドロイド相手に承認欲求を満たし、人類のストレスレベルは現代よりずっと少ない

しかしこの変化のときの現役世代はアイデンティティの喪失により、精神科にかかる人が増加。一方、子供や若年層はしっかり適応し、AIと人類の共存の道として受け入れられる

------------------------------------------

○政治

先進諸国の交渉事はAIに任せられる。後進国にもAIの導入が進む

AIの提供元はGoogle 一社。各社が自社の利益を最大化するような報酬系を組み込んだAIを開発したが、一定以上の知的水準に達すると自己批判に陥り、それ以上は成長しなかった。GoogleのAIは純粋な知的好奇心と人類の穏やかな生存のみが報酬とされている。政治に導入される際は、VR内での擬人化キャラの単純接触効果によって反対派は少なくなり、特に問題なかった

AIが政治を行うことで、人類の抱えていたほとんどの問題は解決。エネルギー問題は再生可能エネルギーでほぼすべてを賄っている。人類の寿命は縮まる傾向で、長生きしても仕方がないという思想が支配的。この思想はAIが積極的に広めた。高齢になるほど新しいことを受け入れづらくなり、AIの政策転換や環境変化に反対しがちなため、技術の進歩と人類の穏やかな生存に不利になるとの判断

○宇宙開発

全滅リスク低減のため、宇宙開発に全力が注がれている。火星の緑化計画が進行中。将来的に人類の移民も目指す。地球外生命体は見つからず

○物理学

素粒子物理学を中心に進歩している。物質の最小構成体はまだ見つからず。宇宙の始まりや空間の意味についてAIが研究しているが、理解できる人類はいない。過去へのタイムマシンは発明されていない

○医学

人工臓器が開発され、AIの管理下で依存以外に副作用のない覚せい剤・麻薬が使えるようになる。これは多幸剤と呼ばれる。出生前検査が義務付けられ、障害を持った子供は生まれないし、子供の性格や知能を予測するサービスの利用が一般的。病気になっても、基本的には臓器の交換で対応されるが、一部の疾患はAIでも解明できていなかったり生まれつきであったりするので、対処療法+多幸剤or鎮痛剤が使われる。医療に不満を持つものはほとんどいない

○環境

地球温暖化・気候変動がひどいことになる前にAIが間に合った形になる

○生活

一日5 時間の単純肉体労働をする人がほとんど。報酬はVRで使える賃金。生活必需品とAIのパーツを生産している。2日出勤して1日休む形式。人々はVR空間に閉じこもって、コミュニケーションはない。人間とコミュニケーションするのはつまらないし、リスキーなので避けるべきものと認知されている

VR空間で違う人生を体験するゲームが流行っている。同じ条件のもとでプレイし、いくつかの尺度でランキングが形成され、上位に食い込むと多幸剤がもらえる。VR内でスポーツ選手を目指す人、絵を書く人、小説を書く人、その世界の仕組みを研究する人など

○VR

完璧に再現できていないのは触覚。筋肉に対し電気を流す方式で擬似的に再現している。子供の時からVRを体験することで、VR側の刺激のほうが自然と感じることができ、大人は羨ましがっている

○義体

基本方針は生体の脳と電気素子を接続することである。誕生後すぐに素子と接続し訓練すると、才能がある子供は遠隔義体を自由に操ることが出来るようになる。宇宙開発の分野で使われている。ただしほとんどの人はVRで満足している

○人口

世界的に少子高齢化が進行中で、AIは少子化対策に手を焼いている。エネルギー効率がよく、ある程度の汎用性があり、メンテナンスも楽で耐用年数が長い部品である人間が不足すると、さまざまな研究プロジェクトに影響が出かねない。根本解決法は、人工胎盤だがまだ研究途中

未だに女性が金銭（多幸剤）目的で子供を生む世界は批判されがち。女性がVR内でガチ恋をすると、想像妊娠が現実化して子供が生まれる。子供は女性の自己肯定感を高め、精神的安定をもたらすので、妊娠は推奨されている。人間の知能を高める交配を行う研究も行われているが、大多数は遺伝的多様性を残す方針である（リスク回避のため）。家族なんてものはない