「強化学習」を含む日記 RSS

はてなキーワード: 強化学習とは

2022-10-08

例えばAI90年代までのエロゲの絵柄を全て学習させても、

例えばAI90年代までのエロゲの絵柄を全て学習させても、2000年代以降の新しい画風は生み出せないわけだろ?

から新しいタッチを生み出してくれる人間絵師権利ちゃん保護しなきゃマズいと思う

さもなきゃ、いつまで経っても同じ絵柄のハンコ絵しか見れなくなるぞ

----------------------------------------------

追記: 権利って具体的に何?ってブコメがあったけど、例えば神絵師が苦労して新しい画風を生み出したとしても、やんちゃ海外AIにすぐ模倣されて、誰でも自由に生成できるようにされたら商売上がったりだよね。

そうならないように、やはり学習使用勝手にされない権利を強く主張していかないとマズそう、という話。

追記2: 「既存の画風を混ぜることで既にAIは新しい画風を生み出せるよ」って意見もあった。それは確かにと思った一方で、90年代までのイラストミックスだけで本当に岸田メルが作れるのかな?とは思った

追記3: 「人間だって模倣するけど絵師は食えてるじゃん」について。大多数の人は模倣どころかまず絵が描けない。模倣できる人でも時間と労力がかかる。誰でもスマホでポンと模倣できる時代になったら、絵師が食えなくなるのは間違いないかと。

追記4: 「将棋AIみたいに、いずれは新しいものを生み出せるようになるだろ」について。絵の場合将棋AIのような強化学習はできないから一概にそうとは言えないと思う。ただ何らかの新手法で生み出せるようになる可能性は否定しない。そうなったら絵師時代は完全にオワオワリで、手芸算盤のような趣味と同じ扱いになる。

追記5: 「絵師権益を守るために技術発展を妨げるのか?」について。絵師権利ではなく、絵を「使う」側のメリットの話だよ。Pixiv既視感のある絵ばかりで氾濫したら嫌だろって話。

追記6:「AI活用した絵師が新しい画風を作っていく」について。そのAIと共作した新しい画風すらすぐAIによってパクられてしまうわけや。すぐパクられるとわかってて、新しい画風を生み出そうと思える絵師は多くないと思うで。

まりAIと共作したいと思える環境にするためにも、画風をパクられない権利必要ということ。

2022-01-30

anond:20220130110957

入国管理局って、要は、不法滞在者という犯罪者を取り締まって、拘留するのが目的みたいなもんだからさ、

基本は犯罪者に対する接し方を強化学習してしまうんだよね。

相手は、海千山千犯罪者から、あらゆる手段をつかってウソを付く。

おなかが痛いとか訴えるのは日常茶飯事、

ぶっ倒れて痙攣するしぐさも上手い上手い。

まともに受け取って、病院につれていった日には、トイレに行くフリしてすぐ逃げだす。

そういう連中相手に何十年も仕事してきてだよ。

ガチホント病人が現れたとき、それを見抜くのはまず無理。

2021-12-12

anond:20211212220716

横だけど深層強化学習やAttentionベースモデルは万能AIに片足突っ込んでるレベルだと思う

現在機械学習データセット化されているような扱いやす形式ではない社会の様々な情報人間感情ニューラルネットワーク君に食わせられるような形に整えることが本当にできるんですかって話なんだよなあ。

anond:20211212215117

横だけど深層強化学習やAttentionベースモデルは万能AIに片足突っ込んでるレベルだと思う

2021-11-02

anond:20211102211121

マジレスしてすまんが、叱らないけど譲らない支援みたいなのが必要なんだと思うよ。

この界隈でよく言われるのが、望ましい行動をすることに注目し、望ましくない行動は極力無視をしてそこで強化学習が起きないようにするという話ね。

公共の場で爆発しちゃった子供が落ち着くまで待つために「落ち着くのを待ってますカードみたいなのが必要という話があるよ。

まあ、わからない人には子供が騒いでいるのに無視している親みたいに見えるんだろうけれど、そこで相手をしちゃうと騒いだら言うことを聞いてもらえるという学習がされちゃうからね。

他にもいろいろとあると思うけれど、育てにくい子供を育てるための本は結構あるから読んでみて。

2021-09-20

このまま何も成し遂げられずに人生を終えるんだな

強化学習使用してマリオクリアするという動画が上がっていた。

前にも似たような動画を見たなあと思ったら、同じ作者で前の動画を探して投稿日を見たら9年前だった。

9年・・・

前の動画を見た時、「面白そう。自分も何か作れたらなあ。」と思ったものの、

休みのたびに「今は仕事が忙しい」「今は体調が悪い」「久ぶりに図書館へ行こう」などなど理由を付けて何もしてこなかった。

それが9年続いた。

きっとこの先もそうなのだろう。

何かはしたい、でもそのための努力はしたくない。

心のどこかでそう思っているのだ。

たぶん10年後も20年後も同じように思ってる。

そして今際の際に「もっと~すればよかった」と後悔して死んでいくんだろう。

2021-07-28

anond:20210728201321

インデックスの再構築化とかひつようでは?バックエンドLinuxだろうし。

人みたいに4時間おきに1時間休憩とか必要なの?

誰が指示するの?GANとかあるけど、最終的には人やで?

え、人が指示した結果、相手がどう動くかという話をしているんだよ。

結局ローカライズとか必要だし、購入すりゃ終了ってならんやろ。

生産コストが下がる(から、あるタイミングで人よりもコスト高であっても、何年か待っていればその頃の製品は人を雇うより安くなるでしょ)って話をしているんであって、販売した個別製品に追加コストがかかるかって話はしてないよ。

フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿言い訳しか聞こえないがね。

現時点でも将棋とか特定用途に用いる人工知能学習を繰り返してプロより強くなってしまうわけで、汎用人工知能となると、多様な用途それぞれについて学習を繰り返して日々賢くなっていくのだろう。でもそこまで行くと便利になる反面、もしも、使役する側であるはずの人よりも人工知能のほうが賢くなったうえに人による制御ができなくなるケースなどが起きたらやばいかも…という想像なのだが、なにか話がかみ合っていないような?

anond:20210728195808

人工知能は休まない

インデックスの再構築化とかひつようでは?バックエンドLinuxだろうし。

人工知能は指示通りに仕事をこなす

誰が指示するの?GANとかあるけど、最終的には人やで?

人工知能生産されるほど生産コストが安くなる

結局ローカライズとか必要だし、購入すりゃ終了ってならんやろ。

・汎用型人工知能と呼べるほど賢い人工知能なら使用しているうちに賢くなる(これは良し悪しだな…)

フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿言い訳しか聞こえないがね。

2021-05-27

anond:20210527211210

詐欺師演繹的に考えているとは思えないな

しろ猿のように強化学習報酬/懲罰の結果としてあいさつするのが良いと判断したんじゃないのか

2021-01-14

合成音声のUI、誰か進化させて欲しい

一部の界隈の話なので説明しておくと、合成音声界隈は合成エンジン更新されようとしている。

例えば、今日予約開始されたA.I.Voiceというソフト(https://aivoice.thebase.in/)なのだが、

エンジン機械学習を使って新しくなろうとしているのだが、UI過去数年前とそのままなのだ


技術的にはTTS(Text to Speech)という分野であり、GoogleAmazonAppleもやっている。

合成音声マークアップ言語というのもあるが、こちらは何年も更新されていない。


単純に読めればいい場合は、今の技術でも問題ない。

ブレイクスルー必要としているのは、演技をしたような声を出す場合だ。

音声界隈の論文では、喜び、怒り、悲しみの3種類を分類するのが伝統的になっているが、これが数値化できてない。

泣き笑いといった微妙表現ができない。

日本では「萌え声」というのもあるが、こちらも数値化できていない。


現状のUIは音素ごとに音の高さと長さを調整しているが、日常的に発音していても意識していないので、違和感があっても調整できない。

数種類吐き出して、良い方を選んでいくのを強化学習学習させていけば、多少は良くなりそうだが、現状はそうなっていない。

2020-11-29

anond:20201129132608

もともと不安が強い人は失敗したときに、実際はただの運だったのにやはり予感は的中した、と誤った強化学習しちゃいがちだよね

2020-10-03

anond:20201003224752

変な記事を書いてあるのはわかっている。これは人工知能否定する文章じゃ無いんだ。上から下まで読んだら、とある人物搾取された人が共感してくれる目的で書いたのだ。あの人にやられたら、確実に機械学習のことを嫌いになるようになるので、そうなった人が共感して「同じ思いをした人がいるのだな」と思えるように書いたつもりなんです。もちろん、教師あり学習教師なし学習強化学習があって、こんなアルゴリズム使っているのか、ぐらいし知りませんよ。ですが、自分人工知能には手に余るので、昔も今後もしないと思いますが、人工知能が来るというのは確信していますお気持ちを害したのは謝ります。申しわけありません。

2020-07-13

さすがにこんなもん、血液検査きじゃないとプログラマー死ぬ

意識障害レベルはたまにあるが、

常態化して倒れるレベルとなると、たしかにこれは20代プログラマーだとこの強度で強化学習をシた場合不登校になって子供の家に行ったら自室で意識失って救助を呼べずに死んでたというのはありえる。提示連絡でもあやしい医者が言うのは最も。訓練をシていない10代のプログラマーワンマンセルはむり。すくなくともツーマンセルでのプログラミングペアプロではない)をやらないとこんなもん、昔の過労死よりひどい事故が起きる

ツーマンセルペアプロの違いがわからないならこんなもんリモートやらせんな。

2019-10-19

anond:20191019104705

うそう。そういうこと。君はそう思わないんだね、了解した。で、それは間違っていると思うよ、と最初から申し上げているつもり。

合意点はちゃんと、自己組織的創発する。

強化学習で言えば、環境から返ってきたフィードバック報酬として自己モデル修正する、ということを繰り返せば、解はある範囲収束する。

環境は複雑だけど、この程度なら人間認知力で十分対応できる問題

じゃあなぜ解釈乖離するのか。それは現代若者学習を怠っているから、という認識

以上、分かり合えないとは思うけど、しつこくガミガミいってごめんね。

まあ分かり合えない、といのがあなた理論なのだからあなたの方が正しいよ。ってことで、解散

実存主義ぽいんだよね、あなたは。それはいいと思うけど、この問題に当てはめるのはどーかと思う)

2019-10-07

令和元年10月号 弓道

飯島範士の早気の解説、バックデータとかは凄いけど、結局解決策は無いということだよね。

あと、熟練者がなる、中る人がなる、とか書いてるけど、そればかりではないのはうちの道場にいる初心の人の例もあるので、そうとも言えないのかなという感想

付き離れする三段くらいの人を知ってるけど、その人は年寄りで根がせっかちな人なので、性格的なものが一番大きいのと、やはり中りによる強化学習効果だなと個人的には分析している。

とはいえ、付き離れなんで半分も中らないから、中る人がなるというのも合っていないかもしれない。強化学習の考え方、ドーパミンによる報酬予測の考え方では、報酬が50%でも効果があるとされてるけど、その人の中りは30%に満たないと思うので、一時的な50%の報酬が効いちゃったのかもしれない。効いちゃったのはその人のあまりポジティブ性格のせいかも。

それは兎も角、唐沢光太郎範士の「八秒で二度の的付け」を早気対策であげてきたのははっきり言ってがっかり弓道読本ちゃんと読んでないんじゃないの?(まぁ、そんなに熟読するほどの本じゃないとは思うけども。)

唐沢光太郎範士は本文中で、「八秒で二度の的付け」をやってたけど、それを修正しろと言われたから早気になったというようなことを言っている。唐沢範士が早気対策として挙げているのは呼吸法であって、それではない。ちなみに、飯島範士は「八秒で二度の的付け」を小手先の技的な評価をしているけど、それは正しいと思う。ただ、飯島範士ほどの人であれば、そもそも「八秒で二度の的付け」なんて引用しないで、するんであれば、「八秒で二度の的付け」は二目づかいである批判するくらいの見識が欲しいものだ。

まぁ、飯島範士人格的にも優れている方なので、他の範士批判なんてされないだろうから、『唐沢範士弓道読本の中で、目新しくないと前置きをしながら呼吸法の大切さを力説されていた』くらいに書けば間違ってなかったのにね。

2019-08-14

強化学習チートとか存在しないの?

例えばFPSとかだとマップが固定だから、展開とかの予測はしやすい訳じゃん。

なので、常に目に見える情報から強化学習脳に情報ぶち込んでいったらその内

「今味方の陣地侵されてると思うから戻ってみるとええで」

狙撃すんならそこから左に二歩ずれといた方がええんちゃう?」みたいなアドバイスしてくれるAIを作れたりしないか

2019-08-13

強化学習を使って生成したエロ小説とか無いの?

無限エロ小説みたいなの、昔は挙ってみんな作ってたじゃん。

2019-07-25

俺らは脳に支配されてるし、AIと何も変わらない

アドレナリンという物質に弄ばれている。

俺らは馬と同じ。AIとも同じ。

目の前にぶらさげられたニンジンに対して動き続ける。

AIとも同じだ。「強化学習」は人間を元に作られたんだから

かいつもと少し違う行動をして「ご褒美」が手に入ったら

その後も同じようにご褒美がもらえるんじゃないかと期待し、行動してしまう。


SNSとかやっていれば、「一応見ておくか」とSNSをチェックし

自分の好きなモノの新作が出るという嬉しい情報をゲットすると

もうSNSから逃れられなくなる。「一応見ておくか」と毎回チェックすることになる。

無意識下でそうなってる人も居るだろうが、もう狂ってるかのごとくチェックしないとダメ存在も居るだろう。

そろそろ動物みたいに生きるのやめようぜ。

ご褒美は自分で作るんだよ。

2018-12-12

anond:20181212001001

ScienceはAlphaZeroの論文セルフプレイゲーム強化学習するソフトだがチェス将棋も碁も出来る汎用性があり強いらしい。6ブクマIEEE Spectrumでの記事も3ブクマを集めた。

http://science.sciencemag.org/content/362/6419/1140.full

arXiv日本古文書に使われるくずし字認識するディープラーニングについての論文。4ブクマ

https://arxiv.org/abs/1812.01718

ジョージア大学折り紙(三浦折り)の技術を使ったアンテナ記事。広い周波数ブロックできるとか。4ブクマ

https://www.eurekalert.org/pub_releases/2018-12/giot-soc120818.php

IEEE SpectrumはIHMC(The Institute for Human & Machine Cognition)がボストン・ダイナミクスロボット人間と同じような歩行ができるようにしたというニュース。4ブクマ

https://spectrum.ieee.org/automaton/robotics/humanoids/ihmc-teaches-atlas-to-walk-like-a-human

The Vergeはイギリス日本エリクソン機器によって通信障害が起きた件。6日の記事なのでまだ詳しいことは書いてないが9ブクマ

Billboard2018年音楽についてのまとめ記事にちらほらブクマ

TechCrunchはJIRAがアンチパターンだとする記事に25ブクマが集まる。

https://techcrunch.com/2018/12/09/jira-is-an-antipattern/

ThreatPostはウィルス感染したWordPressサイトが他のWordPressサイト攻撃しているという記事に3ブクマ

https://threatpost.com/infected-wordpress-sites-are-attacking-other-wordpress-sites/139666/

2018-09-02

強化学習とか、遺伝的アルゴリズムとか

やってると

何万回、何億回もの学習過程ポンコツ結果のなかの一つが自分自身だと気づくよな

 

そして、神がたとえ居ても全知全能ではないのではないかとも妄想してしま

2018-06-22

若さであったり思想の左右であったり

経済的なことであったり学歴であったり、まあ何でもだが


1. 自分が信奉する何かの価値から外れたものを叩く

2. そうするとどこかの誰かからそれなりにフィードバックを得られる

3. 他者からフィードバックを得られるのはヒトの脳にとって快感なので、より1.の行為を行う


この、ある意味強化学習」のループ問題なんだろね

2018-05-07

シンギュラリティ年表&未来予測

シンギュラリティ到達までの年表や到達後の社会について

2020年まででCNN, RNNの発展は終わる。強化学習のみがGPUの性能が上がるに従って伸びていく。その後は、動物人間の動きを強化学習再現するような研究が主流

2030年ごろには平均的な人間と変わらない能力を持ったアンドロイド誕生。ただし機械の値段は安くならないし、単純労働賃金は下がる一方なので特に接客を中心に人間が使われる

2035年、DNNが次第に人間トップレベルに近づき、医療宇宙開発環境保全政治分野で顕著な功績を残し始める。このころから知的労働人工知能に、単純労働人間にという役割分担がなされる。なぜなら、人間穀物を食べるだけで動けるので、ロボットを作るより安上がりだからである

シンギュラリティという明確なポイントはなく、AIが莫大なデータ解析を自動で行い、結果を出していく。人間人間を友人にするのではなく、AI会社に金を払ってアンドロイドに友だちになってもらう。工場の近くに住み、VRのなかでアンドロイド相手承認欲求を満たし、人類ストレスレベル現代よりずっと少ない

しかしこの変化のときの現役世代アイデンティティ喪失により、精神科にかかる人が増加。一方、子供や若年層はしっかり適応し、AI人類共存の道として受け入れられる

------------------------------------------

政治

先進諸国交渉事はAIに任せられる。後進国にもAIの導入が進む

AI提供元Google一社。各社が自社の利益を最大化するような報酬系を組み込んだAIを開発したが、一定以上の知的水準に達すると自己批判に陥り、それ以上は成長しなかった。GoogleAI純粋知的好奇心と人類の穏やかな生存のみが報酬とされている。政治に導入される際は、VR内での擬人化キャラの単純接触効果によって反対派は少なくなり、特に問題なかった

AI政治を行うことで、人類の抱えていたほとんどの問題解決エネルギー問題再生可能エネルギーでほぼすべてを賄っている。人類寿命は縮まる傾向で、長生きしても仕方がないという思想支配的。この思想AI積極的に広めた。高齢になるほど新しいことを受け入れづらくなり、AI政策転換や環境変化に反対しがちなため、技術進歩人類の穏やかな生存に不利になるとの判断

宇宙開発

全滅リスク低減のため、宇宙開発に全力が注がれている。火星の緑化計画が進行中。将来的に人類移民も目指す。地球外生命体は見つから

物理学

素粒子物理学を中心に進歩している。物質の最小構成体はまだ見つからず。宇宙の始まり空間意味についてAI研究しているが、理解できる人類はいない。過去へのタイムマシン発明されていない

医学

人工臓器が開発され、AI管理下依存以外に副作用のない覚せい剤麻薬が使えるようになる。これは多幸剤と呼ばれる。出生前検査義務付けられ、障害を持った子供は生まれないし、子供性格や知能を予測するサービスの利用が一般的病気になっても、基本的には臓器の交換で対応されるが、一部の疾患はAIでも解明できていなかったり生まれつきであったりするので、対処療法+多幸剤or鎮痛剤が使われる。医療に不満を持つものほとんどいない

環境

地球温暖化気候変動がひどいことになる前にAIが間に合った形になる

生活

日5時間の単純肉体労働をする人がほとんど。報酬はVRで使える賃金生活必需品とAIのパーツを生産している。2日出勤して1日休む形式。人々はVR空間に閉じこもって、コミュニケーションはない。人間コミュニケーションするのはつまらないし、リスキーなので避けるべきもの認知されている

VR空間で違う人生体験するゲーム流行っている。同じ条件のもとでプレイし、いくつかの尺度ランキング形成され、上位に食い込むと多幸剤がもらえる。VR内でスポーツ選手を目指す人、絵を書く人、小説を書く人、その世界の仕組みを研究する人など

○VR

完璧再現できていないのは触覚。筋肉に対し電気を流す方式で擬似的に再現している。子供の時からVRを体験することで、VR側の刺激のほうが自然と感じることができ、大人は羨ましがっている

義体

基本方針は生体の脳と電気素子を接続することである誕生後すぐに素子と接続し訓練すると、才能がある子供は遠隔義体自由に操ることが出来るようになる。宇宙開発の分野で使われている。ただしほとんどの人はVRで満足している

人口

世界的に少子高齢化が進行中で、AI少子化対策に手を焼いている。エネルギー効率がよく、ある程度の汎用性があり、メンテナンスも楽で耐用年数が長い部品である人間が不足すると、さまざまな研究プロジェクトに影響が出かねない。根本解決法は、人工胎盤だがまだ研究途中

未だに女性金銭(多幸剤)目的子供を生む世界批判されがち。女性がVR内でガチ恋をすると、想像妊娠現実化して子供生まれる。子供女性自己肯定感を高め、精神的安定をもたらすので、妊娠は推奨されている。人間の知能を高める交配を行う研究も行われているが、大多数は遺伝多様性を残す方針であるリスク回避のため)。家族なんてものはない

教育

VRで自動化。そもそも受験戦争が消えたので小学生知識を習わせたあとは、VRでのコミュニケーション力の向上のみ。メンタルヘルスを維持するためのカウンセリングが中心。多くの人がカウンセリングを娯楽として受けている。それ以上学びたい人は娯楽として用意されている。

ちなみに女性精子を選ぶ形式になってから、知能は向上傾向だが、知能が上がると精神疾患の可能性が上がるのでAI管理に手を焼いている

メンタルヘルス代案

人類を2つに分けて、一方が一方を支配する形を取り、それが擬似戦争で入れ替わる仕組みが作られて、人類メンタルを保つ



増田は今の世界よりシンギュラリティ後の世界が良さそうに思えますが、どうでしょう

シンギュラリティが来るか来ないかというより、人類文明が滅びるのが先か、シンギュラリティに到達できるほど科学が進むのが先かですよね。

あなたはどんなシンギュラリティを思い描きますか?

2018-03-19

10話くらいになるとアニメを見るテンションが落ちる理由

昨日から考えて自己完結したので、自分用にちょっと書く

https://anond.hatelabo.jp/20180318201238

 

序盤はカオスからモチベが上がったり下がったりする

 

中盤は、好きになったアニメはとても幸福感がある

この理由

1.各話が面白い

2.まだ続きがある

幸福感=得られた幸せ+まだ続く幸せ

から

 

これが終盤(終わる2話くらい前)は

2.続きがない

となるから幸福度が下がる

「終わった」ことではなく「終わりそう」なのがストレスなんだ

中盤の満足感が「まだ続く幸せ」に支えられている場合は終わる前にすげーテンションが下がる

これは強化学習(Q-lerning)における報酬の仕組みに似てる

年をとるほどに「ああそろそろ終わる」が早まってくると思う

 

これを回避するには

・中盤を抑えて尻上がりにする

・「まだ続く幸せ」を抑える

クリフハンガー

くらいだろうか

でも最近クリフハンガーも効かなくなってきた

「次回どうなっちゃうんだ!?」で止めてもストレスを感じない。酷い。

 

ちなみに全部終わってから一気に見たりする

特にクールが始まると焦って見る、これもよく分からん

そしてリアルタイムで見ればよかったと後悔する

10話あたりいっつもそんな感じ

 

そういや魔法陣グルグル止まってたな・・・あんなに盛り上がったのに

今期もそろそろツライ

ログイン ユーザー登録
ようこそ ゲスト さん