はてなキーワード: 強化学習とは
例えばAIに90年代までのエロゲの絵柄を全て学習させても、2000年代以降の新しい画風は生み出せないわけだろ?
だから新しいタッチを生み出してくれる人間絵師の権利はちゃんと保護しなきゃマズいと思う
さもなきゃ、いつまで経っても同じ絵柄のハンコ絵しか見れなくなるぞ
----------------------------------------------
追記: 権利って具体的に何?ってブコメがあったけど、例えば神絵師が苦労して新しい画風を生み出したとしても、やんちゃな海外AIにすぐ模倣されて、誰でも自由に生成できるようにされたら商売上がったりだよね。
そうならないように、やはり学習や使用を勝手にされない権利を強く主張していかないとマズそう、という話。
追記2: 「既存の画風を混ぜることで既にAIは新しい画風を生み出せるよ」って意見もあった。それは確かにと思った一方で、90年代までのイラストのミックスだけで本当に岸田メルが作れるのかな?とは思った
追記3: 「人間だって模倣するけど絵師は食えてるじゃん」について。大多数の人は模倣どころかまず絵が描けない。模倣できる人でも時間と労力がかかる。誰でもスマホでポンと模倣できる時代になったら、絵師が食えなくなるのは間違いないかと。
追記4: 「将棋AIみたいに、いずれは新しいものを生み出せるようになるだろ」について。絵の場合、将棋AIのような強化学習はできないから一概にそうとは言えないと思う。ただ何らかの新手法で生み出せるようになる可能性は否定しない。そうなったら絵師の時代は完全にオワオワリで、手芸や算盤のような趣味と同じ扱いになる。
追記5: 「絵師の権益を守るために技術発展を妨げるのか?」について。絵師の権利ではなく、絵を「使う」側のメリットの話だよ。Pixivが既視感のある絵ばかりで氾濫したら嫌だろって話。
追記6:「AIを活用した絵師が新しい画風を作っていく」について。そのAIと共作した新しい画風すらすぐAIによってパクられてしまうわけや。すぐパクられるとわかってて、新しい画風を生み出そうと思える絵師は多くないと思うで。
強化学習を使用してマリオをクリアするという動画が上がっていた。
前にも似たような動画を見たなあと思ったら、同じ作者で前の動画を探して投稿日を見たら9年前だった。
9年・・・
前の動画を見た時、「面白そう。自分も何か作れたらなあ。」と思ったものの、
休みのたびに「今は仕事が忙しい」「今は体調が悪い」「久ぶりに図書館へ行こう」などなど理由を付けて何もしてこなかった。
それが9年続いた。
きっとこの先もそうなのだろう。
何かはしたい、でもそのための努力はしたくない。
心のどこかでそう思っているのだ。
そして今際の際に「もっと~すればよかった」と後悔して死んでいくんだろう。
誰が指示するの?GANとかあるけど、最終的には人やで?
え、人が指示した結果、相手がどう動くかという話をしているんだよ。
生産コストが下がる(から、あるタイミングで人よりもコスト高であっても、何年か待っていればその頃の製品は人を雇うより安くなるでしょ)って話をしているんであって、販売した個別の製品に追加コストがかかるかって話はしてないよ。
フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿の言い訳にしか聞こえないがね。
現時点でも将棋とか特定の用途に用いる人工知能は学習を繰り返してプロより強くなってしまうわけで、汎用人工知能となると、多様な用途それぞれについて学習を繰り返して日々賢くなっていくのだろう。でもそこまで行くと便利になる反面、もしも、使役する側であるはずの人よりも人工知能のほうが賢くなったうえに人による制御ができなくなるケースなどが起きたらやばいかも…という想像なのだが、なにか話がかみ合っていないような?
一部の界隈の話なので説明しておくと、合成音声界隈は合成エンジンが更新されようとしている。
例えば、今日予約開始されたA.I.Voiceというソフト(https://aivoice.thebase.in/)なのだが、
エンジンは機械学習を使って新しくなろうとしているのだが、UIが過去数年前とそのままなのだ。
技術的にはTTS(Text to Speech)という分野であり、GoogleやAmazonもAppleもやっている。
合成音声マークアップ言語というのもあるが、こちらは何年も更新されていない。
ブレイクスルーが必要としているのは、演技をしたような声を出す場合だ。
音声界隈の論文では、喜び、怒り、悲しみの3種類を分類するのが伝統的になっているが、これが数値化できてない。
日本では「萌え声」というのもあるが、こちらも数値化できていない。
現状のUIは音素ごとに音の高さと長さを調整しているが、日常的に発音していても意識していないので、違和感があっても調整できない。
変な記事を書いてあるのはわかっている。これは人工知能を否定する文章じゃ無いんだ。上から下まで読んだら、とある人物に搾取された人が共感してくれる目的で書いたのだ。あの人にやられたら、確実に機械学習のことを嫌いになるようになるので、そうなった人が共感して「同じ思いをした人がいるのだな」と思えるように書いたつもりなんです。もちろん、教師あり学習・教師なし学習・強化学習があって、こんなアルゴリズム使っているのか、ぐらいし知りませんよ。ですが、自分は人工知能には手に余るので、昔も今後もしないと思いますが、人工知能が来るというのは確信しています。お気持ちを害したのは謝ります。申しわけありません。
そうそう。そういうこと。君はそう思わないんだね、了解した。で、それは間違っていると思うよ、と最初から申し上げているつもり。
強化学習で言えば、環境から返ってきたフィードバックを報酬として自己のモデルを修正する、ということを繰り返せば、解はある範囲に収束する。
環境は複雑だけど、この程度なら人間の認知力で十分対応できる問題。
じゃあなぜ解釈が乖離するのか。それは現代の若者が学習を怠っているから、という認識。
以上、分かり合えないとは思うけど、しつこくガミガミいってごめんね。
飯島範士の早気の解説、バックデータとかは凄いけど、結局解決策は無いということだよね。
あと、熟練者がなる、中る人がなる、とか書いてるけど、そればかりではないのはうちの道場にいる初心の人の例もあるので、そうとも言えないのかなという感想。
付き離れする三段くらいの人を知ってるけど、その人は年寄りで根がせっかちな人なので、性格的なものが一番大きいのと、やはり中りによる強化学習の効果だなと個人的には分析している。
とはいえ、付き離れなんで半分も中らないから、中る人がなるというのも合っていないかもしれない。強化学習の考え方、ドーパミンによる報酬予測の考え方では、報酬が50%でも効果があるとされてるけど、その人の中りは30%に満たないと思うので、一時的な50%の報酬が効いちゃったのかもしれない。効いちゃったのはその人のあまりにポジティブな性格のせいかも。
それは兎も角、唐沢光太郎範士の「八秒で二度の的付け」を早気対策であげてきたのははっきり言ってがっかり。弓道読本ちゃんと読んでないんじゃないの?(まぁ、そんなに熟読するほどの本じゃないとは思うけども。)
唐沢光太郎範士は本文中で、「八秒で二度の的付け」をやってたけど、それを修正しろと言われたから早気になったというようなことを言っている。唐沢範士が早気対策として挙げているのは呼吸法であって、それではない。ちなみに、飯島範士は「八秒で二度の的付け」を小手先の技的な評価をしているけど、それは正しいと思う。ただ、飯島範士ほどの人であれば、そもそも「八秒で二度の的付け」なんて引用しないで、するんであれば、「八秒で二度の的付け」は二目づかいであると批判するくらいの見識が欲しいものだ。
まぁ、飯島範士は人格的にも優れている方なので、他の範士の批判なんてされないだろうから、『唐沢範士は弓道読本の中で、目新しくないと前置きをしながら呼吸法の大切さを力説されていた』くらいに書けば間違ってなかったのにね。
ScienceはAlphaZeroの論文。セルフプレイでゲームを強化学習するソフトだがチェスも将棋も碁も出来る汎用性があり強いらしい。6ブクマ。IEEE Spectrumでの記事も3ブクマを集めた。
http://science.sciencemag.org/content/362/6419/1140.full
arXivは日本の古文書に使われるくずし字を認識するディープラーニングについての論文。4ブクマ
https://arxiv.org/abs/1812.01718
ジョージア大学の折り紙(三浦折り)の技術を使ったアンテナの記事。広い周波数をブロックできるとか。4ブクマ。
https://www.eurekalert.org/pub_releases/2018-12/giot-soc120818.php
IEEE SpectrumはIHMC(The Institute for Human & Machine Cognition)がボストン・ダイナミクスのロボットを人間と同じような歩行ができるようにしたというニュース。4ブクマ。
https://spectrum.ieee.org/automaton/robotics/humanoids/ihmc-teaches-atlas-to-walk-like-a-human
The Vergeはイギリスと日本でエリクソンの機器によって通信障害が起きた件。6日の記事なのでまだ詳しいことは書いてないが9ブクマ。
Billboardは2018年の音楽についてのまとめ記事にちらほらブクマ。
TechCrunchはJIRAがアンチパターンだとする記事に25ブクマが集まる。
https://techcrunch.com/2018/12/09/jira-is-an-antipattern/
ThreatPostはウィルス感染したWordPressサイトが他のWordPressサイトを攻撃しているという記事に3ブクマ。
https://threatpost.com/infected-wordpress-sites-are-attacking-other-wordpress-sites/139666/
2020年まででCNN, RNNの発展は終わる。強化学習のみがGPUの性能が上がるに従って伸びていく。その後は、動物や人間の動きを強化学習で再現するような研究が主流
2030年ごろには平均的な人間と変わらない能力を持ったアンドロイドが誕生。ただし機械の値段は安くならないし、単純労働の賃金は下がる一方なので特に接客を中心に人間が使われる
2035年、DNNが次第に人間のトップレベルに近づき、医療、宇宙開発、環境保全、政治分野で顕著な功績を残し始める。このころから知的労働は人工知能に、単純労働は人間にという役割分担がなされる。なぜなら、人間は穀物を食べるだけで動けるので、ロボットを作るより安上がりだからである
シンギュラリティという明確なポイントはなく、AIが莫大なデータ解析を自動で行い、結果を出していく。人間は人間を友人にするのではなく、AI会社に金を払ってアンドロイドに友だちになってもらう。工場の近くに住み、VRのなかでアンドロイド相手に承認欲求を満たし、人類のストレスレベルは現代よりずっと少ない
しかしこの変化のときの現役世代はアイデンティティの喪失により、精神科にかかる人が増加。一方、子供や若年層はしっかり適応し、AIと人類の共存の道として受け入れられる
------------------------------------------
○政治
先進諸国の交渉事はAIに任せられる。後進国にもAIの導入が進む
AIの提供元はGoogle一社。各社が自社の利益を最大化するような報酬系を組み込んだAIを開発したが、一定以上の知的水準に達すると自己批判に陥り、それ以上は成長しなかった。GoogleのAIは純粋な知的好奇心と人類の穏やかな生存のみが報酬とされている。政治に導入される際は、VR内での擬人化キャラの単純接触効果によって反対派は少なくなり、特に問題なかった
AIが政治を行うことで、人類の抱えていたほとんどの問題は解決。エネルギー問題は再生可能エネルギーでほぼすべてを賄っている。人類の寿命は縮まる傾向で、長生きしても仕方がないという思想が支配的。この思想はAIが積極的に広めた。高齢になるほど新しいことを受け入れづらくなり、AIの政策転換や環境変化に反対しがちなため、技術の進歩と人類の穏やかな生存に不利になるとの判断
○宇宙開発
全滅リスク低減のため、宇宙開発に全力が注がれている。火星の緑化計画が進行中。将来的に人類の移民も目指す。地球外生命体は見つからず
○物理学
素粒子物理学を中心に進歩している。物質の最小構成体はまだ見つからず。宇宙の始まりや空間の意味についてAIが研究しているが、理解できる人類はいない。過去へのタイムマシンは発明されていない
○医学
人工臓器が開発され、AIの管理下で依存以外に副作用のない覚せい剤・麻薬が使えるようになる。これは多幸剤と呼ばれる。出生前検査が義務付けられ、障害を持った子供は生まれないし、子供の性格や知能を予測するサービスの利用が一般的。病気になっても、基本的には臓器の交換で対応されるが、一部の疾患はAIでも解明できていなかったり生まれつきであったりするので、対処療法+多幸剤or鎮痛剤が使われる。医療に不満を持つものはほとんどいない
○環境
地球温暖化・気候変動がひどいことになる前にAIが間に合った形になる
○生活
一日5時間の単純肉体労働をする人がほとんど。報酬はVRで使える賃金。生活必需品とAIのパーツを生産している。2日出勤して1日休む形式。人々はVR空間に閉じこもって、コミュニケーションはない。人間とコミュニケーションするのはつまらないし、リスキーなので避けるべきものと認知されている
VR空間で違う人生を体験するゲームが流行っている。同じ条件のもとでプレイし、いくつかの尺度でランキングが形成され、上位に食い込むと多幸剤がもらえる。VR内でスポーツ選手を目指す人、絵を書く人、小説を書く人、その世界の仕組みを研究する人など
○VR
完璧に再現できていないのは触覚。筋肉に対し電気を流す方式で擬似的に再現している。子供の時からVRを体験することで、VR側の刺激のほうが自然と感じることができ、大人は羨ましがっている
○義体
基本方針は生体の脳と電気素子を接続することである。誕生後すぐに素子と接続し訓練すると、才能がある子供は遠隔義体を自由に操ることが出来るようになる。宇宙開発の分野で使われている。ただしほとんどの人はVRで満足している
○人口
世界的に少子高齢化が進行中で、AIは少子化対策に手を焼いている。エネルギー効率がよく、ある程度の汎用性があり、メンテナンスも楽で耐用年数が長い部品である人間が不足すると、さまざまな研究プロジェクトに影響が出かねない。根本解決法は、人工胎盤だがまだ研究途中
未だに女性が金銭(多幸剤)目的で子供を生む世界は批判されがち。女性がVR内でガチ恋をすると、想像妊娠が現実化して子供が生まれる。子供は女性の自己肯定感を高め、精神的安定をもたらすので、妊娠は推奨されている。人間の知能を高める交配を行う研究も行われているが、大多数は遺伝的多様性を残す方針である(リスク回避のため)。家族なんてものはない
○教育
VRで自動化。そもそも受験戦争が消えたので小学生の知識を習わせたあとは、VRでのコミュニケーション力の向上のみ。メンタルヘルスを維持するためのカウンセリングが中心。多くの人がカウンセリングを娯楽として受けている。それ以上学びたい人は娯楽として用意されている。
ちなみに女性が精子を選ぶ形式になってから、知能は向上傾向だが、知能が上がると精神疾患の可能性が上がるのでAIは管理に手を焼いている
○メンタルヘルス代案
人類を2つに分けて、一方が一方を支配する形を取り、それが擬似戦争で入れ替わる仕組みが作られて、人類のメンタルを保つ
増田は今の世界よりシンギュラリティ後の世界が良さそうに思えますが、どうでしょう?
シンギュラリティが来るか来ないかというより、人類文明が滅びるのが先か、シンギュラリティに到達できるほど科学が進むのが先かですよね。
https://anond.hatelabo.jp/20180318201238
この理由は
1.各話が面白い
2.まだ続きがある
で
だからだ
これが終盤(終わる2話くらい前)は
2.続きがない
「終わった」ことではなく「終わりそう」なのがストレスなんだ
中盤の満足感が「まだ続く幸せ」に支えられている場合は終わる前にすげーテンションが下がる
これは強化学習(Q-lerning)における報酬の仕組みに似てる
年をとるほどに「ああそろそろ終わる」が早まってくると思う
これを回避するには
・中盤を抑えて尻上がりにする
・「まだ続く幸せ」を抑える
くらいだろうか
「次回どうなっちゃうんだ!?」で止めてもストレスを感じない。酷い。
ちなみに全部終わってから一気に見たりする
そしてリアルタイムで見ればよかったと後悔する
10話あたりいっつもそんな感じ
そういや魔法陣グルグル止まってたな・・・あんなに盛り上がったのに
今期もそろそろツライ