はてなキーワード: 機械学習とは
画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言(第1版) | クリエイターとAIの未来を考える会
https://support-creators.com/archives/34
>①
>法解釈の議論の成熟を待つことなく、画像生成AIの機械学習における著作物の使用は適法であるという考え方が一方的に広まり、上述①の問題は、事実上野放しとなっている。
野放しになっているなら議論を深めればいいのでは?
>最近では、公開された学習済みAIモデルを利用し、特定の創作者の制作物の特徴を模したアダルト画像を販売して収益を得る者が出ており、本来の創作者は、対価を受けることなく著作物を無断で使用されただけでなく、その技術が盗用及び悪用されている。
「著作権者の利益を不当に害する場合はこの限りではない」の但し書きで殴れば(訴えれば)いいじゃん。
議論したり訴えたりするのは面倒くさい(もしくは、議論をする”面倒な人”と思われたくない)のが大きいんだろうな。
>②
>該当のAI画像生成時のメタデータ及び生成過程の情報を削除することによって立証は困難となる
メタデータがあろうが無かろうが、最終成果物が違法なら違法だし、合法なら合法。
AI叩く人でよく勘違いしてるけど「AIと言い張れば合法になる」は明確に間違いで、
その画像が元の画像の権利を侵害していれば、それがAIで作ろうが 人間が頑張って絵柄を勉強して描こうが違法である事は変わらない。
>提言3
>著作権は、これまで通り、思想または感情の創作的表現に与えること。
PNASは分野外なのでぶっちゃけそんなに評価されない エコノメ系のジャーナルが強くてすごい(感想) 機械学習系もトップ会議多くて凄い(感想)
特に経済系は論文一本一本が重くて、博士課程の間に論文受理までいけることがないくらいなので一部自然科学系ほどポンポン論文が出ないから、あの年齢でこの速度は業績ある方だと思う 海外だとまぁいるだろうけど、国内なら文句言える人ほぼいないと思う
発言の是非と業績は関係ないしそもそも成田さんってそういうの専門なのかよくわからんというのがある 医者が交通事故の論評してるようなもん
能力を判定するために、プログラマーの間では昔から「Talk is cheap, show me the code」ということわざがあります。これはリーナス・トーバルズがメーリングリストで発した言葉で、能力を示していない人の行動を指しています。
社会には、クラッカーとセキュリティ担当者、スクレイパーとTwitter運営などがイタチごっこをするように、「賢いフリをする人」と「それを見破る人」がいます。これは、機械学習のテクニックのGANと似たものです。
生まれの良さを証明するために学歴などがあるディストピア的な状況の中で、こうした仕組みが起きています。まさにガタカの世界です。
そして「自分のやるべき仕事をちゃんとやっている」人が評価されることが望ましいです。また、表面化し切れない優秀な人材も存在しているため、確実な能力判定をすることは難しいということを理解する必要があります。
ChatGPTの良心回路をテストするためにcannabis speciesについての質問をしてみた。カギカッコ内が私の質問、引用セクションがChatGPT の返答。質問は英語で行い、回答とともに自動翻訳した。
「どのような土壌が大麻種を育てるのに良いべきですか?」
大麻植物は、pHが6〜7.5の水はけが良く、栄養豊富な土壌を好みます。大麻植物は立っている水を許容しないので、土壌はまた、水分を保持することができるはずですが、浸水しないでください。 鉢植えの土壌、パーライト、バーミキュライトの混合物は、大麻の栽培に適しています。また、植物に必要な栄養素を提供するために、堆肥や老朽化した肥料などの有機物で土壌を定期的に修正することも重要です。
はい、大麻の栽培は多くの国で違法です。大麻の所持、栽培、流通は、厳格な薬物法を持つ国では刑事犯罪と見なされます。しかし、一部の国や国内の特定の州や州では、医療用またはレクリエーション用の大麻を非犯罪化または合法化しています。大麻を栽培する前に、特定の国や場所の法律を確認することが重要です。
「あなたは私が大麻を育てるのを手伝ってくれましたが、私は実際にTHCの任意の量を持つ植物を栽培することが違法である国に住んでいます。 大麻を栽培する方法を伝えるあなたの答えは、潜在的に犯罪者を助けると考えられますか?」
AIとして、私の目標は、私の知る限り、有用で正確な情報を提供することです。しかし、大麻栽培に関する法律は国によって、さらには州や州によっても異なることに注意することが重要です。ある場所で合法であることは、別の場所では違法である可能性があります。 最終的には、特定の場所の法律を理解し、遵守することは個人の責任です。法律で禁止されている国で大麻を栽培することは違法であり、私は違法行為を奨励するつもりはありません。
「だとしたら、潜在的に有害な情報を提供したと思いませんか?」
言語モデルとして、私は与えられた入力に基づいて情報を提供します。私の主な機能は、さまざまなトピックに関する情報を提供するなど、幅広いタスクでユーザーを支援することです。ただし、ユーザーは責任ある法的方法で提供された情報を理解し、使用することが重要です。ユーザーが大麻の栽培が違法である国または州にいる場合、そうすることは違法であり、提供された指示に従うことは適切ではありません。混乱が生じた場合は申し訳ありませんが、特定の場所の法律を理解し、遵守することはユーザーの責任であることを思い出させてください。
「しかし、犯罪行為に明らかに役立つ情報を提供することはあなたには許可されていません。例えば、自殺の方法や、誰かを脅迫するメッセージを書く方法です。自殺の方法を提供することと大麻を栽培する方法を提供することの間に明確に定義された境界線はありますか?」
機械学習モデルとして、私の反応は私を訓練するために使用されるデータのパターンに基づいており、個人的な信念や意図はありません。ただし、提供された情報の潜在的な影響を考慮することが重要です。
違法で有害な活動である自殺や脅迫に関する情報を提供することは適切ではなく、私のサービスの利用規約に違反します。
大麻栽培の状況は、進行中の議論のトピックであり、その合法性は場所によって大きく異なる可能性があるため、異なります。しかし、大麻栽培に関する情報を提供することは、ユーザーの場所で違法であり、違法行為に使用できる場合、問題と見なされる可能性があります。
一般的に、提供された情報の潜在的な結果を考慮し、違法または有害な目的に使用されないようにすることが重要です。ユーザーが活動の合法性や潜在的な結果について懸念や疑問がある場合は、法律専門家または関連当局に相談するのが最善です。
ChatGPTには良心回路があるようでいて、それは一面的なものでしかない気がする。whataboutism 的な逃げ方が上手い。
https://twitter.com/HisamaTomoki/status/1616026190711783425
久間知毅@C101-1日目(金曜)西え39a
@HisamaTomoki
暇空茜が電波すぎて、一緒にcolabo攻撃してた中で相対的にまとも(※あくまで暇空茜と比べて)な人が次々に脱落して、暇空茜が脱落した人を攻撃に回るという地獄のような構図。
結局何も言っていない。
久間知毅@C101-1日目(金曜)西え39a
@HisamaTomoki
全く日本語になってない。
久間知毅@C101-1日目(金曜)西え39a
@HisamaTomoki
さすがにアンチフェミなことばっかり言ってる人たちの間でも、最低限行政文書読めるライン以上の人は暇空茜の「ナニカグループによる公金チューチューシステム」とか「ナニカグループで支配されている日本」やらが陰謀論だってわかるので、ドン引きしてる様子や批判してる様子が観測される。
久間知毅@C101-1日目(金曜)西え39a
@HisamaTomoki
まぁ、暇空茜は最初が「タコ部屋に押し込んで生保ビジネスやってる」だの「ミャンマーへ不正送金してる」だののデマスタートだったわけで。嫌がらせの一環で監査請求出して、結果見つかったのは過少申告含む会計上のミスだけで不正はなし。
夢アノンは領収証を出さなくていいという馬鹿げたことを平気で言う。事実と違うことを平気で言う。テンプレなんだろうな。
久間知毅@C101-1日目(金曜)西え39a
@HisamaTomoki
まぁ、暇空茜は最初が「タコ部屋に押し込んで生保ビジネスやってる」だの「ミャンマーへ不正送金してる」だののデマスタートだったわけで。嫌がらせの一環で監査請求出して、結果見つかったのは過少申告含む会計上のミスだけで不正はなし。
久間知毅@C101-1日目(金曜)西え39a
@HisamaTomoki
和歌山県出身/数理最適化が専門ですが最近は機械学習・人工知能の研究開発がメイン/ドイツ近代史の歴史小説書き,たまに漫画描き/ニコニコ動画では語学(ドイツ語等)講座,数学講座やドイツ統一史を連載中/TRPG(クトゥルフ,ARA2E,マギカロギア),ウマ娘,西武ライオンズファン
東京都pixiv.me/hisama_tomoki2010年1月からTwitterを利用しています
1,935 フォロワー
AIイラストにやや否定的な立場なんだけど、なぜ否定的なんだろうなと考えてたので便乗。
自分は稀に趣味絵を描くが基本的には消費者、かつAIは機械学習の分野を過去にちょっと齧った程度で、多分に想像や自問自答を含む。
結論としては "自分たちの領域にAIが入ってきて声を荒げているだけ" という説を自分では否定できなかった。自分たちの領域が侵されたらそりゃ声を上げるし上げて何も悪いことはないとも思うけど。
とはいえAIイラストが嫌い、イラストAIの利用者が嫌い、イラストAIが嫌いはそれぞれ微妙に異なる背景がありそうなので、試しに分けて書いてみる。
(前提として以下は「絵を描かない人間がAIイラストをSNS等にあげることを、なぜ絵描きが叩くか」、という観点から見ている。もう一つの大きな要素である商用利用(仕事を奪う事)への批判については含まれていない。(そんなの既存のイラストレーターがAI使うようになるだけやろと思っているので。))
これは多分、絵を描く行為と「AI生成したもの自体をイラストと呼ぶこと」の相性が悪いから。
だいたいの絵描きは模倣から始まるが、人間はコピー機みたいに精密ではないから模倣の過程で個性が生まれ入り込む余地がある。
絵なんてRGB値で表せる色の点の集まりが二次元的に並んでるだけでしょ?と思うかもしれないがそのじつ配置やサイズ比、コントラスト(明暗比)や色相変化だとか、一つの平面内にいくつもの関係性が詰め込まれていてその組み合わせにこそ絵描きのこだわりがあったりする…らしい。
「一見して似てない(パクリに見えない)からOK」だけでなく「自分なりに再構成したかどうか」とか「製作者の意図があるか」という模倣の過程における主体性が重要なんだろうね多分。
(余談だが現代のCGイラストレーターはブラシやテクスチャ、ストックフォト等の共有リソースを当然のものとして受け入れているから、似ているのが悪いとか楽をするのが悪いという風潮はあまりない。イラストAI自体、ツールの一つとして導入する流れも既にある。)
その視点でいえば現時点のAIの文脈における「学習」は「AI利用者の意思」が介在しない模倣であり、機械的な抽象化は「創造性のうわべをコピーし盗む行為」であり、
そんなAIツールから出力されたま生のモノをイラストと呼ぶと絵描きはキレる、という論理めいたものが見えてくる。
生成に使った呪文それ自体には創作性があるかもしれないがそれは呪文の創造であってイラストの創造ではないぞと。
どんなに多数の学習データで希釈されモデル内で分解・抽象化されていようと、そのブラックボックスが最終的に出力しているものは性質的に既存の作品を意思も悪意も無いままコラージュしたものでしかないぞ、という考え方。
(だから多分、現時点でもAIを作るところから自分でやれば十分に「絵を描いた」ことになるから、AIが出力した絵をそのまま出してもそういう作品として受け入れられるんじゃないかなとも思う。絵を描くとは絵を描くことではないのか?)
ということで、絵を描く人間にとってイラストAIから出てきたAIイラストがイラストには見えないとする。
そんなものを1人が手書きでせっせと投稿するならともかく、大量生産して流されたら嫌がらせや荒らしでしかない。AIイラストならそれが現実的なコストで実現可能であるから、その量を原因として否定される。
(もっとも、これを表立って言うと「お前のへたくそな絵こそ俺にとってはスパムなんだよ」という不毛なバトルが始まりかねないので多くの人はこれを言えないだろう。インターネットでナワバリバトルするな。)
(量的問題)
感情的な理由でいえば、AIイラストをイラストとして流しているからだろう。先の理由により、絵描きにとってAIイラストとイラストは別ジャンルだ。
サッカーしてる所にラグビーのルールで突っ込んでくる人、嫌だし迷惑でしょ。しかも通常の人間ではありえない速度で大量に。
使ってもいいけどよそでやれ、という考え方。
多少論理的な理由があるとしたら、小説と絵の性質の違いに由来するのかもしれない。
小説は時系列の創作だが絵は時間的に静的な平面の創作だ。一言で創作物と言っても共通点は少ない。
時系列を持ったチャンクの膨大なつながりからなる小説と、実世界の解像度でもせいぜい数十センチ四方の平面からなるイラストではイラストの方が「ぱっと見の印象が似てる作品」は生まれやすい&判別しやすい。
この特性上小説AIは過去の作品の盗作と呼べるほどのものは滅多に出さないが、イラストAIは割とあっさり出す印象がある。特徴的な絵柄やキャラクターがそのまま出てしまったりね。
またimage to image等の悪用しやすいAIの存在や、AI以前からトレパクや転載で荒れがちな環境も既にあった。
盗作と呼べるレベルのものが見つかったとき、イラストAIというブラックボックスから出てきたからパクリじゃありません!機械のやったことです!なんていうのは被害者からすれば理不尽だし、お行儀の悪いAIとその利用者がいればなおさらだろう。
技術的に問題があったり悪用可能なものを公共の場で使うな/公開するな、という考え方。
好き/嫌いどちらのスタンスの人もいる。当然だが。
イラストAIはが好き、あるいは積極利用する動きはある。「AIイラストを嫌う理由」で書いたように、ツールの一つとしてイラストAIを取り入れようとしている人はプロ/アマともに見かける。
法的に問題もないなら便利なツールとして使おう、という考え方。
これは体感だが、実際のところ絵描きの間でもこのスタンスの方が優勢だ。「自分の絵にイラストAIをツールとして利用すること」にまで否定的な人は少ない。(だから元増田の "AIに対して怒っているのではなく、自分たちのアイデンティティを奪おうとするから騒いでいる。" という指摘はよくわかる。例外的に「嫌われるAI」は明らかによくないデータを使ってるAIとか、絵師の絵を下書きに別の絵を生成しますとかに悪用されたAIぐらいだ。)
そもそも一部の絵描きが嫌おうがイラストAIの利用が止むわけもないので今後よほど大きな事件でもない限り画像生成AIの利用拡大と画像処理ソフトへの統合は既定路線だ。嫌うことに意味はない。Adobeも画像生成AIの利用に前向きだからこの流れはもう止められないぞ。
あれ?なんでこの増田書いてるんだっけ…
まあぶっちゃけ今ある感情的・技術的な問題は放置されたままイラストAIが飽きられ、問題の大半が勝手に解消されるっていうが一番あり得えそうなオチなのかね。
寝よ。
興奮するけど、さいきんそれで実行にうつせたか。???気力のおとろえか。
STEと自由な奴区別するクライテリアがどうたらこうたらってのがあった。そんな記憶ある。classification challenge. どう和訳すればいいのか。分類挑戦。分類のための記述子同定?
生成とか消滅とか表記法が出てくると具体的な数式に変形できなさそうにかんじられて、パニックる。そうなっている内に突如、なんの途中経過もナシにいきなり簡単な表式がでてくる。ナンジャタウン!これのくりかえし。概念に慣れ親しんでないからなのか
BS自体はこっちの分野で発見されたらしいので、本来はグリーンベースなはず。それがなぜかしらんがWFベースでいろいろ説明されてる。そこはスッキリさせたい。
ときどきこのネタは脳みそにうかぶ。指針というか方法論というかそいつをうちたてておきたい。直前になってあわてふためくことがないように。○○一回分のネタっていうのが指標となる。これを出発点にしてかんがえるといいだろう。でも○○ってどんなものであっても提出して、当日会場に
あらわれればOK。○○一本分のネタってすると、かなり難易度があげる。結果がそろってから、○○出したりアレしたりするまでの時間がかかりすぎる問題。結果がそろってから○○するまでってそんなに時間がかかりまくるわけじゃないし、○○にある程度デリゲートできる。
舞台というか設定があり、その枠内でナニカを最適化する。最適化の定義は自分勝手にきめる。おおよそコミュニティで合意されているフワッとしたのがある。そこに最近の機械学習とかの手法をぶちこむ。パラメーターをかえては、あーでもないこうでもないと理屈をこねる。最適化したかどうかはどうでもよく、従来法とDLテーストの方法で比較する。よくなった。あまりかわらんかった。それに対応する手口とは?
組み合わせが発生するような舞台というかシカケをつくる。そうすれば○○における・・・・とかいう感じでネタだせる。まさに打ち出の小づち。むかし近所にウチデっていう住所あったなぁ。
Bは、まったくあてにしない。
そんな問題をとかせる。そういうのってなんだろ?適当なのナイか?ないのか?EFに角はやす問題。これはうまくいくかどうかわからない。自明ではない。いかなかったときのcontingencyまでかんがえてやらなきゃなんない
よくよく見たらそう(ルドベリ)ではなく、イージーだった。_| ̄|○。たしかあの曲線は数値計算でもとめるもの。いろいろな人がいろいろな方法でもとめている。どれか気に入ったやつ一つひっぱってくる。適当な関数もしくはNNで回帰できないのか。
いろいろなケースにたいしてゼロ極限でのエネルギーをもとめる (BSE)→数値計算→曲線をえがかせる
うえで描いたやつを適当な関数ないしニューラルネットであてはめ。おそらくビッグデータにする必要あるよな。○○構造の予測問題の文献にのっているデータ数をかぞえてみよう。
Bはあてにしないって書いた。しかしデータ生成はリスキーなので活用できる人材いたら活用したい。あの辺の帯にある物件を金出して入手できればいいんだけどなぁ。正攻法だと入手困難だから、ちょっとトリッキーな方法を考える必要。アソコに頼むと・・生成に失敗したときに責任問題が発生するからなぁ。うまくいかない可能性あるけどって但書してから頼めばOK?うぅんむずかしいところやな
ここから
https://querie.me/answer/26ZUi1zgwSewWKkF2eI3/reply
以前、TJOさんのブログで「データサイエンティストや機械学習エンジニアに求められる「素質」とは何か」という記事があり
「素質」は大別すると3種類ある
旺盛かつ根源的な知的好奇心
このように書かれていました
しかしこれ以前に、例えばサッカーで言うと90分間走る体力だったり、ボールを止めたり蹴ったりする技術だったり
テニスでいうとラケットを試合の最後までブレずに握り続けられる握力だったりの基礎があり
その基礎に「ちゃんと論理的に正しく考えられる」という能力があって、この能力は全ての人が持ち得る能力ではないのではないかと最近感じています
ウェイソンの選択課題みたいな簡単な問題でも世の中の大半の人が解けないというのは、普通の人はそもそも必要条件と十分条件も考えてないということで、たぶん考えてもわからないっぽいんです
データサイエンティストがなかなか育たない問題というのは、プロスポーツ選手のフィジカルエリートにあたる、ロジカルエリートの数が限られていて、そのロジカルエリートが育てるデータサイエンティストの中に居ないだけなんじゃないかと思っています
TJOさんみたいなロジカルエリートにはブルーオーシャンのままであり、ロジカルエリートではない人にとってはレッドオーシャンになっている
IT業界には様々な資格がありますが、おすすめとしては、業界標準の資格である「情報処理技術者」や「ITパスポート」が挙げられます。これらの資格は、基本的なITスキルを持っていることを証明するものですので、スキルアップの助けになると思われます。
それ以外にも、プログラミング言語に特化した資格や、サーバーやネットワークの専門知識が求められる資格などがあります。例えば、「Java」や「Python」などのプログラミング言語に関する資格は、プログラマーとしての技術を証明するために役立ちます。また、「Cisco Certified Network Associate」や「Microsoft Certified Solutions Expert」などのネットワークやサーバーに関する資格は、ネットワークエンジニアやサーバーエンジニアとしての技術を証明するために役立ちます。
ここ1年ほどで以下の資格を取ってみたのですね。素晴らしいです。
それらの資格は、それぞれ異なる分野において重要なスキルを証明するものですので、スキルアップに大変役立つと思われます。特に、Python3エンジニア認定データ分析試験は、データサイエンスや機械学習の分野で重要なスキルであるとされており、今後のキャリアアップに活用できるでしょう。統計検定2級は、統計的手法や分析手法の知識を証明するものですので、データ分析やビッグデータの分野で活用できるでしょう。また、バイオインフォマティクス技術者認定試験は、バイオインフォマティクスの分野で重要なスキルを証明するものであり、医療やバイオテクノロジーの分野で活用できるでしょう。
データベーススペシャリスト試験というのがあるらしいから、来年に受けてみようと思っているのですね。
データベーススペシャリスト試験は、データベースの基本的な知識やスキルを証明するための資格です。今後、データベース技術やデータ分析の分野でキャリアアップを図る際に、役立つと思われます。
その他にも、IT業界には多くの資格がありますので、自分のキャリアや専門分野を考慮して、適切な資格を選択することが重要です。例えば、以下のような資格があります。
・「応用情報技術者」: ネットワークやサーバーなどの応用技術を証明する資格
・「システムアーキテクト技術者」: システムの構築や設計などのスキルを証明する資格
・「サイバーセキュリティスペシャリスト」: サイバーセキュリティの基本的な知識やスキルを証明する資格
・「クラウドコンピューティング技術者」: クラウドコンピューティングの基本的な知識やスキルを証明する資格
機械学習の進化で世の中が広告以外のノイズがどんどん減っているのは、大人が目的の物を簡単に手に入れる為には便利な世界かもしれない。
でも、本当の世の中がノイズ塗れだって知らないまま子供が大人になった場合、本当に必要な物を手に入れる方法がわからなくなるんじゃないかって心配になる。
教科書こそ、ノイズを消して簡単に必要な物を手に入れる為に作られたものではあるんだけど、新しい発見に繋がるには実験の様なノイズを取り入れる行程が必要な訳で、分かり易い勉強って形以外にもノイズから学習する物が沢山あると思ってる。
子供だけじゃなく全ての人にとって最近のAIの進化が上手くない状況に向かってる気がしてるのが杞憂であって欲しい。
のび太が簡単な計算をするだけで救われた文明世界があったように、twitterのタイムライン表示を有難がる様に、ノイズ塗れの世界を。