はてなキーワード: 学習とは
君が教科書を読むだけで一発ですべてを覚えられて、東大医学部に首席合格しましたとかだったらまぁそりゃ宇宙人に人間の学習法を理解するのは無理だって話になるけど
教科書を読んでわかるっていうのにも段階があるし、勉強するならいくらでも上級の本はあるでしょ
というか親が勉強しろって書いたのに教科書がどうこうっていう返事が来てる時点で、大人が何か新しい知識を勉強するっていうことがそもそも念頭にない社会的階層っぽいけど
世界史を読み直すのでも大学レベルの数学をやるのでもいいし、資格試験でもいいから自分が知らないことを勉強する姿を見せてれば子供も多少は勉強するんじゃねっていう気がする
ユーザーデータ使って学習してる会社や聞いたこともない新興の会社のSaaSやパブリッククラウド使うの無理だからオンプレでやるか、オンプレでやるなら6000 Adaより安いなってだけでしょ
誰も効率の話してねえよ
特に、生成AI運用者が開発の実態や利用者の実態を無視して「(他は知らないが俺は)クリーン」を謳う欺瞞的商法を指す。
無断学習(生成AI開発工程においてデータ提供者の許可を得ないまま利用する行為)は、元々は著作権侵害行為だったが、2018年の著作権法改正でなぜかAI開発だけ引用要件が大幅緩和され無断学習は合法化された。過剰な特定産業優遇としての無断学習合法化をアンフェアと感じるデータ提供者が多い。
後述する脱法ビジネスは、データ提供者の才能や業績に依存しつつデータ提供者と直接競合するビジネスを運用するパターンが多い。このような脱法ビジネスを許したきっかけである無断学習合法化をアンフェアと感じるデータ提供者が多い。
生成AI開発工程において海賊版サイトのデータを利用した事例が報告され、非倫理的だと批判された。生成AI開発の際に利用したデータを公開する義務は開発者にないため今でも利用され続けているのではないかと疑惑を持たれている。
生成AI開発工程において児童虐待画像(児童ポルノ)を利用した事例が報告され、非倫理的だと批判された。生成AI開発の際に利用したデータを公開する義務は開発者にないため今でも利用され続けているのではないかと疑惑を持たれている。
生成AI運用者がクリーンなサービスを自称する場合、クリーンとは「日本の改正著作権法に照らして合法」を意味し、上述したアンフェアな無断学習問題については無視していることが多い。消費者の技術的無知に漬け込んだ欺瞞的広告だと指摘されている。
新聞記事要約AIは、完全に合法であるが、新聞社のコンテンツにフリーライドしながら新聞社の営業を妨害する悪質なビジネスだと指摘されている。
有名声優の声を真似る声質模倣AIは、完全に合法であるが、声優の才能や知名度にフリーライドしながら声優の営業を妨害し名誉を毀損する悪質なビジネスだと指摘されている。
有名絵師の画風を真似る画風模倣AIは、完全に合法であるが、「消費者は画風に価値を感じているのに画風は法的保護されない」という法律のバグを突いた悪質なビジネスだと指摘されている。
生成AIの3店方式はビジネススキームの悪質性を指摘したものであるが、それとは別に、生成AIを用いた犯罪についての懸念もある。
具体的には
が問題視されている。
EUでは学習元データの透明性確保とかオプトアウトにむけた法整備が進んでるわけで、現行法での整理でマウント取るのはかなり裏目があると思うんだよね。
この流れが広がった場合、「生成AIって出てきた当時は法規制が追いついていないのを良いことに好き勝手して、絵師は反AIと馬鹿にされながらも権利を守るために戦って規制を勝ち取ったよね」みたいな評価にもなりかねない訳じゃん?
あとそもそも将来の法規制を求める声に対して、現行法ではセーフだから黙ってろって反論になってなくない?
俺も反AIは嫌いだし単純に特権意識持ってる絵師様()が必死になる様は面白いと思うけど、馬鹿にする対象は選んだ方が裏目が無いと思うんだよね。
例えば「反AIは絵柄に対する著作権の保護を求める馬鹿」とか「著作権違反アイコンや二次創作を好む癖に生成AIを批判するのはダブスタ」、「現行法では合法な行為に対して『盗人』のような強い表現で批判を行うのはモラルがない」とか浮いたコマを馬鹿にしてる分には法規制が進んでもひっくり返らないよね、
今のところはてなではAI推進派が多数派っぽいけど、今後どちらに転んでもおかしくないと思うからブクマカは過去の過激なブコメを引っ張り出されてネタにされないように自衛した方が良いと思うよ。
海外で「痴漢が少ない理由」を聞いたら「痴漢なんてしたら被害女性に引っ叩かれて、周囲にいる男達にボコボコにされるに決まってるじゃん!」って明るく答えている女性がいて羨ましかった。
これ、重要なのは「被害女性が引っ叩く」だけではなく、その後の「周囲の男達にボコられる」という部分。
当たり前だけど、女は男に力で勝てないし、相手は犯罪するような奴だから、「被害女性が引っ叩く」だけなら、「痴漢が激昂し、被害女性を暴行強姦する」につながりかねないのよ。
被害女性が安心して痴漢に抵抗できるのは、「周囲の人(特に男性)が味方になって、痴漢を一緒に捕まえてくれる」という信頼感があるから。
それ無しに、被害女性が一人で犯罪男性に立ち向かえるわけないじゃん。
男だって、明らかに力で勝てない相手から体に密着して犯罪行為仕掛けられて、周囲の誰も味方になってくれないかもしれない状況で、抵抗できるかと言えば難しいと思うよ。下手に抵抗したら殺されるかもしれないわけで。
日本で女性がすぐにNOを言えないのは、「声さえ上げれば周囲が絶対に味方になってくれる」という信頼感が無いからだと思う。
実際、ちょっと前までは痴漢に声をあげると、被害者の方が責められることも少なくなかった。今でも被害者の落ち度探して責める人いるけど。
女性にもっとNOと言うべきと思うなら、女性が安心して犯罪者にNOを言えるような社会にするべきだと思う。
https://twitter.com/sodium/status/1786957266966687973
犯罪って普通人目につかないところで起きる。当たり前よね。見つかっちゃうから。
でも痴漢は被害者が絶対に気がつく犯罪で、しかも人混みの中でも起きる。
被害者が被害を自覚していて、すぐそこに加害者がいて、周囲にはたくさんの人がいる。
なのに助けを求められない。
求めても助けてもらえないどころか自分が責められたり、加害者から報復される可能性の方を考えてしまうから。
加害者が悪いのは当然として「加害者ではない一般人」が被害者の味方をしてくれるという信頼すらなく、被害者は孤立させられる。
これは加害者と被害者の問題ではなく、社会の問題でもあると思うなあ。
「なんで先生に報告しないんですか?」
「嫌だと言わず、先生にも報告せず、誰かなんとかしてくれるのを待ってるなら、それは他力本願すぎますよね」
嫌だと言ってやめてもらえるなら、先生に報告して必ず解決するなら、その信頼があるなら、イジメられている子の多くがそうすると思う。
その信頼がないから、かえって悪くなってしまう可能性があるから、そうできないだけ。
信頼がない理由には、過去に信頼を失うような体験がある。自分の体験でなくても人の体験でも。
・通行人とか電車内の他人の容姿でギリ気づかれるかどうかの声量と言い回しで笑い者にしまくるチキンレースをしょっちゅうやる、
・迷惑かけたり怒りだしたり暴れだしたり、そういうことをして何かにつけて目立ちたがる
・格下と見なしてた先輩とか同期から愛想良く挨拶されたり話しかけられたりすると、露骨にピリつきだして本人がいなくなったタイミングでキレ気味に悪口言いまくる
いまだにこれ
特定のクリエイターの作品である著作物のみを学習データとしてファインチューニングを行う場合、当該作品群が、当該クリエイターの作風を共通して有している場合については、これにとどまらず、表現のレベルにおいても、当該作品群には、これに共通する表現上の本質的特徴があると評価できる場合もあると考えられることに配意すべきである。
を「狙い打ちLoRAは著作権侵害の可能性があるって見解がでた」と思ってるからな。
目にするだけでもアホらしい、反論にすらなっていない事を理解できていない、よくある反AIの発言。
「人間の学習とAIの学習はまったく同じ」と本気で信じている者が居たら、バカだと思うだろう。同じことだ。
あくまでも一定の条件下で特定の観点から見ると、という話でしかないのだ。
反生成AI活動家の急先鋒カーラ・オルティス女史は、生成AIの出力を「21世紀のコラージュ」と見做す。
生成AIは、さまざまな作品から拝借・切り貼りしている<ように見える>
厳密に、技術的には違うとしても、そう見える。故に「21世紀のコラージュ」だと言っているにすぎない。
コラージュという技法を抽象化し、比喩に使っているだけなのだ。馬鹿でも理解できるように。
生成AIの出力を「単なる合成、切り貼りコラージュ」と公言して憚らない。みんながそう言ってるから。
学習データの一部が<実質的に>復元できてしまうことと、単なる圧縮解凍の区別も出来ない。
生成AIを文明から排除するために誇張された言葉を、すべて鵜呑みにしてしまう。
「生成型検索エンジン」という造語がある。StableDiffusionの顔、Emadの言葉だ。
これは「いままでは画像が必要な時に検索していた。しかしこれからは検索するかのように生成する時代が来る。生成AIは次世代の検索エンジンだ」という意味で、ターゲット層であるビジネスマンに向けた造語である。
しかし反AIは知性が無いので「生成型検索エンジン=検索して切り貼り=モデルに学習データそのものを保存=やっぱりコラージュだ」と、ここでも誤った解釈をしている。
最低限の学が備わっている者ならば、早々に見切りをつけたことだろう。救えぬものじゃと。
事実、反AIの中でも理解力の高かった者は次々と脱落していった。
自身から湧き出る要求が自己中心的で、何を言ってもどこかでダブルスタンダードになってしまうことに気づいてしまったのだ。
「部分的に、ある側面から見れば同一である」事に理解を示してしまうと、生成AIの全否定しか許されない村から追い出されてしまう。反AI村に居たいなら、黙るしかない。
大学のとき固体地球物理学をやってたんだけど、研究をするにあたって観測・測定データがとても大事。
それで、たとえば大地震が起きたとき、地元の大学がデータを収集して、全世界に公開するかというと、それはしてなかった。
火山噴火のときも、それまで集めた平常時のデータと噴火時のデータを全世界に公開すれば研究は進むけど、それも直ちにはしてなかった。
なにをするかというと、そのデータを用いて、それを収集した人が論文を書く。
それで、論文を書き尽くして「もう、このデータから書ける論文はないかな」となったところで公開する。
最初から公開した方が研究は進むけど、それだとデータを収集した普通の学者が食べていけなくなる。
指導教官に「データを公開した方が良いと思うんだけど、しょうがないですかね」と言ったら
「公開した方がいいね。データの下処理を色んな人がやってくれるんなら、その方がありがたい。そこから考察するから」
と答えた。
普通の学者がデータを公開すると、こうしたデキる学者が先に論文書いてしまうので、存在価値がピンチになってしまう。
「AIの学習ズルい」と言ってる人たちは、普通の学者の主張に近いと思う。
デキる学者はAIが真似できるようなところで勝負してないんだと思う。
そもそも普通の学者に存在価値があるのかというと、これは難しい問題。
ここがAIで置き換えられるなら、それでもいいじゃんと言う気はする。
2年で3名ほどアプリのデザイナーを業務委託で雇って結論、業務委託もういらん、面倒という結論に至った。
・業務委託雇った当初、一人デザイナーだっためリソース多いほうがよいのではということで、フリーランスを雇うことにする。
・社会人7年目。
得られた所感
・準委任契約でリモート前提は相当な信頼関係がない限り無理。明らか自分のキャパ以上の仕事を並行して受けているフリーランスはこちらからすると、アウトプットが少なすぎる。
・準委任で週5日フル勤務契約なのに他の仕事掛け持ち前提で従事しようとするフリーランスは、いかがなものかと思った方が良い。
・レスが遅い人は切る対象にしたくなる。即レスを求めるわけではないが、チャットで質問して5時間後にくるのが普通なフリーランスは感覚がずれている。
・そもそも進捗具合を聞かないといけないようなフリーランスは切る対象で良い。
・商談(面接ではない)で、一つでいいからプロジェクトの中でどんな立ち回りで関わっていたか、どのくらいの期間の仕事で何をしたか細かく聞いたほうがよい。ここで返答が曖昧だったり、理解ができなかったらその人材は会社にあってない。
・盛り癖があるやつは、関わった会社のロゴを資料にペタペタ貼り付ける。
・プロトタイプで終わったやつとか、世に出てない製品についてはあまり参考にならない。
・初めて話して泥臭く仕事に取り組む姿勢や素直さが感じられない場合は大抵地雷。
・アウトプットがチェックしてもらう前提で上げてくるので、チェックに時間を割けるなら雇っても良いと思う。ただチェックする時間を割くくらいなら自分で作業した方が良い。自分で学習したほうが早くないか?と思う。
3名とも単価100万/月以上になるが、この金額払って業務委託雇うくらいなら、自分でやったほうが早いという結論になりフリーランスはもう雇わないだろう。
生成AIにまつわる議論において、「無断学習」とは「生成AIの開発工程においてデータ提供者の許可を得ないままデータを利用する行為」のこと。
語呂がいいから「無断」と呼ばれるが意味的には「社会的合意の欠如」と表現する方が正しい。
社会的合意があればいちいち個別に許可を得る必要はない。たとえば画家が絵の練習として行う模写にはそれをしてもよいという社会的合意があるのでいちいち個別に許可を得る必要はない。
2018年の著作権法改正で生成AIの無断学習は合法化された。それまでは引用の要件を満たさない著作権侵害行為だった。
合法化されたにも関わらず悪印象のある用語「無断学習」が使われることは好ましくないという指摘が(生成AI推進派から)出ている。
データ提供者の許可を得ないままデータを利用するから「無断」なのであり、意味としては全く正しい。
代案を出さない生成AI推進派のせいではないかと思うのだが、適切な言い換え語がないため無断学習という言葉が使われ続けている。
声優やイラストレーターは生成AIを用いた脱法ビジネスや嫌がらせの被害者である。嫌がらせツールを開発するために自分のデータを提供したくないと考えるのは自然な流れである。しかしながら現行法ではデータ提供を拒否することができない。声優やイラストレーター、そして彼ら彼女らのファンは現状に強い不満を抱いている。ディープフェイク問題や肖像権侵害問題が新聞テレビで取り上げられたことからクリエイティブと縁のない庶民も不安を感じている。この不満・不安が無断学習という悪印象のある言葉を使い続ける動機になっている。
無断学習という言葉が使われ続けているのは、多分に代案を出さない生成AI推進派のせいである。生成AI推進派が適切な言い換え語を提案すべき。
[:contents]
年収600万円の公務員(会社員)は自営業年収600万円と比較して、源泉徴収票の年収に含まれない会社負担部分の厚生年金、介護保険、健康保険料107万円の差額がある。
更に退職金として2000万円超の支給を見込めるが、現在の税制で勤続38年だと2060万円までの退職金は完全無税で受取できるため、自営業3000万円相当の収入と計算でき、年収ベース78万円加算。
年収600万円の平均的な公務員と同等の賃金を自営業で得るには、785万円稼ぐ必要がある。
◯マルチタレントとして本業にこだわらず、関連類似の職能を積極的に取得しはたらく。
原画も、グッズも、プリントも売るし、依頼の商業仕事もこなす。SNSは売名目的と意識してやる。
そもそも自分で絵を描く事にこだわらず、自分の絵をAIに学習させてAIに描かせる商業原画を受注するとかもやるぐらいのアグレッシブさは欲しい。自分で自分を雇って使いこむ間隔。
◯東京(海外)に類似の仕事があるが、その地方では誰もやってはいないが需要のありそうな仕事や仕事のやり方をする。
◯時給2500円以上の皮算用ができない仕事は最初から受けてはいけない。ただし、広告宣伝に目的の場合は除く。
最初は不足してる美味しい部分だけやるから利益率が高くても、仕事がデカくなると他者と単価競争が出て、粗利は減る傾向がある。
最終的に自分がいる場所において周辺のお客様と利益を共有できる(お客様が希望している)のは何か?
やりながら、引きが強い物を育てていく。
私の場合、絵を描く事より絵を買う事で、社会の中に絵を描く仕事のタネを残して行きたいと思っている。ただ、無価値な絵を買っているので死後買った絵はほとんど残らないだろうが、文化としてそれは引き継がれていく。
社会に絵を残す。社会的的に自分を残す。生きている限り何もしなくても何かは残る。
フリーイラストサイトのTwitter とインスタアカウントを作り毎日投稿、サイトの方は週1回ペースで更新ていく。実際の製作は月3日20時間(5分で1個20時間で240個)ぐらいで行いアップ作業は後日やる。まず1年間回した所で、lineスタンプの制作、「いらすとや」といつワードで検索広告を月5万円使い、フリーイラスト探してる人をサイトへ誘導して、サイトからSNSアカウントへも誘導し、フォロワーを増やす。とにかくフォロワーを増やすために、同人イベントなんかにも出てみる。
チェコ絵本風という切り口なので、いらすとやとは差別化できる。基本はいらすとやを良く見て、カットイラストとして使いやすさと検索ワードに反応しやすいバリエーションを意識する。
いらすとやは10年で25000個描いてるので、最初の1年で2500個を絶対作る。上手く行きそうなら、2年めから5000個作る。3年で12500個のイラストサイトができる。