はてなキーワード: スクレイピングとは
2024/2/14 タイトル一部変更
自分の意見は「二次創作が伝統的に許されてるのにイラストAIになった途端許容しないのはダブルスタンダードだろ」という意見が核になってます。
なんなら自分も二次創作は好きなんですが、「俺の作品!」みたいな面されると反感持つだけです。
とはいえ今から追記するとゴチャゴチャにしそうなので波線以下文章は手入れてません。
本当にすみません
・お前のお気持ちだろ
仰る通りです
〜〜〜
「二次創作を有料に描いてる人が文句を言うなってのはお門違い過ぎないかなってね。今回のAIの問題点は「『人様の絵』を使うなって感じじゃないの?」とかのたまってるアホがいてイライラして書き始めた。
・AIが話題になるずっと前からfanboxやFantiaのガイドラインに許可されていない二次創作で金取ることを批判していた。
・イラスト生成AIは肯定派だが、あくまでそれは技術の進歩としてで、オープンソースとして研究されるべきだったし、クローズドにして金を取るのも、そのAIを使った金儲けも禁止すべきとは思ってる。(ただ、プロンプトのコツみたいなのはイラスト教本みたいな感じだからそれはfanboxでも出していいかなって思っている。)要はAIで金儲けしなければいい。
・二次創作そのものはどんどんやっていいと思っているが、それで金を受け取るのは違うだろクソ!と思っている。
まとめると嫌儲主義みたいだが、こんな感じ。今回の二次創作はfanboxで公開されてるエロ絵みたいなものを前提に考えてる。
あくまで「AIを禁止されないために相手の弱みを突く」ではなく、「二次創作で金取ってるやつがいっちょ前に創作者ヅラしてんじゃねえよカス」という立場。もちろんAI絵師は絵を描いてる!なんていう気はサラサラないし、そいつらはネットの承認欲求こじらせたアホとすら思っている。
そもそもAI禁止されたところでネットは遮断されないんだから、中国あたりにスクレイピングされて日本語の通じない相手が新たなイラストAI出すだけだし、規制は根本的な解決にならないだろ。
「AI絵師はこんなひどいことやってるし、こんなクソなんですよ!」といわれた場合、「そうですね。ひどい奴ですね。許せませんね。」となる。俺はイラストAIで金儲けなんてしたことないから、そいつはカスだね!で済む。単純な白と黒の二元論で物事を考える頭Mr.ゲーム&ウォッチがいないことを祈る。
それでこの前AI規制を訴えたアホがきらら作品のエロ二次創作でfanbox・fantia・DLsite・DMMのマネタイズしてたのを必死こいて削除してたのを見て思ったけど、最近の絵師(笑)はなぜ二次創作で金を取る?
同人誌ならまだ分かるが、データ媒体なら印刷費も郵送もいらねえのに何で金とんだよ。
作家の支援なら一次創作だけfanboxで投稿すればいいし、二次創作は無料公開すればいいじゃん。
わざわざpixivに本番シーンを抜いた不完全エロを投稿して「続きはfanboxで!」はなんなんだ?どう考えても二次創作エロを商材にしたドスケベサブスクサービスじゃねえか。
それを俺は昔から「おかしくない?」と指摘していた。これはあくまで古臭いヲタクの「二次創作はアングラだし、二次創作元の目に入らないようひっそりと楽しめ。金稼ぎなんてもってのほか」という考えから来ている。
ふざけんじゃないよ。
お前がキャラデザインをしたのか?
お前が周囲のキャラクターとのエモーショナルな関係性を考えたのか?
お前がそのキャラクターが織りなすストーリーで誰かの心を震わせたのか?
一次創作やる時に気を付けるのはな、「自分の世界を読者にいかに理解してもらうか」だよ。
その過程を「みんな知ってるあの作品のあのキャラです!」ですっ飛ばしといて創作者気取ってんじゃないよ。
お前がやったのは作品の文脈のフリーライドでしかないのを自覚しろ。
「この作品のこのキャラにこんなエッチなことをさせました!」なんてな、作家性もクソもねえし、リスペクトもクソもないよ。キャラクターの消費。
「人様の絵」って、人様の絵を使ってるやつが言える言葉ではない。
大体ネットで二次創作挙げて創作者気取ってるやつは碌な奴じゃない。
自分の考えた一次創作じゃインプレッションもらえないからって、二次創作に頼ってるだけの承認欲求だけが発達したつまらん人間だろ。
一次創作描いて少ないインプレッションに打ちのめされて自分がつまらない人間であることを自覚しろ。
長々描いてきたが、俺の主張はこうだ。
・「ガイドラインで許可されていない二次創作エロ描いてるやつはfanboxやめるか一次創作にとっかえろ」
・「『自分はイラストの練習頑張ってきたのに、後から来たAIがイイ感じのイラストかけるようになってずるい!』と思うのは好きにしろ。当然の感情だし、AIを悪用する奴が完全に悪い。ただしアホの理論武装をして作家性とか言い出すな。それが言いたきゃ一次創作しろ。」
・「ちなみに一次創作者は好きなだけイラストAIに文句つけまくれ。お前にはその権利がある。」
・「二次創作で金を取るな。それはお前が金を取っていい領分を超えている。」
別にAI批判をしてもいい。確かに法律的には学習はセーフだが、倫理的に問題は実際ある。国に禁止を訴えかけてもいい。(他国が保有してたら意味がない核みたいなもんだから、俺としてははイラストAIを普及させまくって市場的な価値を下げまくった方が、オリジナルの画風を持ってる人が有利になると思う。)
ただAIが悪いからといって、お前が二次創作で金取ったりすることが許されたわけじゃないのは肝に銘じておけ。
これは100%俺のお気持ちであって、この内容に俺の中の倫理的な正しさはあっても、皆に共有できる正しさはあまり含まれていない。(版権に迷惑かけなければ二次創作やりまくれ!とはいいわけがない)
そこらへんはきちんと明言しておく。
モラルのないAIの使い方、AIの学習のための大量スクレイピングに対策を取らないPixiv運営への不信感がもとに、数多くのイラストレーターがPixivで公開していた作品を非公開にする流れが生まれている。
「pixivのイラストを非公開にしました」 フォロワー数十万の“有名絵師”から発表相次ぐ AI巡る対応に不信感
https://www.itmedia.co.jp/news/articles/2305/08/news068.html
これに対して少しモヤついていた。と思ったら、正しくそのモヤつきを説明できるような記事があった。
画像生成AIはクリエーターの権利を脅かすと規制訴えた団体の理事、禁止の二次創作イラストで批判され謝罪
https://news.yahoo.co.jp/byline/shinoharashuji/20230429-00347590
AIに対して批判的な態度を取る団体の理事が、二次創作が禁止されている作品のイラストなどで呼びかけを行い、後謝罪したという記事。
まさしくこれ。
自分は平気で他人の作品の二次創作を行っているにもかかわらず、知財権の侵害だなんだと訴えている人がいるように思えた。
実際、今回の非公開騒動の中では、艦これのTS(性転換)イラストを多数描いている人が、「Pixiv運営への不信感をもとに~」といった文言で作品を非公開にしている者もいた。
会社の温情でクリエイティブと承認欲求を満たせている分際で、クリエイターの人権だのどうだの良く言えたものだと思う。
完全にオリジナルのイラストを制作している人に対しても思うところはある。
AIが自分の絵を学習するのに忌避感を抱く人たち、そういった人たちには、今まで自分の好きなクリエイターの絵柄や色や構図を真似したことがないとは言わせない。
もちろん、真似する側のモラルが問題ということはわかる。画像生成AIに作品を提供しない理由のアンケートで、半数以上は「現状の画像生成AIの悪い利用方法を見て」と答えた。
https://twitter.com/you629/status/1641799881164738567
最もな理由だと思う。ただ、作品を公開する限り、誰かが自分の絵を学習する可能性はあるということは念頭に置いてほしい。AIの学習と人間の学習は原理がほぼ同じというか、AIの学習の構造は人間の学習をモデルにしている。スケールが違うだけで、同じことは今までみんな半ば容認していたということ。
そして問題はここからで、41%の他の奴ら。こいつらは現実を正しく認識できているのか不安だ。
「絵柄などの優位性が失われるから」
トレンドというものは常に存在するし、AIのトレンドが生まれたならそれに埋もれない創意工夫は、クリエイターにとっては半ば義務だと思う。
それを理由にAIからの学習を拒むのは怠惰だと思う。現代の最先端を走る技術に、面と向かって批判を発する資格が無いと思う。
それを言い出したらキリがない。AIにかぎらずあらゆる界隈に通ずるものだ。
最も時代から取り残された理由だと思う。今後一切のテクノロジーを利用しないことを条件にその意見は発してほしい。
長々と話したが、今回の騒動で最も気に入らないのは、単に流行りに乗っかって作品を非公開にしている(ようにしか見えない)層。
なんとなく、自分の絵がAIに学習されるのは嫌だから非公開にする。
なんとなく、みんなが非公開にしてるから非公開にする。
そういった奴ら。過去の絵を見てみたら、一切の個性を感じさせない、判で押したようなテンプレ絵。二次創作。
そんな奴らが良くも、人生をかけてオリジナリティを生み出す一流のクリエイターたちの横で抗議活動なんて行えるな?
ちゃんと、なぜこのままモラルのないAIの利用が増えたらまずいかを考えろ。
ちゃんと、自分の絵が説得力を持っているか考えてから主張しろ。
あと最後に、
この世の大半の消費者は、自分の利用する製品がどのように作られたなんて気にしないと思う。
自分が読んでいる漫画の、どこまでが作者の作画で、どこまでがアシスタントの作画なのか、気にする人は少数だと思う。
機能に不具合がなく、不自然さもなければ、たとえ猿が作ったものでも価値が生まれる。
このままAIが発達して、イラストレーターたちに何らかの不利益が生じるのは確かそうだ。
AIの作ったイラストをスマホの壁紙にする人はいるだろうし、それがどのように著作権を侵害したかなんて気にしないだろう。
この世の大多数を占める消費者に、直接的にしろ間接的にしろ害が生じる、ということを納得させないと、論に力は宿りづらいと思う。
(詳しく調べた訳じゃないのでツッコミ歓迎です)
・AI絵が出すぎ
→AI絵は専用のタグがあるので、第一の問題はAI絵をアップしたくせにタグを付けないやつにある。
フィルタリング強化は当然として、他にpixivにできることとしては、AI絵を検知して自動的にタグ付けすることか。
・AIに絵をパクられたくない
→ある意味、ネットにコンテンツを公開しつつ「ダウンロード禁止!」と言っているのと同じ滑稽さを感じる。
Pixivに言ったってどうしようもないんだよなぁ。
ただまあ、スクレイピングを難しくする対策は可能だし、絵師様に安心して使ってもらえるプラットフォームを目指すなら
ここにもコストかけないといけないんだろうな。
→絵柄を模倣しているか否かの判定なんて人間にも困難である。自動判定するのも、技術的にも非常に困難だろう。
まずは通報システムを作って、検証する人員を増やすしかないかな。
特定の絵師名を出して、似せた絵柄のAI絵を販売しているアカウントは、取り締まりやすいしとっとと取り締まるべきだろう。
あと、元の絵の一部を塗りつぶしてinpaintで作られた剥ぎコラなどは自動検出できると思う。
・まとめ
AIでイラストを描く事を数か月やってみて、反AIのバカさ具合ついて大体感覚つかめたから解説するね
反AIの人たちが「打倒AI」を掲げてやろうとか語る作戦がある
①わざと手足や体のおかしなイラストを書いて、AIを壊せないかな!?
全部無理です。
①もともとお前の絵の人体構造おかしいだろ。とまぁツッコミは入れておきつつ、そもそも生成AIはリアルタイムで画像を取得しているわけではなく、「既に学習された画像」を使っています。
本来であればローカル、つまりお前のPCでも動かせるものを、わざわざネット上にソフトを上げているだけです。なので新バージョンで学習されてるならともかく、今更手足をおかしくしても意味ないし
AIで学習させる場合は人の目を通して「これは美しい、これは美しくない」と学習されてるので、意味はありません。
②にもつながるのですが、たとえ学習されるにしても「こういう絵を出さないようにしよう」という学習として使われる上に、今では学習用のデータはクリーンなものにする傾向にあるため、「ダメな絵」の見本としても使われないでしょう。
③スクレイピングのツイートを見てこの考えに至ったんでしょうが、AIはリアルタイムで画像を取得していないので「特定のキャラクターの絵」が出しにくくなるだけで、結局はポチポチ画像集めしたり「チルノの画像まとめ画像」をスクレイピングすればいい話で。ちなみに故意のランキング荒らしは犯罪です。
特定の絵師の追加学習は、罪に問われる恐れはある。でもこれは法律何条とかじゃなくて、知財法の目的や通説から推測されるもので
具体的に商業絵師の収入を直接減らすような行為であればダメになりそうだけど、
まぁ反AIの人はそこらへんは説明しても分らなそう。ちなみにお前らがいくら訴えようが、そもそも絵で金を稼いでる訳じゃないので意味ないです。
アンチAIの人はAI使ったことないからよく分かってないみたいだけど、
Pixiv自体はAIにとって話にならないんだよね。学習の参考にならないから。
Pixivの次にヤバいのがTwitterなんだけど、まさかアンチAIなのにTwitterにイラストアップしてるマヌケだったりしないよな?
https://b.hatena.ne.jp/entry/s/twitter.com/tadanojako/status/1654676274089197568
AIが学習する上で一番重要なのはメタデータの質なので、最近の2次元AIは黙って転載サイトdanbooruとか使ってるよ?
danbooruの転載元として多いのはPixivとTwitterなのでPixiv云々は致命的に間違ってるわけでもないのだが。
本気でアンチAIならTwitterに一切のイラストを投稿しないで活動しないといけないので、
人々に見て貰いフォロワーを増やすことで仕事に繋げるイラストレーターとしては自殺でしか無いと思うけど、思想信条の問題なら仕方ないかな。
転載サイトのトップで見かけたピーチ姫だが、投稿されたPixivと転載先のdanbooruのメタデータの差は圧倒的でどちらから学習したほうが精度が高くなりそうかはバカでも理解しやすいだろう。
#mario (series)
#super mario odyssey
#princess peach
#1girl
#blonde hair
#breasts
#day
#earrings
#from above
#hat
#high heels
#large breasts
#lips
#long hair
#long skirt
#looking at viewer
#open mouth
#outdoors
#pink lips
#pink skirt
#shirt
#solo
#white headwear
#white shirt
pixivに転載サイトなんとかしてくれという要望なら理解できるのだが、Pixivを悪者にしたら回避できると頭の悪い学習をしてしまっているようだ。
Pixivは規約上スクレイピング禁止でも転載され放題な現状なので。
よくわからない第三のイラスト投稿サイト()とやらがスクレイピング禁止してもイラストが集まるなら転載サイトは無視してくるよ。
これまでの経緯について、だらだらと書きます。
夫:32歳、大学院卒、社会人8年目、手取り年収500万円、副業年収75万円
妻:32歳、短大卒、保育士7年目で結婚⇒パート5年目で妊娠&出産⇒現在は専業主婦
息子:1歳
当時ブームになっていたFXを始めることにした。このときの資産は60万円で、最初に入金したのは10万円ほど。バイトで稼いだお金が元手。
大学2年から大学院1年までの約4年間FXに取り組んだが、その割にリスクをとるような取引はしなかったため、最終的にほとんど±0で終わった。
FXで大損した話がネットに溢れていたため慎重になっていたと思う。
ただ、本気で取り組めば稼げるようになるはずだと信じていた。大学時代に数千万円貯めて就職したくないと思っていた。
結局4年費やしても何の成果も得られず、自分に投資の才能はないと悟った。
一晩で30万円溶かしたときはショックだった。その次の日に一人で北海道旅行に行く予定で、キャンセルしようかギリギリまで迷ったけど行った。
結果的には行ってよかった。1月だったけど奇跡的な暖冬で、良い傷心旅行になった。
今から思えばこの経験をしておいて良かったと思う。資産が増減すると自分にどのようなメンタルの変化が起きるか分かった。
若いうちに投資を始めるのは大事。仮に失敗しても元手が少なければ損は少なく、後の人生でいくらでも挽回できる。
大学院2年目のときにゲームや専門書の転売を半年ほどやって50万円ほど稼ぎ、資産は150万円になった。
このときはFXは完全に辞めていた。社会人になったのでリスキーな投資ではなく安定投資をすることにした。
ネット上からWebスクレイピングで株価データを入手し、自分で決めたルールで取引するとどうなるかをシミュレーションするソフトをExcelで作った。
頑張って作ったのに、どんなルールを使ってもせいぜい年率4%しか利益にならず、これならインデックス投資したほうがマシだと思って辞めた。
ちなみにFXをやっていた頃から経済ニュースは参考にしなかった。経済ニュースを見て大金持ちになれるなら世の中の経済学者は全員金持ちのはずだがそうはなっていない。そもそも社会人で日中仕事をしている状況で経済ニュースなんて見れない。などと言い訳していたが、実際のところは勉強が面倒だっただけ。
入社した会社には、10%の奨励金を貰える自社株制度があった。1年目の最初は財形貯蓄をしていたが、1年目の終わりに自社株制度を使った良い方法を思いついたので財形貯蓄は止めた。
毎月の収入とボーナスをすべて自社株の購入に充て、次の月に売却するのである。そうすれば奨励金10%(税金を引けば8%)分が利益になる。
ドルコスト平均法のように購入時期を分散するだけでなく、売却時期も分散するのでリスクは少ない。
この方法は今も続けているが、毎年30~50万円の利益を生み出してくれている。
ここで資産が大きく増えたのは結婚したからである。結婚時は私の資産が300万円で妻の資産が800万円だった。
私の資産が150万円ほど増えた理由は、会社の寮に入っていたため家賃と光熱費を大きく節約できたためだ。具体的な金額は覚えていないが、合わせて約3~4万円だったと思う。
妻は結婚するまで7年保育士をしながら800万円貯めた。実家暮らしで、無駄遣いしない性格だったためである。
誰もが知るように保育士は薄給で激務であるため、結婚を機に辞めた。それから約5年は年収100万のパートを続けていた。
結婚は価値観のすり合わせが大事だと思うが、それほど苦労はしなかった。結婚前からお金の話や将来の話はオープンにしていた。
ただ、妻に財布を握られて投資ができなくなるのが心配で、将来のライフプランや投資で想定されるメリットなどをパワポ資料を作ってプレゼンした。プレゼンについてはかなり気に入ってくれて、投資を自由にやらせてもらえることになった。
家の家計管理も私がやることになり、毎月の家計簿も付けている。
投資については、この時期からインデックス投資をすることにした。海外株、海外債券、国内株、国内債券をバランスよく保有する形で投資信託を毎月購入していた。
ただ、リスキーな投資にも手を出しており、仮想通貨も購入した。当時の仮想通貨はバブルで、急上昇したあと急降下する動きをしたため、私は数十万円損して終わった。
新型コロナウイルスが発生した2020年である。またFIREムーブメントが起きた年でもある。
FIRE本で書かれていた内容だが、投資については昔から有名なインデックス投資のやり方のままで目新しさは無かった。ただ、FIREは投資だけでなく収入や支出などを含めた、新たなライフスタイルの提案なのだと感じた。
今の家計管理をもっと洗練すれば、早期退職できるのも夢ではないと分かった。計算してみると50歳で資産1億円を達成してFIREできる見込み。
家計管理を洗練すると言っても、既に支出はそれなりに切り詰めている状態だった。車を持たず、民間保険には加入せず、携帯は格安SIMで、夫婦そろって服も買わない。
減らせる支出は外出や外食ぐらいだったが、コロナのおかげで両方減らすことができた。この年の年間支出は約300万円。
投資については、リスク度合いを大きく引き上げた。投資信託の中身を全て米国株や全世界株に変え、資産の9割を投資信託、残りを現金という配分にした。
株式はリスクが高く金額の増減が激しいものの、長期的にみた成長率は現金や債券より高いと分かった。緊急で必要になる程度の現金が確保できているため、残りは株式にしても問題ないと判断した。
この判断のおかげで2021年には投資の利益が300万円になった。なお2021年以外の年の利益は平均100万円ほどであり、2016年以降で利益が50万円を切った年は無い。
また2020年に不妊治療を始めた。結局子供が生まれるのは2022年となるが、体外受精まで進んだため合計で100万円ほど費やすことになった。
実際は150万円ほどかかったが、市や県からの補助金、確定申告の医療費控除分を引くと、この金額である。
不妊治療については結婚後初めて夫婦の意見が大きく割れた。これまでも子供の話はよくしており、お互い子供が欲しいと言っていたが、その本気度は違った。
私は子供は自然に産まれると思っており、高額な不妊治療をしてまで欲しいと思っていなかった。普通の買い物でお金を払うときは、払うお金に対して妥当なリターンが想定できるかどうかで判断する。しかし不妊治療は、言わば高額なギャンブルである。
数十万や数百万のお金を費やしたとしても、子供が産まれてくる保証はない。子供が産まれるまでいくらかかるが分からない。そういうお金の使い方が受け入れられなかった。しかも産まれた後は2000~3000万円ほど費やすことになる。
しかし妻にとっての子供は、人生に絶対必要なものだった。不妊治療で子供ができなければ養子を貰いたいとまで話していた。
私自身は、子供ができなければそういう人生を楽しめば良いと思っていた。しかし妻は、子供がいない人生はただの暇つぶしになると言う。
夫婦の幸せを考えるなら子供は必要な存在なのだと思った。それに私自身も、今後の人生において子供がいないことを後悔するときが来るかもしれないと感じた。そういうわけで不妊治療を始めることにした。
コロナバブルのおかげで株が値上がりし、資産が3000万円に到達した。2020年に400万円増え、2021年に600万円増えたので、2年で1000万円増えている。
FIREを意識するようになって家計を見直したこと、コロナで外出が減ったことも影響し、手取り収入に対する支出の割合が50%になった(2019年以前は40%以下)。
なお2021年後半にはTwitterで話題になっていたレバナスを50万円分購入し、今では半額になってしまった。
2年続けた不妊治療の甲斐あって、息子が誕生した。息子が産まれたことで支出が増えるかと思ったが、今のところあまり変わっていない。
国や会社から手当金が貰えるようになり、外出や外食の頻度がさらに減ったので、それらのお金がおむつやミルクに消えることになった。息子の服やおもちゃなどはメルカリで安く購入し、ベビーカーは人から貰った。
3か月ほど育休を貰って育児をした。最初の頃は、自分の人生はこれで良かったのだろうかという葛藤があったが、4か月目くらいになると息子を愛おしく感じるようになった。
2023年まではジュニアNISAに入金できるため、2年分の160万円を入金した。
仕事のストレスが強かったため、将来サイドFIREできるように副業を始めた。始めた当初は一か月に60時間労働して6万円稼いでいたが、徐々に効率アップし、2022年の後半には一か月に40時間労働して12万円稼いだ。
副業を始めたことでFIREできる目標年齢が大幅に下がり、34歳で仕事を辞めてしまおうかと考えていた。
2022年は株価が下がったものの、急激な円安のおかげで資産が伸び、4000万円に到達した。資産の8割以上をドル資産にしていたのが良かった。
また転職はしていないが、仕事の内容が大きく変わったことでストレスが無くなった。34歳で仕事を辞める計画は先延ばしすることにした。
副業に対するモチベーションも下がったが、今後のことを考えると続けた方が良さそうなので一か月に20時間労働して5万円稼いでいる。
資産を築く方程式が以下だとすると、重要度合いは収入と支出が40%ずつ、残りの20%が投資というイメージ。
実際のところ収入ー支出で毎年300万円ほどになっており、投資の増分は100万円ほど。2021年は300万円増えたので例外もある。投資資産が増えるほど福利効果を感じられるようになるというが、減少するリスクも高まるのであまり安心感は無い。
家は今も今後も賃貸アパートの予定。妻は一軒家に憧れがあったが、理想の家を手に入れるには1億円かかることをYouTubeで知り、中途半端な家に住むくらいなら賃貸で良いという考えになった。
車も持つ予定はない。ただ子供が産まれると車があれば便利だなと感じることが増えた。電車で人に迷惑をかけることがないし、行動範囲も広がる。それでも車を持たないのは夫婦そろって10年以上のペーパードライバーで、運転すること自体が怖いから。
保険については、妻は家系にがんの経験者が多いため入りたがっている。その話になる度に、保険商品は確率で考えれば損になること、資産があれば保険は不要であることを説明している。
現在保有している資産の割合は以下で、現金以外は米国株と全世界株。
投資信託:25%
毎月の投資額の内訳は以下の通りで、自社株を除けば毎月18万円投資している。なお年2回のボーナスには手を付けず、毎月の投資額の一部となっている。
自社株:20万円(一か月後に売却)
投資信託:8.3万円
ETF:7万円
・下落相場では資産額が半減することは覚悟し、絶対に損失確定はしない
投資のことは自分なりに勉強&実践してきたつもりだったが、振り返ってみると収入を増やして支出を減らす方が効果的だった。今後も資産が増えれば福利効果を強く実感できるかもしれない。
資産の増減には昔ほど動揺しなくなった。大学生のとき30万溶かしたのはかなりショックだったが、今では30万円程度の増減は日常茶飯事。たまに大きく動いたときには1日に100万増減する。動揺しないのはインデックス投資に対する信頼が強いため。
将来の目標は息子が小学生になるまでに仕事を退職することと、息子に1億円の資産を残すこと。
これからの時代は子にお金を残さないといろいろ厳しいかなと思っている。ただ息子がお金を無駄遣いするような性格だったら、あまり残さず夫婦で高級老人ホームに入りたい。
youtubeの面白いコメントをランキング形式で表示するサイトを作った。
以下が特徴
URLはこれ
SOUL’d OUTの楽曲動画についてたネタコメントを見てこんな面白いコメントがYoutubeに眠っているのかと感動してもっと面白いコメントを発掘したいと思ったため。
そう思ったのが数年前で、最近になってChatGPTに相談してみたらなんかやりたいことが実現できそうな気がしてきたから作った。
ChatGPTに以下のことを教えてもらいながら構築した。
思いのほか自分が面白いと思うコメントは集まらなかった。あんまりうまくいかないなという感想。でもたまに面白いコメントが拾えているので、スコア計算式やフィルタリングを工夫すればもう少し改善するかもと思った。
ChatGPTに相談しながら作ってみると驚くほどすんなりと事が進むので驚いた。昔作りたかったけど作り方が分からなくて諦めてたものがまだあるので順次作っていこうと思った。
ネットでスクレイピングしてきたデータを単純に学習させればAIは賢くなって良い感じの出力出してくれるんでしょ?
と思っていたのだけど、どうも調べていると違っている。
例えば絵描きAIのStableDiffusionで、追加学習させるLoRAがあるが、
顔を中心に切り抜きをする、背景を切り抜くといった手作業が必要となっている。
また画像に偏りがあると、それに引きずられる。
キャラクターだと、同一キャラクターを色んな角度から描いた複数枚の画像が必要になるが、
ある角度ばかり多いとそれに引きずられるといった感じだ。
写真だと、オブジェクト検出くらいだと、人や建物くらいの大雑把なカテゴリー検出では既に駄目で、
髪型の名前や、ファッションの名前など、タグ付けするのに知識の限界を感じる。
(ググれバカ、ChatGPTに聞けばいいという人は是非とも網羅的にタグ付けしたデータセットを出して人類に貢献して欲しい)
そして、ネットにはそれほど高品質なデータは、案外ないのではないか。
フォトリアルな人物写真を出したいとした場合、光をどのように当てるのかという知識は、普通の人には無い。
ストロボ直射、MoLAのようなオパライトなのか、白ホリで2,3mのディフューザーで撮ったのか、画像の範囲外のものから推測しないといけない。
ChatGPTの質疑応答が凄いというので、オープンなモデルも出てきているが、
ファインチューニングするのに、質問と回答をセットにしたデータセットを作らないといけないというのを見た。
単純にドキュメント食わせれば、良い感じに質問答えてくれるようになるんじゃないの?
と思ってたら違ってたわけだ。
俺はもう社会人20年選手なのに鳴かず飛ばずの生活を送ってる。
何度か思い切って新しいことをしようと試みたがどれもうまくいかなかったんだよね。
ネットではエンジニアがもてはやされていて気になって調べてみたがどれも難しそうで俺には手が出せなかった。
それでも教材をいくつか買い漁り写経を何度かやってみたんだよ。
そうやってサンプルに毛が生えたようなちっこいプログラムを5個くらい作ったんかな。
プログラムの開発か、息子の開発かどっちが進展してるのかわからないがなんとかFANZAをスクレイピングした。
そんで動画の一覧を作ったりしてるうちに俺でもなんかサービスと呼べるものを作りたいなと思ってきたんだよね。
それから作っては直し作っては直しを10回くらいやってなんとか形になったのが https://fanz-tok.com/ というウェブサービス。
Tiktokみたいに動画をフリップしながら永遠に見続けられるよ笑
使い勝手とか各人の好みがあるだろうから意見くれたらどんどこ改善していく。
まさにこんなサービスが欲しかったんだよなーと俺はもう毎日使ってるw
立ち寄ってみてー
ヤフーに出る。
いささかも驚かない。
これが日本のリベラルフェミやジェンダー平等、人権、包摂の正体。
(続)
暇空茜
@himasoraakane
村木厚子さんが副会長(ほんとどこにでもいるな)の農福連携協会で障害者雇用のソーラーパネルを推してる
https://maff.go.jp/j/shokusan/renewable/energy/einou.html
そらゆりこ逆らえんわ
最終更新
https://twitter.com/himasoraakane/status/1615046771948015616
藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️
@Racer_Kamira
·
(続)
暇空茜
@himasoraakane
村木厚子さんが副会長(ほんとどこにでもいるな)の農福連携協会で障害者雇用のソーラーパネルを推してる
https://maff.go.jp/j/shokusan/renewable/energy/einou.html
そらゆりこ逆らえんわ
藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️
@Racer_Kamira
(続)
藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️
@Racer_Kamira
(続)
藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️
@Racer_Kamira
怖くはない。
お飾りで雇ってないか。
増田を全削除するのであればPower Automation DesktopかSelenium IDEあたりでも使えば可能ですが、中にはブクマを集めた珠玉の増田やブクマは付かなくても割と気に入ってる増田もあるので全削除はしたくありませんでした。
Masuda Deleter
https://github.com/oribeolive/masuda-deleter/
Masuda DeleterはDockerコンテナに環境を作って動くのでDockerが必要です。
M1 Macで動作していますがWindowsは検証できるマシンが手元にないので動作未確認です。
インストールはGitHubのREADMEに書かれたコマンドを実行すればできると思います。
Masuda Deleterははてラボにログインして指定されたページ分の自分の増田の投稿をスクレイピングしてローカルのDBに保存します。
取得された投稿のリストがブラウザで見られるので、そこで削除するものを選んで実行すると、またログインして投稿を削除しにいきます。
ページのアクセスごとに読み込みと遠慮のために1秒から数秒sleepするので少し時間がかかります。
一旦投稿をローカルに保存するという過程があるため副作用として自分の投稿を検索できます。
これにより
が容易になります。
増田にはAPIがないので、IDとパスワードを使ってログインして、表示されている文章をスクレイピングしてくるという原始的なやり方になります。
(2回目からはcookieがある場合はcookieを復元してログイン状態になります。)
ユーザーが知らない外部サイトにクレデンシャルを渡すのは危険であり、サービス運営側としてもパスワードを平文で持ちたくないので、Webサービスとして実装せずセルフサービスとしております。
ユーザーによってローカルの.envファイルに書かれたIDとパスワードを使用する形です。
ソースをオープンしておりますので怪しいことをしていないかも確認ができるかと思います。
一応下にプログレスバーが出ますが、ページ遷移すると見られなくなります。進捗は進捗管理でも確認できます。
取得された投稿はリアルタイムで画面に反映されないのでブラウザをリロードしてください。
増田のID、タイトル、本文の省略、投稿日時、ブクマ数、トラバ数が表示されます。
「あとで消す」投稿をチェックし、「あとで消す」記事をついに消すボタンで削除を実行します。
チェックは別のページに遷移しても有効です。
こちらは実行した時点で表示されているページのみリアルタイムに画面に反映されます。
投稿の全文を見られます。タグ等は取得しないのでテキストのみになります。
投稿を個別に取得してローカルの文章とブクマ数とトラバ数を更新します。
対象の投稿のタイトルを空に、本文をスペース1文字にしにいきます。
処理の進捗(何件中何件処理済みか)を見ることと、処理を停止させることができます。
排他処理(取込と取込、特定IDの削除と同じIDの削除等)にしているので動いていなそうな処理を停止して再度処理を実行するときに使います。
停止する場合は停止ボタンを押すか、それでも停止しそうにない場合は強制停止ボタンを押してください。
「停止」は今行っている最中の処理ではなく次以降の処理を停止するという形になります。
停止ボタンを押したときに4ページ目を取得している場合は、5ページ目の取得を始める前に処理を終了することになります。
そのためプロセスそのものが止まっている場合は停止されません。
「強制停止」はプロセスをkillします。スクリプト名とプロセスIDでプロセスを検索して子プロセスも含めてkillします。
おまけとして、投稿日とブクマ数、投稿日と3ブクマ以上の投稿の件数、投稿時間(hour)ごとの1ブクマ以上の投稿の件数のグラフが見られます。
ブクマが付いた瞬間ではなく投稿日時なので、いつの時期に投稿した、何時に投稿した増田が活きが良いのかを見られる程度です。
集計データを別に持っていないので増田を削除するとグラフに使用されるデータも消えます。
私はこれで多いときには4000件程度あった増田を3000件程度に減らしました。
これを開発する前からも増え続ける増田の削除に日々勤しんでいたので総数はもっと多いはず。
まだまだ削除したいです。
たまに
Message: unknown error: net::ERR_CONNECTION_CLOSED
というSeleniumのエラーが出て処理が実行されないことがあります。再度実行してください。
フロントエンドがレガシーなのでMasuda Deleterの開発に飽きていなければもう少しモダンにリプレースしようと思っています。
使用していないDjango REST frameworkがrequirements.txtに入っているのはその名残です。
Webスクレイピングツールは一般であまり認知されていないが、Webを中心としたIT界隈では常識的なツールであり、端的に言えば登録したWebページを巡回し更新を監視するツールである。
似たようなものにRSSやAtomフィードリーダーなどが存在するものの、Webスクレイピングツールの業界共通認識としては、監視するWebページにRSSやAtomフィードが無くともWebページ情報の差異を過去と現在で計算し、変更の閾値を超えたWebページの更新を通知し、そして保存できるというものである。
変更の閾値という処理が挟まれる理由として、広告などを代表例にWebページ閲覧時の更新の度に変化する可能性があるため1%でも更新が通知されると更新の通知が膨大となるため些細な変更を無視するためだ。
もしWebスクレイピングツールで更新されているページにPDFやJPEGなどのバイナリファイルが存在したとしても、PDFやJPEGなどのバイナリファイルが存在したとき多くの場合Diffと呼ばれる差分検出ツールを用いてバイナリファイル単位で変更があったかどうかを監視している。
Colaboなど現代の多くの団体はWebを活用して運営されているため情報をWebを介して告知するので、暇空茜応援団はそれを逆手に取り情報更新を監視している。
暇空茜応援団が即座にWeb情報の更新へ反応するのはこういった背景があるのだ。
逆に言えばWebページの更新を秒間で行うなど更新通知を飽和させるカウンターなどを想定できるが、閾値を変えればその様なカウンター手法を無視できるため意味がないし、特定のキーワードだけ抽出することも可能なので無駄なリソースとなるため無駄であると忠告しておきたい。