「スクレイピング」を含む日記 RSS

はてなキーワード: スクレイピングとは

2023-05-24

anond:20230524135958

ブラウジングするWebスクレイピングプログラムなんてpython簡単に書ける

実際、増田を読むことも検索することも、それ自体はChatGPTがプラグイン使って既にできる

じゃあそれ以前の段階でもっと難しい何かがあるはずで、ようするにブラウジング増田技術的には比べる意味のない簡単タスク

2023-05-17

イラストAIだめならそもそも二次創作で金を取るのをやめろ

2024/2/14 タイトル一部変更

自分意見は「二次創作伝統的に許されてるのにイラストAIになった途端許容しないのはダブルスタンダードだろ」という意見が核になってます

なんなら自分二次創作は好きなんですが、「俺の作品!」みたいな面されると反感持つだけです。

とはいえから追記するとゴチャゴチャにしそうなので波線以下文章は手入れてません。

論点ボロボロ

本当にすみません

・お前のお気持ちだろ

仰る通りです

〜〜〜

 「二次創作を有料に描いてる人が文句を言うなってのはお門違い過ぎないかなってね。今回のAI問題点は「『人様の絵』を使うなって感じじゃないの?」とかのたまってるアホがいてイライラして書き始めた。

 自分立場として、

AI話題になるずっと前からfanboxやFantiaのガイドライン許可されていない二次創作で金取ることを批判していた。

イラスト生成AI肯定派だが、あくまでそれは技術進歩としてで、オープンソースとして研究されるべきだったし、クローズドにして金を取るのも、そのAIを使った金儲けも禁止すべきとは思ってる。(ただ、プロンプトのコツみたいなのはイラスト教本みたいな感じだからそれはfanboxでも出していいかなって思っている。)要はAIで金儲けしなければいい。

二次創作のものはどんどんやっていいと思っているが、それで金を受け取るのは違うだろクソ!と思っている。

 

 まとめると嫌儲主義みたいだが、こんな感じ。今回の二次創作はfanboxで公開されてるエロ絵みたいなものを前提に考えてる。

あくまで「AI禁止されないために相手の弱みを突く」ではなく、「二次創作で金取ってるやつがいっちょ前に創作ヅラしてんじゃねえよカス」という立場。もちろんAI絵師は絵を描いてる!なんていう気はサラサラないし、そいつらはネット承認欲求こじらせたアホとすら思っている。

そもそもAI禁止されたところでネット遮断されないんだから中国あたりにスクレイピングされて日本語の通じない相手が新たなイラストAI出すだけだし、規制根本的な解決にならないだろ。

 「AI絵師はこんなひどいことやってるし、こんなクソなんですよ!」といわれた場合、「そうですね。ひどい奴ですね。許せませんね。」となる。俺はイラストAIで金儲けなんてしたこといから、そいつカスだね!で済む。単純な白と黒二元論物事を考える頭Mr.ゲーム&ウォッチがいないことを祈る。

 それでこの前AI規制を訴えたアホがきらら作品エロ二次創作でfanbox・fantia・DLsiteDMMマネタイズしてたのを必死こいて削除してたのを見て思ったけど、最近絵師(笑)はなぜ二次創作で金を取る?

同人誌ならまだ分かるが、データ媒体なら印刷費も郵送もいらねえのに何で金とんだよ。

fanboxはあくま作家支援サービスって、詭弁じゃん。

作家支援なら一次創作だけfanboxで投稿すればいいし、二次創作無料公開すればいいじゃん。

わざわざpixivに本番シーンを抜いた不完全エロ投稿して「続きはfanboxで!」はなんなんだ?どう考えても二次創作エロを商材にしたドスケベサブスクサービスじゃねえか。

 それを俺は昔からおかしくない?」と指摘していた。これはあくまで古臭いヲタクの「二次創作アングラだし、二次創作元の目に入らないようひっそりと楽しめ。金稼ぎなんてもってのほか」という考えから来ている。

それを言うにも事欠いて「二次創作にも作家性は出る」だあ?

AI著作権侵害している」だあ?

ふざけんじゃないよ。

作家性を主張したいんなら一次創作かけよ。

お前がキャラデザインをしたのか?

お前がそのキャラキャラクター性を作り上げたのか?

お前が周囲のキャラクターとのエモーショナル関係性を考えたのか?

お前がそのキャラクターが織りなすストーリーで誰かの心を震わせたのか?

一次創作やる時に気を付けるのはな、「自分世界を読者にいか理解してもらうか」だよ。

その過程を「みんな知ってるあの作品のあのキャラです!」ですっ飛ばしといて創作者気取ってんじゃないよ。

お前がやったのは作品文脈フリーライドしかないのを自覚しろ

「この作品のこのキャラにこんなエッチなことをさせました!」なんてな、作家性もクソもねえし、リスペクトもクソもないよ。キャラクターの消費。

「人様の絵」って、人様の絵を使ってるやつが言える言葉ではない。

 大体ネット二次創作挙げて創作者気取ってるやつは碌な奴じゃない。

自分の考えた一次創作じゃインプレッションもらえないからって、二次創作に頼ってるだけの承認欲求けが発達したつまら人間だろ。

一次創作描いて少ないインプレッションに打ちのめされて自分がつまらない人間であることを自覚しろ

 長々描いてきたが、俺の主張はこうだ。

・「ガイドライン許可されていない二次創作エロ描いてるやつはfanboxやめるか一次創作にとっかえろ」

・「二次創作版権元に迷惑かけないなら好きにやれ」

・「『自分イラスト練習頑張ってきたのに、後から来たAIがイイ感じのイラストかけるようになってずるい!』と思うのは好きにしろ。当然の感情だし、AI悪用する奴が完全に悪い。ただしアホの理論武装をして作家性とか言い出すな。それが言いたきゃ一次創作しろ。」

・「ちなみに一次創作者は好きなだけイラストAI文句つけまくれ。お前にはその権利がある。」

・「二次創作で金を取るな。それはお前が金を取っていい領分を超えている。」

 別にAI批判をしてもいい。確かに法律的には学習はセーフだが、倫理的問題は実際ある。国に禁止を訴えかけてもいい。(他国保有してたら意味がない核みたいなもんだから、俺としてははイラストAIを普及させまくって市場的な価値を下げまくった方が、オリジナルの画風を持ってる人が有利になると思う。)

ただAIが悪いからといって、お前が二次創作で金取ったりすることが許されたわけじゃないのは肝に銘じておけ。

追記

これは100%俺のお気持ちであって、この内容に俺の中の倫理的な正しさはあっても、皆に共有できる正しさはあまりまれていない。(版権迷惑かけなければ二次創作やりまくれ!とはいいわけがない)

そこらへんはきちんと明言しておく。

2023-05-12

個性二次創作しか描かない奴がPixiv非公開にするな

モラルのないAIの使い方、AI学習のための大量スクレイピング対策を取らないPixiv運営への不信感がもとに、数多くのイラストレーターPixivで公開していた作品を非公開にする流れが生まれている。

pixivイラストを非公開にしました」 フォロワー数十万の“有名絵師から発表相次ぐ AI巡る対応に不信感

https://www.itmedia.co.jp/news/articles/2305/08/news068.html

これに対して少しモヤついていた。と思ったら、正しくそのモヤつきを説明できるような記事があった。

画像生成AIクリエーター権利を脅かすと規制訴えた団体理事禁止二次創作イラスト批判され謝罪

https://news.yahoo.co.jp/byline/shinoharashuji/20230429-00347590

AIに対して批判的な態度を取る団体理事が、二次創作禁止されている作品イラストなどで呼びかけを行い、後謝罪したという記事

まさしくこれ。

自分は平気で他人作品二次創作を行っているにもかかわらず、知財権の侵害だなんだと訴えている人がいるように思えた。

実際、今回の非公開騒動の中では、艦これTS(性転換)イラストを多数描いている人が、「Pixiv運営への不信感をもとに~」といった文言作品を非公開にしている者もいた。

会社の温情でクリエイティブ承認欲求を満たせている分際で、クリエイター人権だのどうだの良く言えたものだと思う。

完全にオリジナルイラスト制作している人に対しても思うところはある。

AI自分の絵を学習するのに忌避感を抱く人たち、そういった人たちには、今まで自分の好きなクリエイターの絵柄や色や構図を真似したことがないとは言わせない。

もちろん、真似する側のモラル問題ということはわかる。画像生成AI作品提供しない理由アンケートで、半数以上は「現状の画像生成AIの悪い利用方法を見て」と答えた。

https://twitter.com/you629/status/1641799881164738567

最もな理由だと思う。ただ、作品を公開する限り、誰かが自分の絵を学習する可能性はあるということは念頭に置いてほしい。AI学習人間学習原理がほぼ同じというか、AI学習構造人間学習モデルにしている。スケールが違うだけで、同じことは今までみんな半ば容認していたということ。

そして問題はここからで、41%の他の奴ら。こいつらは現実を正しく認識できているのか不安だ。

「絵柄などの優位性が失われるから

トレンドというものは常に存在するし、AIトレンドが生まれたならそれに埋もれない創意工夫は、クリエイターにとっては半ば義務だと思う。

それを理由AIから学習を拒むのは怠惰だと思う。現代最先端を走る技術に、面と向かって批判を発する資格が無いと思う。

AI開発者への信頼がないから」

それを言い出したらキリがない。AIにかぎらずあらゆる界隈に通ずるものだ。

まぁマシな理由だと思う。懐疑的に思うのは自由だ。

AIが嫌いだから

最も時代から取り残された理由だと思う。今後一切のテクノロジーを利用しないことを条件にその意見は発してほしい。

長々と話したが、今回の騒動で最も気に入らないのは、単に流行りに乗っかって作品を非公開にしている(ようにしか見えない)層。

なんとなく、自分の絵がAI学習されるのは嫌だから非公開にする。

なんとなく、みんなが非公開にしてるから非公開にする。

なんとなく、自分の絵が真似されたら嫌だから非公開にする。

そういった奴ら。過去の絵を見てみたら、一切の個性を感じさせない、判で押したようなテンプレ絵。二次創作

そんな奴らが良くも、人生をかけてオリジナリティを生み出す一流のクリエイターたちの横で抗議活動なんて行えるな?

ちゃんと、なぜこのままモラルのないAIの利用が増えたらまずいかを考えろ。

ちゃんと、非公開にする意義を考えてから非公開にしろ

ちゃんと、自分の絵が説得力を持っているか考えてから主張しろ

あと最後に、

この世の大半の消費者は、自分の利用する製品がどのように作られたなんて気にしないと思う。

自分が読んでいる漫画の、どこまでが作者の作画で、どこまでがアシスタント作画なのか、気にする人は少数だと思う。

機能不具合がなく、不自然さもなければ、たとえ猿が作ったものでも価値生まれる。

このままAIが発達して、イラストレーターたちに何らかの不利益が生じるのは確かそうだ。

ただ、それが消費者にとって何の問題があるんだろうか。

AIの作ったイラストスマホ壁紙にする人はいるだろうし、それがどのように著作権侵害たかなんて気にしないだろう。

この世の大多数を占める消費者に、直接的にしろ間接的にしろ害が生じる、ということを納得させないと、論に力は宿りづらいと思う。

2023-05-10

anond:20230509200546

スクレイピングなりすましが異常に簡単にできることをわかってなさそう 能無しの非生産的無職から今発生している被害暫定的に止めるって考えまでできないんだろうな かわいそ…

2023-05-09

pixivに求められているものまとめ

(詳しく調べた訳じゃないのでツッコミ歓迎です)

AI絵が出すぎ

AI絵は専用のタグがあるので、第一問題AI絵をアップしたくせにタグを付けないやつにある。

フィルタリング強化は当然として、他にpixivにできることとしては、AI絵を検知して自動的タグ付けすることか。

ただこれは技術的にはまだ難しい。日本の一企業には荷が重い

いい感じの通報システムがあれば良さそう(もうある?)

AIに絵をパクられたくない

ある意味ネットコンテンツを公開しつつ「ダウンロード禁止!」と言っているのと同じ滑稽さを感じる。

Pixivに言ったってどうしようもないんだよなぁ。

ただまあ、スクレイピングを難しくする対策可能だし、絵師様に安心して使ってもらえるプラットフォームを目指すなら

ここにもコストかけないといけないんだろうな。

この辺の対策現在進行中のようだ。

AIに絵柄を真似られる、それを販売される

→絵柄を模倣しているか否かの判定なんて人間にも困難である自動判定するのも、技術的にも非常に困難だろう。

まずは通報システムを作って、検証する人員を増やすしかいかな。

特定絵師名を出して、似せた絵柄のAI絵を販売しているアカウントは、取り締まりやすいしとっとと取り締まるべきだろう。

あと、元の絵の一部を塗りつぶしてinpaintで作られた剥ぎコラなどは自動検出できると思う。

・まとめ

pixivにできるのは地味だがコストのかかることばかりで、それを完遂してもせいぜいユーザ流出を止めることしかできない。

明らかにAIによって割を食ってる感じで、大変ですね。

2023-05-08

AI絵師(笑)から見る、反AIバカさ加減と本当の問題点について

AIイラストを描く事を数か月やってみて、反AIバカさ具合ついて大体感覚つかめたか解説するね


●反AIバカさ加減について

AIの人たちが「打倒AI」を掲げてやろうとか語る作戦がある


①わざと手足や体のおかしイラストを書いて、AIを壊せないか!?

AI自分の絵を学習されたくない!

pixivランキング荒らして、反AI嫌がらせしよう


全部無理です。

①もともとお前の絵の人体構造おかしいだろ。とまぁツッコミは入れておきつつ、そもそも生成AIリアルタイム画像を取得しているわけではなく、「既に学習された画像」を使っています

本来であればローカル、つまりお前のPCでも動かせるものを、わざわざネット上にソフトを上げているだけです。なので新バージョン学習されてるならともかく、今更手足をおかしくしても意味ないし

AI学習させる場合は人の目を通して「これは美しい、これは美しくない」と学習されてるので、意味はありません。

②にもつながるのですが、たとえ学習されるにしても「こういう絵を出さないようにしよう」という学習として使われる上に、今では学習用のデータクリーンものにする傾向にあるため、「ダメな絵」の見本としても使われないでしょう。

スクレイピングツイートを見てこの考えに至ったんでしょうがAIリアルタイム画像を取得していないので「特定キャラクターの絵」が出しにくくなるだけで、結局はポチポチ画像めしたり「チルノ画像まとめ画像」をスクレイピングすればいい話で。ちなみに故意ランキング荒らし犯罪です。


特定絵師の追加学習は、罪に問われる恐れはある。でもこれは法律何条とかじゃなくて、知財法目的や通説から推測されるもの

具体的に商業絵師収入を直接減らすような行為であればダメになりそうだけど、

まぁ反AIの人はそこらへんは説明しても分らなそう。ちなみにお前らがいくら訴えようが、そもそも絵で金を稼いでる訳じゃないので意味ないです。

まず反AI二次創作とかアニメキャプチャ消してから批判しようよ。

2023-05-07

Pixiv投稿するとAI絵に学習されるというデマ

アンチAIの人はAI使ったことないからよく分かってないみたいだけど、

Pixiv自体AIにとって話にならないんだよね。学習の参考にならないから。

Pixivの次にヤバいのがTwitterなんだけど、まさかアンチAIなのにTwitterイラストアップしてるマヌケだったりしないよな?

https://b.hatena.ne.jp/entry/s/twitter.com/tadanojako/status/1654676274089197568

AI学習する上で一番重要なのはメタデータの質なので、最近2次元AIは黙って転載サイトdanbooruとか使ってるよ?

danbooru転載元として多いのはPixivTwitterなのでPixiv云々は致命的に間違ってるわけでもないのだが。

本気でアンチAIならTwitterに一切のイラスト投稿しないで活動しないといけないので、

人々に見て貰いフォロワーを増やすことで仕事に繋げるイラストレーターとしては自殺しか無いと思うけど、思想信条問題なら仕方ないかな。

転載サイトトップで見かけたピーチ姫だが、投稿されたPixiv転載先のdanbooruメタデータの差は圧倒的でどちらから学習したほうが精度が高くなりそうかはバカでも理解やすいだろう。

https://www.pixiv.net/artworks/107888278

https://danbooru.donmai.us/posts/6286948

Pixiv

#スーパーマリオ #ピーチ姫

danbooru

#mario (series)

#super mario odyssey

#princess peach

#1girl

#blonde hair

#blue eyes

#breasts

#day

#earrings

#from above

#hat

#high heels

#jewelry

#large breasts

#lips

#long hair

#long skirt

#looking at viewer

#open mouth

#outdoors

#pink lips

#pink skirt

#shirt

#skirt

#smile

#solo

#sun hat

#white headwear

#white shirt

pixiv転載サイトなんとかしてくれという要望なら理解できるのだが、Pixiv悪者にしたら回避できると頭の悪い学習をしてしまっているようだ。

Pixiv規約スクレイピング禁止でも転載され放題な現状なので。

よくわからない第三のイラスト投稿サイト()とやらがスクレイピング禁止してもイラストが集まるなら転載サイト無視してくるよ。

2023-05-04

32歳で資産が4000万円になった

32歳で夫婦合わせた資産が4000万円になりました。

これまでの経緯について、だらだらと書きます

 

家族スペック

夫:32歳、大学院卒、社会人8年目、手取り年収500万円、副業年収75万円

妻:32歳、短大卒、保育士7年目で結婚パート5年目で妊娠出産現在専業主婦

息子:1歳

 

2011年20歳大学2年生):資産60万円

20歳大学2年生の頃から投資を始めることを決意する。

当時ブームになっていたFXを始めることにした。このとき資産は60万円で、最初に入金したのは10万円ほど。バイトで稼いだお金が元手。

大学2年から大学院1年までの約4年間FXに取り組んだが、その割にリスクをとるような取引はしなかったため、最終的にほとんど±0で終わった。

FXで大損した話がネットに溢れていたため慎重になっていたと思う。

ただ、本気で取り組めば稼げるようになるはずだと信じていた。大学時代に数千万円貯めて就職したくないと思っていた。

結局4年費やしても何の成果も得られず、自分投資の才能はないと悟った。

一晩で30万円溶かしたときはショックだった。その次の日に一人で北海道旅行に行く予定で、キャンセルしようかギリギリまで迷ったけど行った。

結果的には行ってよかった。1月だったけど奇跡的な暖冬で、良い傷心旅行になった。

 

から思えばこの経験をしておいて良かったと思う。資産が増減すると自分にどのようなメンタルの変化が起きるか分かった。

若いうちに投資を始めるのは大事。仮に失敗しても元手が少なければ損は少なく、後の人生いくらでも挽回できる。

リスキー投資ができるのは若いうちの特権

 

2016年(25歳、社会人1年目):資産150万円

25歳でメーカー就職した。1年目の年収は300万円台。

大学院2年目のときゲームや専門書の転売半年ほどやって50万円ほど稼ぎ、資産は150万円になった。

このときFXは完全に辞めていた。社会人になったのでリスキー投資ではなく安定投資をすることにした。

投資個別株が主で、特にシステムトレードにはまっていた。

ネットからWebスクレイピング株価データを入手し、自分で決めたルール取引するとどうなるかをシミュレーションするソフトExcelで作った。

頑張って作ったのに、どんなルールを使ってもせいぜい年率4%しか利益にならず、これならインデックス投資したほうがマシだと思って辞めた。

ちなみにFXをやっていた頃から経済ニュースは参考にしなかった。経済ニュースを見て大金持ちになれるなら世の中の経済学者は全員金持ちのはずだがそうはなっていない。そもそも社会人日中仕事をしている状況で経済ニュースなんて見れない。などと言い訳していたが、実際のところは勉強が面倒だっただけ。

 

入社した会社には、10%の奨励金を貰える自社株制度があった。1年目の最初財形貯蓄をしていたが、1年目の終わりに自社株制度を使った良い方法を思いついたので財形貯蓄は止めた。

毎月の収入ボーナスをすべて自社株の購入に充て、次の月に売却するのである。そうすれば奨励10%(税金を引けば8%)分が利益になる。

ドルコスト平均法のように購入時期を分散するだけでなく、売却時期も分散するのでリスクは少ない。

この方法は今も続けているが、毎年30~50万円の利益を生み出してくれている。

 

2017年(26歳、社会人2年目):資産1100万円

ここで資産が大きく増えたのは結婚たかである結婚時は私の資産が300万円で妻の資産が800万円だった。

私の資産が150万円ほど増えた理由は、会社の寮に入っていたため家賃光熱費を大きく節約できたためだ。具体的な金額は覚えていないが、合わせて約3~4万円だったと思う。

妻は結婚するまで7年保育士をしながら800万円貯めた。実家暮らしで、無駄遣いしない性格だったためである

誰もが知るように保育士薄給で激務であるため、結婚を機に辞めた。それから約5年は年収100万のパートを続けていた。

 

結婚価値観のすり合わせが大事だと思うが、それほど苦労はしなかった。結婚からお金の話や将来の話はオープンにしていた。

ただ、妻に財布を握られて投資ができなくなるのが心配で、将来のライフプラン投資で想定されるメリットなどをパワポ資料を作ってプレゼンした。プレゼンについてはかなり気に入ってくれて、投資自由やらせてもらえることになった。

家の家計管理も私がやることになり、毎月の家計簿も付けている。

 

投資については、この時期からインデックス投資をすることにした。海外株、海外債券国内株、国内債券バランスよく保有する形で投資信託を毎月購入していた。

ただ、リスキー投資にも手を出しており、仮想通貨も購入した。当時の仮想通貨バブルで、急上昇したあと急降下する動きをしたため、私は数十万円損して終わった。

 

2020年(29歳、社会人5年目):資産2200万円

新型コロナウイルスが発生した2020年である。またFIREムーブメントが起きた年でもある。

FIRE本で書かれていた内容だが、投資については昔から有名なインデックス投資のやり方のままで目新しさは無かった。ただ、FIRE投資だけでなく収入支出などを含めた、新たなライフスタイルの提案なのだと感じた。

今の家計管理もっと洗練すれば、早期退職できるのも夢ではないと分かった。計算してみると50歳で資産1億円を達成してFIREできる見込み。

家計管理を洗練すると言っても、既に支出はそれなりに切り詰めている状態だった。車を持たず、民間保険には加入せず、携帯格安SIMで、夫婦そろって服も買わない。

減らせる支出は外出や外食ぐらいだったが、コロナのおかげで両方減らすことができた。この年の年間支出は約300万円。

 

投資については、リスク度合いを大きく引き上げた。投資信託の中身を全て米国株や全世界株に変え、資産の9割を投資信託、残りを現金という配分にした。

株式リスクが高く金額の増減が激しいものの、長期的にみた成長率は現金債券より高いと分かった。緊急で必要になる程度の現金が確保できているため、残りは株式にしても問題ないと判断した。

この判断のおかげで2021年には投資利益が300万円になった。なお2021年以外の年の利益は平均100万円ほどであり、2016年以降で利益が50万円を切った年は無い。

 

また2020年不妊治療を始めた。結局子供が生まれるのは2022年となるが、体外受精まで進んだため合計で100万円ほど費やすことになった。

実際は150万円ほどかかったが、市や県から補助金確定申告医療費控除分を引くと、この金額である

不妊治療については結婚後初めて夫婦意見が大きく割れた。これまでも子供の話はよくしており、お互い子供が欲しいと言っていたが、その本気度は違った。

私は子供自然に産まれると思っており、高額な不妊治療をしてまで欲しいと思っていなかった。普通の買い物でお金を払うときは、払うお金に対して妥当なリターンが想定できるかどうかで判断する。しか不妊治療は、言わば高額なギャンブルである

数十万や数百万のお金を費やしたとしても、子供が産まれてくる保証はない。子供が産まれるまでいくらかかるが分からない。そういうお金の使い方が受け入れられなかった。しかも産まれた後は2000~3000万円ほど費やすことになる。

しかし妻にとっての子供は、人生絶対必要ものだった。不妊治療子供ができなければ養子を貰いたいとまで話していた。

私自身は、子供ができなければそういう人生を楽しめば良いと思っていた。しかし妻は、子供がいない人生はただの暇つぶしになると言う。

夫婦幸せを考えるなら子供必要存在なのだと思った。それに私自身も、今後の人生において子供がいないことを後悔するときが来るかもしれないと感じた。そういうわけで不妊治療を始めることにした。

 

2022年31歳、社会人7年目):資産3200万円

コロナバブルのおかげで株が値上がりし、資産が3000万円に到達した。2020年に400万円増え、2021年に600万円増えたので、2年で1000万円増えている。

FIRE意識するようになって家計見直したこと、コロナで外出が減ったことも影響し、手取り収入に対する支出割合50%になった(2019年以前は40%以下)。

なお2021年後半にはTwitter話題になっていたレバナスを50万円分購入し、今では半額になってしまった。

 

2年続けた不妊治療甲斐あって、息子が誕生した。息子が産まれたことで支出が増えるかと思ったが、今のところあまり変わっていない。

国や会社から手当金が貰えるようになり、外出や外食の頻度がさらに減ったので、それらのお金おむつミルクに消えることになった。息子の服やおもちゃなどはメルカリで安く購入し、ベビーカーは人から貰った。

3か月ほど育休を貰って育児をした。最初の頃は、自分人生はこれで良かったのだろうかという葛藤があったが、4か月目くらいになると息子を愛おしく感じるようになった。

2023年まではジュニアNISAに入金できるため、2年分の160万円を入金した。

 

仕事ストレスが強かったため、将来サイドFIREできるように副業を始めた。始めた当初は一か月に60時間労働して6万円稼いでいたが、徐々に効率アップし、2022年の後半には一か月に40時間労働して12万円稼いだ。

副業を始めたことでFIREできる目標年齢が大幅に下がり、34歳で仕事を辞めてしまおうかと考えていた。

 

2023年(32歳、社会人8年目):資産4000万円

2022年株価が下がったものの、急激な円安のおかげで資産が伸び、4000万円に到達した。資産の8割以上をドル資産にしていたのが良かった。

 

また転職はしていないが、仕事の内容が大きく変わったことでストレスが無くなった。34歳で仕事を辞める計画先延ばしすることにした。

副業に対するモチベーションも下がったが、今後のことを考えると続けた方が良さそうなので一か月に20時間労働して5万円稼いでいる。

 

まとめ

資産を築く方程式が以下だとすると、重要度合いは収入支出が40%ずつ、残りの20%が投資というイメージ

資産=(収入支出)×投資

実際のところ収入支出で毎年300万円ほどになっており、投資の増分は100万円ほど。2021年は300万円増えたので例外もある。投資資産が増えるほど福利効果を感じられるようになるというが、減少するリスク高まるのであまり安心感は無い。

 

家は今も今後も賃貸アパートの予定。妻は一軒家に憧れがあったが、理想の家を手に入れるには1億円かかることをYouTubeで知り、中途半端な家に住むくらいなら賃貸で良いという考えになった。

車も持つ予定はない。ただ子供が産まれると車があれば便利だなと感じることが増えた。電車で人に迷惑をかけることがないし、行動範囲も広がる。それでも車を持たないのは夫婦そろって10年以上のペーパードライバーで、運転すること自体が怖いから。

保険については、妻は家系にがんの経験者が多いため入りたがっている。その話になる度に、保険商品確率で考えれば損になること、資産があれば保険不要であることを説明している。

 

現在保有している資産割合は以下で、現金以外は米国株と全世界株。

現金10%

投資信託:25%

ETF50%

企業確定拠出年金:15%

 

毎月の投資額の内訳は以下の通りで、自社株を除けば毎月18万円投資している。なお年2回のボーナスには手を付けず、毎月の投資額の一部となっている。

自社株:20万円(一か月後に売却)

投資信託:8.3万円

ETF:7万円

確定拠出年金マッチング拠出:2.7万円

 

投資マイルールは以下

手取り収入に対する貯蓄率を50%以上にする

総資産10%の現金保有し、それ以外は全て投資する

投資先は海外ETF投資信託、マッチング拠出を主とする

リスク資産に出して良い金額総資産の5%まで

投資資産の配分は米国株:全世界株=5:5とする

資産額の確認は月一の家計簿を付けるタイミングのみ

・下落相場では資産額が半減することは覚悟し、絶対に損失確定はしない

退職高齢になってもポートフォリオ株式75%以上とする

 

投資のことは自分なりに勉強実践してきたつもりだったが、振り返ってみると収入を増やして支出を減らす方が効果的だった。今後も資産が増えれば福利効果を強く実感できるかもしれない。

資産の増減には昔ほど動揺しなくなった。大学生のとき30万溶かしたのはかなりショックだったが、今では30万円程度の増減は日常茶飯事。たまに大きく動いたときには1日に100万増減する。動揺しないのはインデックス投資に対する信頼が強いため。

将来の目標は息子が小学生になるまでに仕事退職することと、息子に1億円の資産を残すこと。

これから時代は子にお金を残さないといろいろ厳しいかなと思っている。ただ息子がお金無駄遣いするような性格だったら、あまり残さず夫婦で高級老人ホームに入りたい。

 

2023-05-02

ChatGPT使ってずっと作ってみたかったWebサイト作った

なに作った

youtube面白いコメントランキング形式で表示するサイトを作った。

以下が特徴

URLはこれ

https://comsen.netlify.app/

なんで作った

SOUL’d OUT楽曲動画についてたネタコメントを見てこんな面白いコメントYoutubeに眠っているのかと感動してもっと面白いコメントを発掘したいと思ったため。

そう思ったのが数年前で、最近になってChatGPTに相談してみたらなんかやりたいことが実現できそうな気がしてきたから作った。

どうやって作った

ChatGPTに以下のことを教えてもらいながら構築した。

作ってみた感想

思いのほか自分面白いと思うコメントは集まらなかった。あんまりうまくいかないなという感想。でもたまに面白いコメントが拾えているので、スコア計算式やフィルタリングを工夫すればもう少し改善するかもと思った。

ChatGPTに相談しながら作ってみると驚くほどすんなりと事が進むので驚いた。昔作りたかったけど作り方が分からなくて諦めてたものがまだあるので順次作っていこうと思った。

僕のITスキル

次になにする

2023-03-31

AIは、AI学習させるためのデータセットを作るのを楽にしてくれるだろうか

ネットスクレイピングしてきたデータを単純に学習させればAIは賢くなって良い感じの出力出してくれるんでしょ?

と思っていたのだけど、どうも調べていると違っている。


例えば絵描きAIのStableDiffusionで、追加学習させるLoRAがあるが、

顔を中心に切り抜きをする、背景を切り抜くといった手作業必要となっている。

また画像に偏りがあると、それに引きずられる。

キャラクターだと、同一キャラクターを色んな角度から描いた複数枚の画像必要になるが、

ある角度ばかり多いとそれに引きずられるといった感じだ。


写真だと、オブジェクト検出くらいだと、人や建物くらいの大雑把なカテゴリー検出では既に駄目で、

写真ピクセル範囲を検出してタグを付けないといけないし、

髪型名前や、ファッション名前など、タグ付けするのに知識限界を感じる。

(ググれバカ、ChatGPTに聞けばいいという人は是非とも網羅的にタグ付けしたデータセットを出して人類に貢献して欲しい)


そして、ネットにはそれほど高品質データは、案外ないのではないか

フォトリアル人物写真を出したいとした場合、光をどのように当てるのかという知識は、普通の人には無い。

ストロボ直射、MoLAのようなオパライトなのか、白ホリで2,3mディフューザーで撮ったのか、画像範囲のものから推測しないといけない。

タグ付け出来るものだろうか。


ChatGPTの質疑応答が凄いというので、オープンモデルも出てきているが、

ファインチューニングするのに、質問と回答をセットにしたデータセットを作らないといけないというのを見た。

単純にドキュメント食わせれば、良い感じに質問答えてくれるようになるんじゃないの?

と思ってたら違ってたわけだ。


本当にAIAI学習させるためのデータセットを楽に作るためのツールを作ってくれるだろうか

2023-02-15

何番煎じかだがFANZAデータエロ動画無限に見れるサービスを作った

俺はもう社会人20年選手なのに鳴かず飛ばず生活を送ってる。

何度か思い切って新しいことをしようと試みたがどれもうまくいかなかったんだよね。

ネットではエンジニアがもてはやされていて気になって調べてみたがどれも難しそうで俺には手が出せなかった。

それでも教材をいくつか買い漁り写経を何度かやってみたんだよ。

  

そうやってサンプルに毛が生えたようなちっこいプログラムを5個くらい作ったんかな。

Qiitaとかをみながら片手でオナニーしながらね。

ときにはFANZAサンプル動画を延々と見てた。

プログラムの開発か、息子の開発かどっちが進展してるのかわからないがなんとかFANZAスクレイピングした。

  

そんで動画の一覧を作ったりしてるうちに俺でもなんかサービスと呼べるものを作りたいなと思ってきたんだよね。

それから作っては直し作っては直しを10回くらいやってなんとか形になったのが https://fanz-tok.com/ というウェブサービス

Tiktokみたいに動画フリップしながら永遠に見続けられるよ笑

ときどきバグってなんか表示がずれるけどリロードすればOK

  

とりあえず作ってみたからおまいらも使ってみてよ。

使い勝手とか各人の好みがあるだろうから意見くれたらどんどこ改善していく。

まさにこんなサービスが欲しかったんだよなーと俺はもう毎日使ってるw

今後はMGSにも対応したいぜ。

  

プログラムってもの面白くなってきた!

立ち寄ってみてー

https://fanz-tok.com/

2023-01-26

最寄駅の時刻表を暗記したい

駅に停まるやつ

通過するやつ

快速のやつ

快速だけど途中までのやつ

色々ありすぎる

待ち時間5分以内だと思って行ったら15分待ちとかなると遅刻する

あとちょっとイレギュラーがあって次のになるとびっくりするくらい遅れる

山手線感覚でやっちゃう

 

でも時刻表変わるからなあ

スクレイピングして常時最新のが出るようにするか

何かのアプリで随時見るか

アプリ使うなら検索すれば良いって思うんだけど

乗り換え案内もGoogleマップちょっとした誤差で大きなズレになるんだよなあ

やっぱ秒で時刻表確認したい

遅延は確認できなくていい、そこまで重いものでは無い

2023-01-20

anond:20230119101547

かとえっちぇっちぇよ、ディスレクシアは言いいにきいよ

何とかスレってのはネスレしか日常で言わんのよね

スクレのがスクレイピングやはスクレーパーやらあるもの

2023-01-19

泥棒企業リストSDGsという名の泥棒村木厚子伊藤忠だけ悪者ではない

この税金泥棒に加担した企業法人は多い。

そしてこれがジェンダー平等パリテの正体。

単純に一人の腐敗した女性けが得をする。

税金泥棒する。

そしてAV新法のように女性搾取される。

搾取しているぱっぷすは新聞で褒められる。

ヤフーに出る。

いささかも驚かない。

ネオリベラルフェミ典型的例。

これが日本リベラルフェミジェンダー平等人権包摂の正体。

社会学者は全員このインチキの味方。

村木厚子さんの関係ちょっと調べただけでこれだけ。

呼び掛け人(代表) 若草プロジェクト

取締役 伊藤忠商事株式会社

社外取締役 住友化学株式会社

社外取締役 SOMPOホールディングス株式会社

理事 公益社団法人日本フィランソロピー協会

理事 日本生活協同組合連合会

(続)

暇空茜

@himasoraakane

https://noufuku.or.jp

村木厚子さんが副会長(ほんとどこにでもいるな)の農福連携協会障害者雇用ソーラーパネル推してる

https://maff.go.jp/j/shokusan/renewable/energy/einou.html

そらゆりこ逆らえんわ

最終更新

午前3:02 · 2023年1月17

https://twitter.com/himasoraakane/status/1615046771948015616

藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️

@Racer_Kamira

·

1月17

村木厚子さんの関係ちょっと調べただけでこれだけ。

呼び掛け人(代表) 若草プロジェクト

取締役 伊藤忠商事株式会社

社外取締役 住友化学株式会社

社外取締役 SOMPOホールディングス株式会社

理事 公益社団法人日本フィランソロピー協会

理事 日本生活協同組合連合会

(続)

引用ツイート

暇空茜

@himasoraakane

1月17

https://noufuku.or.jp

村木厚子さんが副会長(ほんとどこにでもいるな)の農福連携協会障害者雇用ソーラーパネル推してる

https://maff.go.jp/j/shokusan/renewable/energy/einou.html

そらゆりこ逆らえんわ

藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️

@Racer_Kamira

理事 公益財団法人プランインターナショナルジャパン

副会長理事 一般社団法人日本農福連携協会

顧問 一般社団法人障害者雇用企業支援協会

顧問 首都圏若者サポートネットワーク

顧問 NPO法人抱樸

評議員 公益財団法人キリン福祉財団

評議員 一般法人・公益法人情報公開共同サイト

(続)

藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️

@Racer_Kamira

評議員 日本生命保険相互会社

アドバイザー 一般社団法人 地方行政リーダーシップ研究会

サポーター パーソルサンクス株式会社

招へい教授 大阪大学男女協働推進センター

教授 津田塾大学総合政策学部客員

委員 中央防災会議防災対策実行会議

支援者 社会福祉法人プロップステーション

(続)

藤原💰かみら🦙S耐2022 RED SEED Audi R8 LMS GT4🦊⛩️

@Racer_Kamira

内閣府 共生政策担当統括官?

厚生労働省事務次官

以上。今の所ネットにあるpdfとかを検索->スクレイピングで動かしてみたけれど出るわ出るわ…怖い。

怖くはない。

単純にこんなに業務ができるわけがない。

自然でどういう雇用形態か。

お飾りで雇ってないか

2023-01-13

増田削除アプリを作った

動機

趣味増田の削除です。

増田を全削除するのであればPower Automation DesktopSelenium IDEあたりでも使えば可能ですが、中にはブクマを集めた珠玉増田ブクマは付かなくても割と気に入ってる増田もあるので全削除はしたくありませんでした。

なので選択的に増田を削除するためのアプリ作りました

アプリ概要

Masuda Deleter

https://github.com/oribeolive/masuda-deleter/

Masuda DeleterはDockerコンテナ環境を作って動くのでDocker必要です。

M1 Mac動作していますWindows検証できるマシンが手元にないので動作未確認です。

インストールGitHubのREADMEに書かれたコマンドを実行すればできると思います

Masuda Deleterははてラボログインして指定されたページ分の自分増田投稿スクレイピングしてローカルDBに保存します。

取得された投稿リストブラウザで見られるので、そこで削除するものを選んで実行すると、またログインして投稿を削除しにいきます

ページのアクセスごとに読み込みと遠慮のために1秒から数秒sleepするので少し時間がかかります

一旦投稿ローカルに保存するという過程があるため副作用として自分投稿検索できます

これにより

が容易になります

増田にはAPIがないので、IDパスワードを使ってログインして、表示されている文章スクレイピングしてくるという原始的なやり方になります

(2回目からcookieがある場合cookie復元してログイン状態になります。)

ユーザーが知らない外部サイトにクレデンシャルを渡すのは危険であり、サービス運営側としてもパスワードを平文で持ちたくないので、Webサービスとして実装せずセルフサービスとしております

ユーザーによってローカルの.envファイルに書かれたIDパスワード使用する形です。

ソースオープンしておりますので怪しいことをしていないか確認ができるかと思います

機能

取込

ページ数を入れて取込ボタンを押すと投稿の取得が始まります

一応下にプログレスバーが出ますが、ページ遷移すると見られなくなります。進捗は進捗管理でも確認できます

取得された投稿リアルタイムで画面に反映されないのでブラウザリロードしてください。

検索

自分増田キーワードブクマ数やトラバ数で検索できます

キーワードは濁点を区別していません。

一覧

増田IDタイトル、本文の省略、投稿日時、ブクマ数、トラバ数が表示されます

ブクマ数やトラバ数でソートできます

あとで消す(選択削除)

「あとで消す」投稿をチェックし、「あとで消す」記事をついに消すボタンで削除を実行します。

チェックは別のページに遷移しても有効です。

「あとで消す」選択全解除ボタンで解除できます

削除を実行すると下にプログレスバーが出ます

こちらは実行した時点で表示されているページのみリアルタイムに画面に反映されます

リロードすれば現時点でのデータが見られます

詳細

投稿の全文を見られますタグ等は取得しないのでテキストのみになります

再読込

投稿個別に取得してローカル文章ブクマ数とトラバ数を更新します。

削除

投稿個別に削除しにいきます

Space Masuda

隠し機能デフォルトではOFF。

対象投稿タイトルを空に、本文をスペース1文字にしにいきます

進捗管理(Progresses)

処理の進捗(何件中何件処理済みか)を見ることと、処理を停止させることができます

排他処理(取込と取込、特定IDの削除と同じIDの削除等)にしているので動いていなそうな処理を停止して再度処理を実行するときに使います

停止する場合は停止ボタンを押すか、それでも停止しそうにない場合強制停止ボタンを押してください。

進捗一覧ではプログレスバーアニメーションはありません。

「停止」は今行っている最中の処理ではなく次以降の処理を停止するという形になります

停止ボタンを押したときに4ページ目を取得している場合は、5ページ目の取得を始める前に処理を終了することになります

そのためプロセスのものが止まっている場合は停止されません。

強制停止」はプロセスをkillします。スクリプト名とプロセスIDプロセス検索して子プロセスも含めてkillします。

グラフ

おまけとして、投稿日とブクマ数、投稿日と3ブクマ以上の投稿件数投稿時間(hour)ごとの1ブクマ以上の投稿件数グラフが見られます

ブクマが付いた瞬間ではなく投稿日時なので、いつの時期に投稿した、何時に投稿した増田が活きが良いのかを見られる程度です。

集計データ別に持っていないので増田を削除するとグラフ使用されるデータも消えます

その他

私はこれで多いときには4000件程度あった増田を3000件程度に減らしました。

これを開発する前からも増え続ける増田の削除に日々勤しんでいたので総数はもっと多いはず。

まだまだ削除したいです。

たまに

Message: unknown error: net::ERR_CONNECTION_CLOSED

というSeleniumエラーが出て処理が実行されないことがあります。再度実行してください。

今後

フロントエンドレガシーなのでMasuda Deleterの開発に飽きていなければもう少しモダンリプレースしようと思っています

使用していないDjango REST frameworkがrequirements.txtに入っているのはその名残です。

anond:20230113161346

どっち派とか関係なく技術者立場から言うとrobots.txt内にサイトに対するスクレイピングルール定義できるんだからこんなこといってたら笑われるぞ

anond:20230113161951

Colaboは自分自身公告Webでやるって言ってるんだよなぁ

自分で作ったルールなので守らないわけにはいかない

暇空茜応援団はそれをわかっていてWebスクレイピングしてる

この点に関してはどうにもならないColaboがはじめたことなので

暇空茜応援団Webスクレイピングを導入していて更新監視している

Webスクレイピングツール一般であまり認知されていないが、Webを中心としたIT界隈では常識的ツールであり、端的に言えば登録したWebページを巡回更新監視するツールである

似たようなものRSSAtomフィードリーダーなどが存在するものの、Webスクレイピングツール業界共通認識としては、監視するWebページにRSSAtomフィードが無くともWebページ情報差異過去現在計算し、変更の閾値を超えたWebページの更新を通知し、そして保存できるというものである

変更の閾値という処理が挟まれ理由として、広告などを代表例にWebページ閲覧時の更新の度に変化する可能性があるため1%でも更新が通知されると更新の通知が膨大となるため些細な変更を無視するためだ。

もしWebスクレイピングツール更新されているページにPDFJPEGなどのバイナリファイル存在したとしても、PDFJPEGなどのバイナリファイル存在したとき多くの場合Diffと呼ばれる差分検出ツールを用いてバイナリファイル単位で変更があったかどうかを監視している。

Colaboなど現代の多くの団体Web活用して運営されているため情報Webを介して告知するので、暇空茜応援団はそれを逆手に取り情報更新監視している。

暇空茜応援団が即座にWeb情報更新へ反応するのはこういった背景があるのだ。

逆に言えばWebページの更新を秒間で行うなど更新通知を飽和させるカウンターなどを想定できるが、閾値を変えればその様なカウンター手法無視できるため意味がないし、特定キーワードだけ抽出することも可能なので無駄リソースとなるため無駄である忠告しておきたい。

2022-12-13

20万~50万のパソコンでできる事って微妙じゃないか

ゲームだけするってのなら高い買い物。

動画編集だと、エンコードは速くなるが、そんなのは放置するだけなので、あまりって感じ。

編集時にカクつかない性能さえあれば、動画素材や編集素材、特殊効果の方にお金を振った方が視聴数が上がる。

音楽だとトラック数増やせるかはSSD転送速度くらいしかなく、ゲーミングPCとはちょっと違ってる。


自動化といっても、個人だとあまりできることがない。

スクレイピング禁止されてなけりゃ、もっと色々できるだろうが。


コア数が増えたとしても、コアを全部フルで使うソフト個人用途だと少ない。


AIが出てきてるが、こちらは性能が全然足りてない。

2022-12-05

最近よく見るスパムサイト

マイナー商品Google検索してみる(例えば古いおもちゃ)

すると、上の方にはアマゾン商品ページがあって(売り切れ)、その下辺りにメルカリ検索結果が出てくる

さらに下の方に、見たことのないドメインながら、その商品を売っていそうなECサイトっぽいサイト複数引っかかる(説明文に価格が書いてある)

試しにクリックすると、説明文のページは出てこず、詐欺っぽい広告サイトリダイレクトされる

おそらくまともなECサイトフリマサイトから商品説明文をスクレイピングして、おとりページを作成していると思われる

これなんとかならんの?

2022-11-21

anond:20221121105039

難しいこと考えなくてええねん、思ったこと言えば

ワイは仕事柄、ツイートスクレイピングするねんけど、妙に客観ぶってツイートより思ったまんまをかくツイートのほうが、総体としてはデータとしておもろいと思うで

レビューもそうやろ

ログイン ユーザー登録
ようこそ ゲスト さん