「スクレイピング」を含む日記 RSS

はてなキーワード: スクレイピングとは

2023-08-12

Python入門したんだけどいい参考書教えて

 基礎の基礎は下の動画見て大体わかったと思うんだけど、いざこれから先を学ぼうとすると参考書が多すぎてどうすればいいのかわからない……

 今までプログラミング経験で、興味があるのはAIウェブスクレイピングです。いい参考書教えてくれーーーーー

見た動画 Python入門: 基礎から始める集中講座【プログラミングチュートリアル

https://youtu.be/nnjCkgX_ZPQ

2023-07-08

anond:20230708112717

追記も読んだがデータの扱いが雑すぎる。

riyanorie 京阪神パンレベルが高い話は昔から言われてたし、いきなり陰謀論洗脳に結び付けるのは論理の飛躍では。データでいうなら都市パン消費量神戸京都は上位で、こだわりが強いだろうとの推測は容易に成立する

2人以上世帯対象としたパンの年間消費額は神戸市が38,435円、東京都市部が36,154円と、2,281円しかない。

相手消費量の話をしているんだから消費量に近いデータを使って議論しようぜ。孫引きしてる総務省統計局家計調査地域ランキングhttps://www.stat.go.jp/data/kakei/5.html)に地域別の購入量が掲載されてるだろ?

孫引き元の記事に合わせて2018年から2020年の年平均購入量を見てみると

全国平均 45,465g
京都 54,611g
東京都区部 48,414g

ここから人口あたりの消費量を概算して議論していくのが王道だろう。

あえて年間消費額で議論したいなら、まずは物価水準を補正するべき。家計調査データからパンの購入金額を全体の食料購入金額で除すると、同様に2018年から2020年データでは

全国平均 32.7%
京都 40.0%
東京都区部 31.8%

となり、食料購入額の割合としては1.25倍程度の差があることが分かる。

そしてもう一点。All About記事や元の統計資料では「東京都市部」じゃなくて「東京都区部」となってることに気づいたか統計データ用語を正確に定義しているのだから、いい加減に扱ってはいけない。

食べログスクレイピングの件もだが、適当に思いついたデータネットから引っ張ってくるのではなく、データにどんな意味があるのか考えたほうがいい。今のままではオカルト退治どころかミイラ取りがミイラになってる。

神戸パン屋の話はオカルト(追記あり)

神戸パン屋東京に比べて圧倒的に美味い」みたいな話が盛り上がっているが、現状単なるオカルトであり信憑性は低い。

そもそも神戸には545店舗パン屋がある

食べログで「神戸市 パン」と検索すると545店舗が引っかかる。「神戸パン屋東京より美味い」と言っている人は、この中の何店舗に行ったのだろう? 評判のいい店だけをピックアップしていたら美味いのは当たり前で、本当は

 

 

という手続き検証しなければ「神戸パン屋東京よりも美味い」ことは証明できない。

 

人間感覚器は曖昧

また、人間感覚というのは大変に曖昧もので、先入観によっても味は変わる(参考 : https://agri.mynavi.jp/2019_03_12_62258/)。「神戸パン屋は美味い」という先入観を持って食べると、それだけで美味く感じたりするということだ。

これは味覚に限らない話で、例えばクラシック世界でも、ストラディバリウスやグァルネリといったオールヴィンテージ現代楽器有意差がないことは、ブラインドテストにより何度も証明されている。一流の音楽家が聴き比べをしても差はないし、弾いても差はない。にもかかわらず、オールヴィンテージはいまだにクラシック業界ではありがたがられているのだ。神戸パンも大規模ブラインドテスト実施してみたら同様の結果が出るだろうし、出ても「それでもやっぱり神戸パンは、東京パンより美味い」という説が唱えられ続けるであろう。

 

食べログの点数による検証

これだけだと埒があかないのでひとつ傍証を提出する。

神戸市 パン屋」で食べログ検索すると、各店舗に点数がつけられている。これを集計しスクレイピングして平均点をとったところ、3.2547点だった。

東京都 パン屋」で検索すると5000件近くがヒットしてしまうので、先方のサーバー迷惑をかけないためにもう少し細かいエリアで集計してみよう。

東京エリアは私が思いつきで抽出しただけだが、一部足立区など低いエリアがあるものの、渋谷区港区の平均点は神戸市を上回っており、優位な差がないことが分かる。

もちろん食べログ統計情報に高い信頼性がないのは言うまでもない。だがそれを言い出すと一個人個人的な体験のほうがはるかに信頼はおけず、「食べログの点数で主張をするバカ現るwwww」的な反論をするのなら、より信頼性の低い個人主観否定されるか、食べログ統計情報よりも個人主観が正しいことを証明しなければならないだろう。

 

陰謀論的な話法

こういう話法はまんま陰謀論的な話法であり、強弁されると論破することはできない。オカルトはこういうマウントの隙間に入り込んで勢力を拡大していく。

 

 

確たる証拠もない主張を行い、それを否定すると即座に「人間として瑕疵があるお前には理解できないのだ」という主張に切り替えてくる、これは論法として卑怯であり、真である証明したいのなら、やはり統計的なテスト実施しなければならないのだ。

もっと個人にここまでのことを求めるのは、実質的不可能であることも事実だ。私の話法も「無理な要求を突きつけて相手の口を塞ごうとしている」と取られてもおかしくはない。

なのでデイリーポータルZさんあたり、どうですかね……? 検証記事、バズると思うのですが……!

追記

riyanorie 京阪神パンレベルが高い話は昔から言われてたし、いきなり陰謀論洗脳に結び付けるのは論理の飛躍では。データでいうなら都市パン消費量神戸京都は上位で、こだわりが強いだろうとの推測は容易に成立する

2人以上世帯対象としたパンの年間消費額は神戸市が38,435円、東京都市部が36,154円と、2,281円しかない。全家庭が2人世帯だと仮定しても、1人年間1,141円の差であって、神戸市民と東京都市部民は、月にパンひとつ多く食べるかどうか程度の差しかない。この程度の差で「こだわりが強いだろうとの推測は容易に成立」などしないだろう(データこちらを参照 : https://news.allabout.co.jp/articles/o/28209/)。

2023-07-06

anond:20230706152103

それやってるツイッターバカスクレイピングして大赤字出ただろ

から現在存在していても公開していないという意味

2023-07-02

ツイッター不具合のアレ。

数か月前に、イーロン・マスク自分ツイートの閲覧数が少ないだとか、自動検閲がどうとか一人で騒いでた時期あったやん?

自動検閲については、出来る限り解除できたようで、過激ツイート流れるようになったけど、

閲覧数の少なさについては、それを宥めるようなことを言った技術者が速攻でクビになってたよね。

残された技術者は、たぶん、一般ユーザウェブクライアントを改造して、いっぱいアクセスしていっぱい読まれてるように偽装したんちゃうかな。

その改悪が戻されることなく、世界配信されてしまった結果、世界中のウェブクライアントが膨大なアクセスを繰り返すようになってしまった。

それが今回の原因なのでは?と思ったり。

Twitter障害スクレイピングではなく“自己DDoS”が原因?

https://www.itmedia.co.jp/news/articles/2307/02/news036.html

anond:20230702083008

スクレイピング対策でやってるだけなんだが何言ってるんだ?

テスラ車は普通に利用者エネルギー代含めて金払ってるだろ

ちなみに5ちゃんレディットその他すべてのサイトスクレイピング禁止

アメリカではレディットへのスクレイピングサーバーに負荷をかける行為として判決も出てる

Python覚えたてのジャップツイッター様に迷惑かけてきた問題是正されようとしてんだ

から言わせてもらえばくたばれジャップだよ

2023-06-21

anond:20230621162623

横だけど出納管理と予実管理ができるなら別にマネーフォワードじゃなくてもいいんだよ

複数アカウントをまとめてデータを一元管理して過去データを元に自動仕訳してくれるって点でzaimなり、マネーフォワードなりが楽なだけだと思う

パパッとpythonとかでスクレイピングするスクリプト書けるならそっちのが便利かも

2023-05-28

ChatGPTに求めることはただ一つ

スクレイピング能力の向上

2023-05-24

anond:20230524135958

ブラウジングするWebスクレイピングプログラムなんてpython簡単に書ける

実際、増田を読むことも検索することも、それ自体はChatGPTがプラグイン使って既にできる

じゃあそれ以前の段階でもっと難しい何かがあるはずで、ようするにブラウジング増田技術的には比べる意味のない簡単タスク

2023-05-17

イラストAIだめならそもそも二次創作で金を取るのをやめろ

2024/2/14 タイトル一部変更

自分意見は「二次創作伝統的に許されてるのにイラストAIになった途端許容しないのはダブルスタンダードだろ」という意見が核になってます

なんなら自分二次創作は好きなんですが、「俺の作品!」みたいな面されると反感持つだけです。

とはいえから追記するとゴチャゴチャにしそうなので波線以下文章は手入れてません。

論点ボロボロ

本当にすみません

・お前のお気持ちだろ

仰る通りです

〜〜〜

 「二次創作を有料に描いてる人が文句を言うなってのはお門違い過ぎないかなってね。今回のAI問題点は「『人様の絵』を使うなって感じじゃないの?」とかのたまってるアホがいてイライラして書き始めた。

 自分立場として、

AI話題になるずっと前からfanboxやFantiaのガイドライン許可されていない二次創作で金取ることを批判していた。

イラスト生成AI肯定派だが、あくまでそれは技術進歩としてで、オープンソースとして研究されるべきだったし、クローズドにして金を取るのも、そのAIを使った金儲けも禁止すべきとは思ってる。(ただ、プロンプトのコツみたいなのはイラスト教本みたいな感じだからそれはfanboxでも出していいかなって思っている。)要はAIで金儲けしなければいい。

二次創作のものはどんどんやっていいと思っているが、それで金を受け取るのは違うだろクソ!と思っている。

 

 まとめると嫌儲主義みたいだが、こんな感じ。今回の二次創作はfanboxで公開されてるエロ絵みたいなものを前提に考えてる。

あくまで「AI禁止されないために相手の弱みを突く」ではなく、「二次創作で金取ってるやつがいっちょ前に創作ヅラしてんじゃねえよカス」という立場。もちろんAI絵師は絵を描いてる!なんていう気はサラサラないし、そいつらはネット承認欲求こじらせたアホとすら思っている。

そもそもAI禁止されたところでネット遮断されないんだから中国あたりにスクレイピングされて日本語の通じない相手が新たなイラストAI出すだけだし、規制根本的な解決にならないだろ。

 「AI絵師はこんなひどいことやってるし、こんなクソなんですよ!」といわれた場合、「そうですね。ひどい奴ですね。許せませんね。」となる。俺はイラストAIで金儲けなんてしたこといから、そいつカスだね!で済む。単純な白と黒二元論物事を考える頭Mr.ゲーム&ウォッチがいないことを祈る。

 それでこの前AI規制を訴えたアホがきらら作品エロ二次創作でfanbox・fantia・DLsiteDMMマネタイズしてたのを必死こいて削除してたのを見て思ったけど、最近絵師(笑)はなぜ二次創作で金を取る?

同人誌ならまだ分かるが、データ媒体なら印刷費も郵送もいらねえのに何で金とんだよ。

fanboxはあくま作家支援サービスって、詭弁じゃん。

作家支援なら一次創作だけfanboxで投稿すればいいし、二次創作無料公開すればいいじゃん。

わざわざpixivに本番シーンを抜いた不完全エロ投稿して「続きはfanboxで!」はなんなんだ?どう考えても二次創作エロを商材にしたドスケベサブスクサービスじゃねえか。

 それを俺は昔からおかしくない?」と指摘していた。これはあくまで古臭いヲタクの「二次創作アングラだし、二次創作元の目に入らないようひっそりと楽しめ。金稼ぎなんてもってのほか」という考えから来ている。

それを言うにも事欠いて「二次創作にも作家性は出る」だあ?

AI著作権侵害している」だあ?

ふざけんじゃないよ。

作家性を主張したいんなら一次創作かけよ。

お前がキャラデザインをしたのか?

お前がそのキャラキャラクター性を作り上げたのか?

お前が周囲のキャラクターとのエモーショナル関係性を考えたのか?

お前がそのキャラクターが織りなすストーリーで誰かの心を震わせたのか?

一次創作やる時に気を付けるのはな、「自分世界を読者にいか理解してもらうか」だよ。

その過程を「みんな知ってるあの作品のあのキャラです!」ですっ飛ばしといて創作者気取ってんじゃないよ。

お前がやったのは作品文脈フリーライドしかないのを自覚しろ

「この作品のこのキャラにこんなエッチなことをさせました!」なんてな、作家性もクソもねえし、リスペクトもクソもないよ。キャラクターの消費。

「人様の絵」って、人様の絵を使ってるやつが言える言葉ではない。

 大体ネット二次創作挙げて創作者気取ってるやつは碌な奴じゃない。

自分の考えた一次創作じゃインプレッションもらえないからって、二次創作に頼ってるだけの承認欲求けが発達したつまら人間だろ。

一次創作描いて少ないインプレッションに打ちのめされて自分がつまらない人間であることを自覚しろ

 長々描いてきたが、俺の主張はこうだ。

・「ガイドライン許可されていない二次創作エロ描いてるやつはfanboxやめるか一次創作にとっかえろ」

・「二次創作版権元に迷惑かけないなら好きにやれ」

・「『自分イラスト練習頑張ってきたのに、後から来たAIがイイ感じのイラストかけるようになってずるい!』と思うのは好きにしろ。当然の感情だし、AI悪用する奴が完全に悪い。ただしアホの理論武装をして作家性とか言い出すな。それが言いたきゃ一次創作しろ。」

・「ちなみに一次創作者は好きなだけイラストAI文句つけまくれ。お前にはその権利がある。」

・「二次創作で金を取るな。それはお前が金を取っていい領分を超えている。」

 別にAI批判をしてもいい。確かに法律的には学習はセーフだが、倫理的問題は実際ある。国に禁止を訴えかけてもいい。(他国保有してたら意味がない核みたいなもんだから、俺としてははイラストAIを普及させまくって市場的な価値を下げまくった方が、オリジナルの画風を持ってる人が有利になると思う。)

ただAIが悪いからといって、お前が二次創作で金取ったりすることが許されたわけじゃないのは肝に銘じておけ。

追記

これは100%俺のお気持ちであって、この内容に俺の中の倫理的な正しさはあっても、皆に共有できる正しさはあまりまれていない。(版権迷惑かけなければ二次創作やりまくれ!とはいいわけがない)

そこらへんはきちんと明言しておく。

2023-05-12

個性二次創作しか描かない奴がPixiv非公開にするな

モラルのないAIの使い方、AI学習のための大量スクレイピング対策を取らないPixiv運営への不信感がもとに、数多くのイラストレーターPixivで公開していた作品を非公開にする流れが生まれている。

pixivイラストを非公開にしました」 フォロワー数十万の“有名絵師から発表相次ぐ AI巡る対応に不信感

https://www.itmedia.co.jp/news/articles/2305/08/news068.html

これに対して少しモヤついていた。と思ったら、正しくそのモヤつきを説明できるような記事があった。

画像生成AIクリエーター権利を脅かすと規制訴えた団体理事禁止二次創作イラスト批判され謝罪

https://news.yahoo.co.jp/byline/shinoharashuji/20230429-00347590

AIに対して批判的な態度を取る団体理事が、二次創作禁止されている作品イラストなどで呼びかけを行い、後謝罪したという記事

まさしくこれ。

自分は平気で他人作品二次創作を行っているにもかかわらず、知財権の侵害だなんだと訴えている人がいるように思えた。

実際、今回の非公開騒動の中では、艦これTS(性転換)イラストを多数描いている人が、「Pixiv運営への不信感をもとに~」といった文言作品を非公開にしている者もいた。

会社の温情でクリエイティブ承認欲求を満たせている分際で、クリエイター人権だのどうだの良く言えたものだと思う。

完全にオリジナルイラスト制作している人に対しても思うところはある。

AI自分の絵を学習するのに忌避感を抱く人たち、そういった人たちには、今まで自分の好きなクリエイターの絵柄や色や構図を真似したことがないとは言わせない。

もちろん、真似する側のモラル問題ということはわかる。画像生成AI作品提供しない理由アンケートで、半数以上は「現状の画像生成AIの悪い利用方法を見て」と答えた。

https://twitter.com/you629/status/1641799881164738567

最もな理由だと思う。ただ、作品を公開する限り、誰かが自分の絵を学習する可能性はあるということは念頭に置いてほしい。AI学習人間学習原理がほぼ同じというか、AI学習構造人間学習モデルにしている。スケールが違うだけで、同じことは今までみんな半ば容認していたということ。

そして問題はここからで、41%の他の奴ら。こいつらは現実を正しく認識できているのか不安だ。

「絵柄などの優位性が失われるから

トレンドというものは常に存在するし、AIトレンドが生まれたならそれに埋もれない創意工夫は、クリエイターにとっては半ば義務だと思う。

それを理由AIから学習を拒むのは怠惰だと思う。現代最先端を走る技術に、面と向かって批判を発する資格が無いと思う。

AI開発者への信頼がないから」

それを言い出したらキリがない。AIにかぎらずあらゆる界隈に通ずるものだ。

まぁマシな理由だと思う。懐疑的に思うのは自由だ。

AIが嫌いだから

最も時代から取り残された理由だと思う。今後一切のテクノロジーを利用しないことを条件にその意見は発してほしい。

長々と話したが、今回の騒動で最も気に入らないのは、単に流行りに乗っかって作品を非公開にしている(ようにしか見えない)層。

なんとなく、自分の絵がAI学習されるのは嫌だから非公開にする。

なんとなく、みんなが非公開にしてるから非公開にする。

なんとなく、自分の絵が真似されたら嫌だから非公開にする。

そういった奴ら。過去の絵を見てみたら、一切の個性を感じさせない、判で押したようなテンプレ絵。二次創作

そんな奴らが良くも、人生をかけてオリジナリティを生み出す一流のクリエイターたちの横で抗議活動なんて行えるな?

ちゃんと、なぜこのままモラルのないAIの利用が増えたらまずいかを考えろ。

ちゃんと、非公開にする意義を考えてから非公開にしろ

ちゃんと、自分の絵が説得力を持っているか考えてから主張しろ

あと最後に、

この世の大半の消費者は、自分の利用する製品がどのように作られたなんて気にしないと思う。

自分が読んでいる漫画の、どこまでが作者の作画で、どこまでがアシスタント作画なのか、気にする人は少数だと思う。

機能不具合がなく、不自然さもなければ、たとえ猿が作ったものでも価値生まれる。

このままAIが発達して、イラストレーターたちに何らかの不利益が生じるのは確かそうだ。

ただ、それが消費者にとって何の問題があるんだろうか。

AIの作ったイラストスマホ壁紙にする人はいるだろうし、それがどのように著作権侵害たかなんて気にしないだろう。

この世の大多数を占める消費者に、直接的にしろ間接的にしろ害が生じる、ということを納得させないと、論に力は宿りづらいと思う。

2023-05-10

anond:20230509200546

スクレイピングなりすましが異常に簡単にできることをわかってなさそう 能無しの非生産的無職から今発生している被害暫定的に止めるって考えまでできないんだろうな かわいそ…

2023-05-09

pixivに求められているものまとめ

(詳しく調べた訳じゃないのでツッコミ歓迎です)

AI絵が出すぎ

AI絵は専用のタグがあるので、第一問題AI絵をアップしたくせにタグを付けないやつにある。

フィルタリング強化は当然として、他にpixivにできることとしては、AI絵を検知して自動的タグ付けすることか。

ただこれは技術的にはまだ難しい。日本の一企業には荷が重い

いい感じの通報システムがあれば良さそう(もうある?)

AIに絵をパクられたくない

ある意味ネットコンテンツを公開しつつ「ダウンロード禁止!」と言っているのと同じ滑稽さを感じる。

Pixivに言ったってどうしようもないんだよなぁ。

ただまあ、スクレイピングを難しくする対策可能だし、絵師様に安心して使ってもらえるプラットフォームを目指すなら

ここにもコストかけないといけないんだろうな。

この辺の対策現在進行中のようだ。

AIに絵柄を真似られる、それを販売される

→絵柄を模倣しているか否かの判定なんて人間にも困難である自動判定するのも、技術的にも非常に困難だろう。

まずは通報システムを作って、検証する人員を増やすしかいかな。

特定絵師名を出して、似せた絵柄のAI絵を販売しているアカウントは、取り締まりやすいしとっとと取り締まるべきだろう。

あと、元の絵の一部を塗りつぶしてinpaintで作られた剥ぎコラなどは自動検出できると思う。

・まとめ

pixivにできるのは地味だがコストのかかることばかりで、それを完遂してもせいぜいユーザ流出を止めることしかできない。

明らかにAIによって割を食ってる感じで、大変ですね。

2023-05-08

AI絵師(笑)から見る、反AIバカさ加減と本当の問題点について

AIイラストを描く事を数か月やってみて、反AIバカさ具合ついて大体感覚つかめたか解説するね


●反AIバカさ加減について

AIの人たちが「打倒AI」を掲げてやろうとか語る作戦がある


①わざと手足や体のおかしイラストを書いて、AIを壊せないか!?

AI自分の絵を学習されたくない!

pixivランキング荒らして、反AI嫌がらせしよう


全部無理です。

①もともとお前の絵の人体構造おかしいだろ。とまぁツッコミは入れておきつつ、そもそも生成AIリアルタイム画像を取得しているわけではなく、「既に学習された画像」を使っています

本来であればローカル、つまりお前のPCでも動かせるものを、わざわざネット上にソフトを上げているだけです。なので新バージョン学習されてるならともかく、今更手足をおかしくしても意味ないし

AI学習させる場合は人の目を通して「これは美しい、これは美しくない」と学習されてるので、意味はありません。

②にもつながるのですが、たとえ学習されるにしても「こういう絵を出さないようにしよう」という学習として使われる上に、今では学習用のデータクリーンものにする傾向にあるため、「ダメな絵」の見本としても使われないでしょう。

スクレイピングツイートを見てこの考えに至ったんでしょうがAIリアルタイム画像を取得していないので「特定キャラクターの絵」が出しにくくなるだけで、結局はポチポチ画像めしたり「チルノ画像まとめ画像」をスクレイピングすればいい話で。ちなみに故意ランキング荒らし犯罪です。


特定絵師の追加学習は、罪に問われる恐れはある。でもこれは法律何条とかじゃなくて、知財法目的や通説から推測されるもの

具体的に商業絵師収入を直接減らすような行為であればダメになりそうだけど、

まぁ反AIの人はそこらへんは説明しても分らなそう。ちなみにお前らがいくら訴えようが、そもそも絵で金を稼いでる訳じゃないので意味ないです。

まず反AI二次創作とかアニメキャプチャ消してから批判しようよ。

2023-05-07

Pixiv投稿するとAI絵に学習されるというデマ

アンチAIの人はAI使ったことないからよく分かってないみたいだけど、

Pixiv自体AIにとって話にならないんだよね。学習の参考にならないから。

Pixivの次にヤバいのがTwitterなんだけど、まさかアンチAIなのにTwitterイラストアップしてるマヌケだったりしないよな?

https://b.hatena.ne.jp/entry/s/twitter.com/tadanojako/status/1654676274089197568

AI学習する上で一番重要なのはメタデータの質なので、最近2次元AIは黙って転載サイトdanbooruとか使ってるよ?

danbooru転載元として多いのはPixivTwitterなのでPixiv云々は致命的に間違ってるわけでもないのだが。

本気でアンチAIならTwitterに一切のイラスト投稿しないで活動しないといけないので、

人々に見て貰いフォロワーを増やすことで仕事に繋げるイラストレーターとしては自殺しか無いと思うけど、思想信条問題なら仕方ないかな。

転載サイトトップで見かけたピーチ姫だが、投稿されたPixiv転載先のdanbooruメタデータの差は圧倒的でどちらから学習したほうが精度が高くなりそうかはバカでも理解やすいだろう。

https://www.pixiv.net/artworks/107888278

https://danbooru.donmai.us/posts/6286948

Pixiv

#スーパーマリオ #ピーチ姫

danbooru

#mario (series)

#super mario odyssey

#princess peach

#1girl

#blonde hair

#blue eyes

#breasts

#day

#earrings

#from above

#hat

#high heels

#jewelry

#large breasts

#lips

#long hair

#long skirt

#looking at viewer

#open mouth

#outdoors

#pink lips

#pink skirt

#shirt

#skirt

#smile

#solo

#sun hat

#white headwear

#white shirt

pixiv転載サイトなんとかしてくれという要望なら理解できるのだが、Pixiv悪者にしたら回避できると頭の悪い学習をしてしまっているようだ。

Pixiv規約スクレイピング禁止でも転載され放題な現状なので。

よくわからない第三のイラスト投稿サイト()とやらがスクレイピング禁止してもイラストが集まるなら転載サイト無視してくるよ。

2023-05-04

32歳で資産が4000万円になった

32歳で夫婦合わせた資産が4000万円になりました。

これまでの経緯について、だらだらと書きます

 

家族スペック

夫:32歳、大学院卒、社会人8年目、手取り年収500万円、副業年収75万円

妻:32歳、短大卒、保育士7年目で結婚パート5年目で妊娠出産現在専業主婦

息子:1歳

 

2011年20歳大学2年生):資産60万円

20歳大学2年生の頃から投資を始めることを決意する。

当時ブームになっていたFXを始めることにした。このとき資産は60万円で、最初に入金したのは10万円ほど。バイトで稼いだお金が元手。

大学2年から大学院1年までの約4年間FXに取り組んだが、その割にリスクをとるような取引はしなかったため、最終的にほとんど±0で終わった。

FXで大損した話がネットに溢れていたため慎重になっていたと思う。

ただ、本気で取り組めば稼げるようになるはずだと信じていた。大学時代に数千万円貯めて就職したくないと思っていた。

結局4年費やしても何の成果も得られず、自分投資の才能はないと悟った。

一晩で30万円溶かしたときはショックだった。その次の日に一人で北海道旅行に行く予定で、キャンセルしようかギリギリまで迷ったけど行った。

結果的には行ってよかった。1月だったけど奇跡的な暖冬で、良い傷心旅行になった。

 

から思えばこの経験をしておいて良かったと思う。資産が増減すると自分にどのようなメンタルの変化が起きるか分かった。

若いうちに投資を始めるのは大事。仮に失敗しても元手が少なければ損は少なく、後の人生いくらでも挽回できる。

リスキー投資ができるのは若いうちの特権

 

2016年(25歳、社会人1年目):資産150万円

25歳でメーカー就職した。1年目の年収は300万円台。

大学院2年目のときゲームや専門書の転売半年ほどやって50万円ほど稼ぎ、資産は150万円になった。

このときFXは完全に辞めていた。社会人になったのでリスキー投資ではなく安定投資をすることにした。

投資個別株が主で、特にシステムトレードにはまっていた。

ネットからWebスクレイピング株価データを入手し、自分で決めたルール取引するとどうなるかをシミュレーションするソフトExcelで作った。

頑張って作ったのに、どんなルールを使ってもせいぜい年率4%しか利益にならず、これならインデックス投資したほうがマシだと思って辞めた。

ちなみにFXをやっていた頃から経済ニュースは参考にしなかった。経済ニュースを見て大金持ちになれるなら世の中の経済学者は全員金持ちのはずだがそうはなっていない。そもそも社会人日中仕事をしている状況で経済ニュースなんて見れない。などと言い訳していたが、実際のところは勉強が面倒だっただけ。

 

入社した会社には、10%の奨励金を貰える自社株制度があった。1年目の最初財形貯蓄をしていたが、1年目の終わりに自社株制度を使った良い方法を思いついたので財形貯蓄は止めた。

毎月の収入ボーナスをすべて自社株の購入に充て、次の月に売却するのである。そうすれば奨励10%(税金を引けば8%)分が利益になる。

ドルコスト平均法のように購入時期を分散するだけでなく、売却時期も分散するのでリスクは少ない。

この方法は今も続けているが、毎年30~50万円の利益を生み出してくれている。

 

2017年(26歳、社会人2年目):資産1100万円

ここで資産が大きく増えたのは結婚たかである結婚時は私の資産が300万円で妻の資産が800万円だった。

私の資産が150万円ほど増えた理由は、会社の寮に入っていたため家賃光熱費を大きく節約できたためだ。具体的な金額は覚えていないが、合わせて約3~4万円だったと思う。

妻は結婚するまで7年保育士をしながら800万円貯めた。実家暮らしで、無駄遣いしない性格だったためである

誰もが知るように保育士薄給で激務であるため、結婚を機に辞めた。それから約5年は年収100万のパートを続けていた。

 

結婚価値観のすり合わせが大事だと思うが、それほど苦労はしなかった。結婚からお金の話や将来の話はオープンにしていた。

ただ、妻に財布を握られて投資ができなくなるのが心配で、将来のライフプラン投資で想定されるメリットなどをパワポ資料を作ってプレゼンした。プレゼンについてはかなり気に入ってくれて、投資自由やらせてもらえることになった。

家の家計管理も私がやることになり、毎月の家計簿も付けている。

 

投資については、この時期からインデックス投資をすることにした。海外株、海外債券国内株、国内債券バランスよく保有する形で投資信託を毎月購入していた。

ただ、リスキー投資にも手を出しており、仮想通貨も購入した。当時の仮想通貨バブルで、急上昇したあと急降下する動きをしたため、私は数十万円損して終わった。

 

2020年(29歳、社会人5年目):資産2200万円

新型コロナウイルスが発生した2020年である。またFIREムーブメントが起きた年でもある。

FIRE本で書かれていた内容だが、投資については昔から有名なインデックス投資のやり方のままで目新しさは無かった。ただ、FIRE投資だけでなく収入支出などを含めた、新たなライフスタイルの提案なのだと感じた。

今の家計管理もっと洗練すれば、早期退職できるのも夢ではないと分かった。計算してみると50歳で資産1億円を達成してFIREできる見込み。

家計管理を洗練すると言っても、既に支出はそれなりに切り詰めている状態だった。車を持たず、民間保険には加入せず、携帯格安SIMで、夫婦そろって服も買わない。

減らせる支出は外出や外食ぐらいだったが、コロナのおかげで両方減らすことができた。この年の年間支出は約300万円。

 

投資については、リスク度合いを大きく引き上げた。投資信託の中身を全て米国株や全世界株に変え、資産の9割を投資信託、残りを現金という配分にした。

株式リスクが高く金額の増減が激しいものの、長期的にみた成長率は現金債券より高いと分かった。緊急で必要になる程度の現金が確保できているため、残りは株式にしても問題ないと判断した。

この判断のおかげで2021年には投資利益が300万円になった。なお2021年以外の年の利益は平均100万円ほどであり、2016年以降で利益が50万円を切った年は無い。

 

また2020年不妊治療を始めた。結局子供が生まれるのは2022年となるが、体外受精まで進んだため合計で100万円ほど費やすことになった。

実際は150万円ほどかかったが、市や県から補助金確定申告医療費控除分を引くと、この金額である

不妊治療については結婚後初めて夫婦意見が大きく割れた。これまでも子供の話はよくしており、お互い子供が欲しいと言っていたが、その本気度は違った。

私は子供自然に産まれると思っており、高額な不妊治療をしてまで欲しいと思っていなかった。普通の買い物でお金を払うときは、払うお金に対して妥当なリターンが想定できるかどうかで判断する。しか不妊治療は、言わば高額なギャンブルである

数十万や数百万のお金を費やしたとしても、子供が産まれてくる保証はない。子供が産まれるまでいくらかかるが分からない。そういうお金の使い方が受け入れられなかった。しかも産まれた後は2000~3000万円ほど費やすことになる。

しかし妻にとっての子供は、人生絶対必要ものだった。不妊治療子供ができなければ養子を貰いたいとまで話していた。

私自身は、子供ができなければそういう人生を楽しめば良いと思っていた。しかし妻は、子供がいない人生はただの暇つぶしになると言う。

夫婦幸せを考えるなら子供必要存在なのだと思った。それに私自身も、今後の人生において子供がいないことを後悔するときが来るかもしれないと感じた。そういうわけで不妊治療を始めることにした。

 

2022年31歳、社会人7年目):資産3200万円

コロナバブルのおかげで株が値上がりし、資産が3000万円に到達した。2020年に400万円増え、2021年に600万円増えたので、2年で1000万円増えている。

FIRE意識するようになって家計見直したこと、コロナで外出が減ったことも影響し、手取り収入に対する支出割合50%になった(2019年以前は40%以下)。

なお2021年後半にはTwitter話題になっていたレバナスを50万円分購入し、今では半額になってしまった。

 

2年続けた不妊治療甲斐あって、息子が誕生した。息子が産まれたことで支出が増えるかと思ったが、今のところあまり変わっていない。

国や会社から手当金が貰えるようになり、外出や外食の頻度がさらに減ったので、それらのお金おむつミルクに消えることになった。息子の服やおもちゃなどはメルカリで安く購入し、ベビーカーは人から貰った。

3か月ほど育休を貰って育児をした。最初の頃は、自分人生はこれで良かったのだろうかという葛藤があったが、4か月目くらいになると息子を愛おしく感じるようになった。

2023年まではジュニアNISAに入金できるため、2年分の160万円を入金した。

 

仕事ストレスが強かったため、将来サイドFIREできるように副業を始めた。始めた当初は一か月に60時間労働して6万円稼いでいたが、徐々に効率アップし、2022年の後半には一か月に40時間労働して12万円稼いだ。

副業を始めたことでFIREできる目標年齢が大幅に下がり、34歳で仕事を辞めてしまおうかと考えていた。

 

2023年(32歳、社会人8年目):資産4000万円

2022年株価が下がったものの、急激な円安のおかげで資産が伸び、4000万円に到達した。資産の8割以上をドル資産にしていたのが良かった。

 

また転職はしていないが、仕事の内容が大きく変わったことでストレスが無くなった。34歳で仕事を辞める計画先延ばしすることにした。

副業に対するモチベーションも下がったが、今後のことを考えると続けた方が良さそうなので一か月に20時間労働して5万円稼いでいる。

 

まとめ

資産を築く方程式が以下だとすると、重要度合いは収入支出が40%ずつ、残りの20%が投資というイメージ

資産=(収入支出)×投資

実際のところ収入支出で毎年300万円ほどになっており、投資の増分は100万円ほど。2021年は300万円増えたので例外もある。投資資産が増えるほど福利効果を感じられるようになるというが、減少するリスク高まるのであまり安心感は無い。

 

家は今も今後も賃貸アパートの予定。妻は一軒家に憧れがあったが、理想の家を手に入れるには1億円かかることをYouTubeで知り、中途半端な家に住むくらいなら賃貸で良いという考えになった。

車も持つ予定はない。ただ子供が産まれると車があれば便利だなと感じることが増えた。電車で人に迷惑をかけることがないし、行動範囲も広がる。それでも車を持たないのは夫婦そろって10年以上のペーパードライバーで、運転すること自体が怖いから。

保険については、妻は家系にがんの経験者が多いため入りたがっている。その話になる度に、保険商品確率で考えれば損になること、資産があれば保険不要であることを説明している。

 

現在保有している資産割合は以下で、現金以外は米国株と全世界株。

現金10%

投資信託:25%

ETF50%

企業確定拠出年金:15%

 

毎月の投資額の内訳は以下の通りで、自社株を除けば毎月18万円投資している。なお年2回のボーナスには手を付けず、毎月の投資額の一部となっている。

自社株:20万円(一か月後に売却)

投資信託:8.3万円

ETF:7万円

確定拠出年金マッチング拠出:2.7万円

 

投資マイルールは以下

手取り収入に対する貯蓄率を50%以上にする

総資産10%の現金保有し、それ以外は全て投資する

投資先は海外ETF投資信託、マッチング拠出を主とする

リスク資産に出して良い金額総資産の5%まで

投資資産の配分は米国株:全世界株=5:5とする

資産額の確認は月一の家計簿を付けるタイミングのみ

・下落相場では資産額が半減することは覚悟し、絶対に損失確定はしない

退職高齢になってもポートフォリオ株式75%以上とする

 

投資のことは自分なりに勉強実践してきたつもりだったが、振り返ってみると収入を増やして支出を減らす方が効果的だった。今後も資産が増えれば福利効果を強く実感できるかもしれない。

資産の増減には昔ほど動揺しなくなった。大学生のとき30万溶かしたのはかなりショックだったが、今では30万円程度の増減は日常茶飯事。たまに大きく動いたときには1日に100万増減する。動揺しないのはインデックス投資に対する信頼が強いため。

将来の目標は息子が小学生になるまでに仕事退職することと、息子に1億円の資産を残すこと。

これから時代は子にお金を残さないといろいろ厳しいかなと思っている。ただ息子がお金無駄遣いするような性格だったら、あまり残さず夫婦で高級老人ホームに入りたい。

 

2023-05-02

ChatGPT使ってずっと作ってみたかったWebサイト作った

なに作った

youtube面白いコメントランキング形式で表示するサイトを作った。

以下が特徴

URLはこれ

https://comsen.netlify.app/

なんで作った

SOUL’d OUT楽曲動画についてたネタコメントを見てこんな面白いコメントYoutubeに眠っているのかと感動してもっと面白いコメントを発掘したいと思ったため。

そう思ったのが数年前で、最近になってChatGPTに相談してみたらなんかやりたいことが実現できそうな気がしてきたから作った。

どうやって作った

ChatGPTに以下のことを教えてもらいながら構築した。

作ってみた感想

思いのほか自分面白いと思うコメントは集まらなかった。あんまりうまくいかないなという感想。でもたまに面白いコメントが拾えているので、スコア計算式やフィルタリングを工夫すればもう少し改善するかもと思った。

ChatGPTに相談しながら作ってみると驚くほどすんなりと事が進むので驚いた。昔作りたかったけど作り方が分からなくて諦めてたものがまだあるので順次作っていこうと思った。

僕のITスキル

次になにする

2023-03-31

AIは、AI学習させるためのデータセットを作るのを楽にしてくれるだろうか

ネットスクレイピングしてきたデータを単純に学習させればAIは賢くなって良い感じの出力出してくれるんでしょ?

と思っていたのだけど、どうも調べていると違っている。


例えば絵描きAIのStableDiffusionで、追加学習させるLoRAがあるが、

顔を中心に切り抜きをする、背景を切り抜くといった手作業必要となっている。

また画像に偏りがあると、それに引きずられる。

キャラクターだと、同一キャラクターを色んな角度から描いた複数枚の画像必要になるが、

ある角度ばかり多いとそれに引きずられるといった感じだ。


写真だと、オブジェクト検出くらいだと、人や建物くらいの大雑把なカテゴリー検出では既に駄目で、

写真ピクセル範囲を検出してタグを付けないといけないし、

髪型名前や、ファッション名前など、タグ付けするのに知識限界を感じる。

(ググれバカ、ChatGPTに聞けばいいという人は是非とも網羅的にタグ付けしたデータセットを出して人類に貢献して欲しい)


そして、ネットにはそれほど高品質データは、案外ないのではないか

フォトリアル人物写真を出したいとした場合、光をどのように当てるのかという知識は、普通の人には無い。

ストロボ直射、MoLAのようなオパライトなのか、白ホリで2,3mディフューザーで撮ったのか、画像範囲のものから推測しないといけない。

タグ付け出来るものだろうか。


ChatGPTの質疑応答が凄いというので、オープンモデルも出てきているが、

ファインチューニングするのに、質問と回答をセットにしたデータセットを作らないといけないというのを見た。

単純にドキュメント食わせれば、良い感じに質問答えてくれるようになるんじゃないの?

と思ってたら違ってたわけだ。


本当にAIAI学習させるためのデータセットを楽に作るためのツールを作ってくれるだろうか

2023-02-15

何番煎じかだがFANZAデータエロ動画無限に見れるサービスを作った

俺はもう社会人20年選手なのに鳴かず飛ばず生活を送ってる。

何度か思い切って新しいことをしようと試みたがどれもうまくいかなかったんだよね。

ネットではエンジニアがもてはやされていて気になって調べてみたがどれも難しそうで俺には手が出せなかった。

それでも教材をいくつか買い漁り写経を何度かやってみたんだよ。

  

そうやってサンプルに毛が生えたようなちっこいプログラムを5個くらい作ったんかな。

Qiitaとかをみながら片手でオナニーしながらね。

ときにはFANZAサンプル動画を延々と見てた。

プログラムの開発か、息子の開発かどっちが進展してるのかわからないがなんとかFANZAスクレイピングした。

  

そんで動画の一覧を作ったりしてるうちに俺でもなんかサービスと呼べるものを作りたいなと思ってきたんだよね。

それから作っては直し作っては直しを10回くらいやってなんとか形になったのが https://fanz-tok.com/ というウェブサービス

Tiktokみたいに動画フリップしながら永遠に見続けられるよ笑

ときどきバグってなんか表示がずれるけどリロードすればOK

  

とりあえず作ってみたからおまいらも使ってみてよ。

使い勝手とか各人の好みがあるだろうから意見くれたらどんどこ改善していく。

まさにこんなサービスが欲しかったんだよなーと俺はもう毎日使ってるw

今後はMGSにも対応したいぜ。

  

プログラムってもの面白くなってきた!

立ち寄ってみてー

https://fanz-tok.com/

ログイン ユーザー登録
ようこそ ゲスト さん