「抽出」を含む日記 RSS

はてなキーワード: 抽出とは

2024-04-01

anond:20240401161211

精一杯わかりやすくしたんだがなぁ

要は「コンテンツ検索する」のが目的で、「関連性」の順番にソートしたいわけよ

最初の段階で転置インデックスとか近似最近傍法とかを使ってざっくり抽出するんだよ

近似最近傍法を使う場合は、コンテンツベクトルに変換したものを使って検索できるので、キーワードだけではなく、概念検索したりも可能

で、そこでざっと抽出したのが1万件だとしても、ユーザーが最終的に見るのはせいぜいTop100件だろう

そこでLTRという「クエリドキュメントの特徴量からスコア計算する仕組み」を使ってTop100件を抽出して並べ替え

というのが一連の流れ

2024-03-29

creoという3D CAD界の面汚しについて

助けてくれ。

当方10年間CATIAを使ってた者だが異動によりcreoを使用することになった。

ソフトは違えど同じ3D CAD、まあなんとかなるだろうと思っていたが大きな間違いだった。

creo、信じられないほど使いづらいCADでまるで業務にならん。

これマジ?こんなのがハイエンドCAD名乗ってていいの?クソすぎるっしょ。

対応するタブを選択しないと線一本選択できないとか、原点がないとか、座標系が表示されないとか、サーフェス1枚抽出することすらできん。

誰かCATIAのこの操作をcreoで行うにはこうするんだよ、みたいに対比して説明してるサイト動画あれば教えてくれ。

というかCATIAならネットでも結構情報が手に入るけどcreoマジで見つからん

助けて。

2024-03-28

サプリメントなんか駄目!自然が一番!

紅麹だって自然のものだろwwwwwwww

と突っ込まれそうだが、サプリにするために特定のものだけ抽出しようとすると、悪い成分も濃縮される可能性があるってことだよね

2024-03-27

Netflix版「三体」

見終わったけど、原作のⅠ,Ⅱ,Ⅲをドロドロに溶かした後に面白い部分だけを抽出しました、みたいな感じで最高だった。

最早このドラマノベライズ版を「忙しい人の為の三体」として出してほしい。

AI絵師人間絵師の違いが分からん

両者とも特徴抽出して書いているという意味で何も変わらんのでは?

オリジナリティって何?

2024-03-26

anond:20240326154841

カイガラムシ犠牲の上に成り立ってんだぞ!

カイガラムシ可哀想と思うなら、ファイ〇ーミニとか買うんじゃねえぞ!おじさんとの約束だ!

カメムシ目カイガラムシ上科の一部の昆虫特にアジア産のラックカイガラムシ南ヨーロッパケルメスカイガラムシ、メキシココチニールカイガラムシなどのメスの体を乾燥させ、体内に蓄積されている色素化合物を水またはエタノール抽出して色素としたもの

2024-03-24

アメリカの諜報能力は異常

最近アメリカの諜報能力マジで異常なレベルになっている。

最近というのも、例えば1960年代アメリカの諜報能力特に突出したわけではなく、ロシアと同レベルか少し下ぐらいだった。

当時のソ連アメリカ諜報員をかなりの数捕まえていたし(冤罪も多かったが、本物も多かった)、その逆も然りだった。

しか2010年代からアメリカの諜報能力は異常なほど高まっていった。

きっかけはやはり9.11で、あれ以降諜報機関……特にCIA能力が異常に突出していった。

スノーデンの告発においては同盟国ですら盗聴していたことがリークされたが、しか特に何の反発もなし、お咎めなしのような形になった。

思い返せば、もはやどの国ですらアメリカ諜報活動を阻止することなどできないという諦めのようなものを感じさせる出来事だった。米国民ですら監視されているのに、許容するような世論になり、「定着」した。

この定着というのがなかなか末恐ろしいところ。というのもある期間、アメリカミームについて膨大な研究を積み重ねていたんだよね。

例えばCIA米国民に対する諜報なんかは、もはや誰も真剣に考えない。何ならジョークになる。ジョークになるとどんな不謹慎ですら許される(風潮がある)。これが意図的ものなのかすら分からない。

2020年代においては、もはやアメリカがどのような手段諜報活動を行っているのか想像すらもできない。

まり陰謀論の域になるのだが、もはやアメリカがどのように関与してどのように諜報しているのか何の手がかりもない点においては、あまりに上手く溶け込んでいる。

アメリカ諜報活動に基づいて行動しているのだと仮定してみると、もはや個人スマートフォンは筒抜けだと考えてもぬるい域に達している気がする。

これはちょっと信じられない話で、どの諜報機関もそこまでのレベルに達したことはない。

社内統計とかを扱ったことのある人間ならわかると思うが、少ない人数の限られた情報でも膨大な量になり、そしてそれを使えるように処理するのは困難を極める。

だがアメリカは全世界情報でそれをやってのけてしまったと考えるしかない。

あらゆる情報を集め、そして即座に抽出、解析する技術にどれだけの投資をしてきたのかを考えると、今日IT企業ほとんどアメリカ企業なのも納得がいく話ではある。

2024-03-11

結局マスピ顔が最強って訳

追加のLora学習で綺麗系の絵柄を模倣したりしたけど、

結局、おかずガチャするなら定番アニメモデルだけいれて、

マスピにセックス性癖を1つだけと言う単純なプロンプトで回数回すに限る。

最大多数がエロいと感じる絵柄を抽出しているだけあって、

単におかずと言うだけの観点で見れば最高にしこいものをお出しになる。

何も考えるな。マスピに委ねる。マスピは全ての性癖をお赦しになる。

2024-03-09

レシピ見るのにオレンジページ活用してるんだけどこのサイト見づらすぎじゃね?

https://www.orangepage.net/

レシピ見たいだけなのにどこにあるかが分から視線を泳がす

右上のーーーの存在にようやく気付く、押す

なんかずらっと出てくるけど彩色が均一で見づらい、イラつく

レシピ見に行く

レシピ検索入力欄を探す、スクロールダウンするも見つからず戻る

右上にgoogle記事検索があってレシピ検索入力欄はそっちなのかと勘違いして入力する、どうやら違うらしい

ページを戻り再度探す、3回マウスホイールを回したあたりで見つかる、入力欄が細くて分かりづらい

そりゃスルーするわとイラつく

客に探させるレイアウトは本当にクソとしか言いようがない、近年稀に見るクソレイアウトだわこれ

導線的に客の視線はまず左上のオレンジページ.netに行くだろ、

アクセスが多いタブを2~3項目抽出してその横に並べとけよ

レシピ検索欄も一番上に置いとけ

オシャレ気取って自分に酔って客の使い易さをドブに捨ててやがるレイアウトにもうクソホームページオブザマーチ感想が出てこないんだけど

設計した奴は何考えてこんな作りにしてるんだろうな?

敢えて不便にすることでPR記事踏ませようとしてるのか?

設計意図が分かる増田おる?

2024-03-08

ドラゴンボールは、地球の面積比率から計算出来ます

AmazonレビューチャットGPTで書いてもこうならんやろ。なんやこれ

https://www.amazon.co.jp/review/R90RVQQCZVDDA/ref=cm_cr_srp_d_rdp_perm?ie=UTF8&ASIN=B00A47VS5A

龍神七福神仙人も良いと思いますドラゴンボールは、地球の面積比率から計算出来ますロトボールは、たまにキャリオーバーする事で盛り上がるようになっていますが、数学確率統計重要です。

ドラゴンクエスト特集していた少年ジャンプのゆうてい、みやおう、きむこうは、ゆうていがいないと、盛り上がりにかけますロト7のロトボールを、7つそろえる為には、龍神様も重要です。

桃は、安土桃山時代桃谷商店街の活気でも重要です。桃て活気を安定させてるのが分かると思いますドラゴンボールの悪役の桃白白は、良い文字の悪キャラで、黒い服もある天津飯に負けましたが、桃と白のイメージでも、中身の心が重要という事が改めて分かります

太陽拳は、太陽神とある程度仲良くないとできませんが、キャプテン翼音速マッハシュートより上の概念の光のフラッシュシュートは、最高峰シュートですが、より上の理想宇宙の力に関係しなくても、この宇宙はつとまります

天津飯の天は天界の天、天界閻魔天閻魔大王、神と界王の考えの上は、次元の神、時間の神です。

七福神仙人の多い、ロトボールもあうドラゴンボールも良いと思いますセルセルジュニアパワーアップは、セルシードの培養STAP細胞iPS細胞と同様です。

フルーツシリーズも良いと思います

セルセルジュニアは、細胞セル進化のものです、フリーザー名前に似ているフリーズは、フリーズドライ製法のように、フリーズで、凍らせて凍結する方法ですが、瞬間的に、零下まで冷凍することは重要です。ノーベル賞ビオンテックメッセンジャーRNAワクチンは、電子顕微鏡で、医療器具で、ゲノム編集して、培養する技術ですが、副反応ないワクチンをより考慮するであれば、抽出方法検討したほうが良いと思います

役割のあるメッセンジャーRNAmRNAが単離した時に、凍結する事で、綺麗に単離させて分離できます。そして、培養も、併用培養する場合善玉菌のような安全で無害に近い内容が望ましいです。

そして、冷凍技術は、ワクチン保管で重要です。輸送でも重要です。新鮮で美味しい食べ物の為に重要です。スーパーマリオブラザーズも、ニュートン万有引力考慮するとより良いと思いますスーパーマリオブラザーズの前のマリオブラザーズフリーズと、アイスクライマーフリーズも、評価して、副反応のないワクチンと新鮮で美味しい食べ物をまとめて、IT最高峰ユビキタス化が進んだ戸越銀座のように、高圧ボルト電位差のある電線は、地下の位置にしたほうが良いと思います

スーパーサイヤ人は、スーパー野菜人も、褒めているような表現特に良いと思います野菜のベジタブルの名前のようなベジータパワーアップも、野菜を褒めているようで、特に良いと思いますかりん様も、猫を褒めている事からも、動物愛護の考えで、特に良いと思います

ダブルドラゴンドラゴンクエストパズル&ドラゴンドラゴン名称ですが、

上場企業タカラバイオも、昔は、ドラゴン名称です。エンジェルAngel名前のようなAngesのアンジェスワクチン開発で重要です。セル細胞細胞培養ワクチン培養量産につきまして、東京女子医大セルシードとSTAP細胞iPS細胞と、アンジェスタカラバイオワクチン量産培養も、改めて、まとめて、教科書にしたほうが良いと思います

七福神仙人の多い、ロトボールもあうドラゴンボールも良いと思いますセルセルジュニアパワーアップは、セルシードの培養STAP細胞iPS細胞進化と同様です。

2024-03-04

[] クラウドサービス利用時はベンダーロックインに注意せよ

ベンダーロックインとは、特定ベンダー製品を使うことにより、その仕様合致した周辺環境コードを設定してしまい、移行が困難になるような現象

最近、BigQueryを使うことによってこのベンダーロックインにぶち当たった

「使うにはコスト制限があるから、やっぱ自鯖にしよう」となったわけである

BigQuery特有機能を別の環境に移行するには大幅な変更が必要になる

その工数についてはいうまでもないだろう

ベンダーロックインの臭いを嗅ぎ取ったら早めに判断し、避けた方が良い

もし後から「やっぱこれ使いたくない」と言ってすでに依存状態にあるシステムから移行しなければならない場合は、

残念ながら簡単な移行方法は存在しないと言っていい

BigQueryであれば何らかのNoSQLを使うか、スキーマを無理やり抽出してmysql等に変換する方法もあるだろう

そのようなことを自動的に行う有料のサービス存在するかもしれないが、新たなベンダーロックインとならないよう、注意深く仕様を見た方が良い

2024-03-02

anond:20240302142425

実際はあるはずなのにないかのように振る舞う女性の方が多い

これって君の周囲3mの観測以外から出た話なの?

統計的もの

ランダム抽出で2000人以上から集めたデータを基にした話で、追試もされてるん?

AI絵師?とイラストレータについて思うこと

学生時代趣味でヘタクソなイラストを描いていて、

今はITエンジニアで生成AIを使ったり使わなかったりするだけの私が思ったことを書きます

ただどこかに書きたかっただけです。

-----

 

自分自身職業に当てはめて考えてほしい。

あなたのいる業界会社部署、チーム、なんでもいい。

 

他の業界、他の会社部署、チームから

あなたたちのスキルAIロボット学習したので明日から仕事はないよ」

そんな風に言われて納得がいくだろうか?

 

少なくとも私は納得がいかないし、勝手に私を学習してどういうつもりだと不服を申し上げるだろう。

努力して積み上げた技術を持っていれば持っていただけ納得がいかないように思う。

 

でも「AIロボットあなたコピーではない、あなたたちの特徴を抽出しただけだ」と反論されるのである

いか合法正当性があったとしても、不快感を覚え、盗人猛々しいとさえ思えてしまうのではないだろうか。

自身仕事がなくなったのにそんなことを微塵も思わないという人がいたら、とてつもなく心が広いなと私は思う。

 

 

実際、一部のAI絵師?が主張していることは合法正当性があるのだと私は思う。

 

その一方で、イラストレータが持つ万人に認められるようなイラストを描くための技術

一朝一夕で身につくものではなく、たゆまぬ努力の結果であると思う。

 

壁を感じてイラストを描かなくなってしまった私からしたら、

どれだけ頑張っても到底届かないような技術があり尊敬しかない。

 

そんな努力の末に手に入れた技術を持つイラストレータに対して

一部のAI絵師?の主張は正当性を縦にした攻撃という印象を受けたし、

イラストレータの反感をかうのも無理はないと思う。

 

 

逆に、合法正当性があるのに自分を盗人のように言われたらどうだろう。

私は反論するだろうし、一部のAI絵師?が自身正当性を強く主張するのも当然だと思う。

 

でも、人間だって学習するでしょ、という主張は屁理屈じゃないかな。

 

カセットテープビデオテープコピーするのは許されたけど、

CDDVDBDHDDへのデジタルコピーが厳しく制限されてしまたこととどこか似ているような気がするし、

それ以上の何か(努力とか、人間限界みたいなもの)に大きな違いがあるように感じる。

 

 

ではどうすればいいかという話は私には何もなくて、

例えばイラストレータが保護されるべきという話でもないと思う。

 

ひとつ技術で一生食べていけるなんて世界でもないし、

これまでだって様々な職人が、例えば工場機械化等によって職を失ってきたのではないだろうか。

 

残念ながらイラストレータにもその順番が回ってきてしまったのを、

一部のイラストレータは屁理屈をこねて受け入れがたいものとして扱っているように思う。

 

私自身、いつかは自分職業に順番が回ってくるかもしれないし、

自分仕事プライドがあるからこそ、そうなったら同じように振る舞うかもしれない。

 

 

結論特にないけれども、攻撃的になってしま気持ち自分勝手解釈しつつ、

意図的攻撃に利用している人がいたらやめてほしいなと思いつつ、

時代の流れなのだイラストレーターの方々は受け入れていくしかないんだろうなと私は思いました。

 

 

読んでくれてありがとう

2024-03-01

Xのインプレゾンビの残骸最近多くね?

botトレンドワード抽出して適当動物動画付けてポストしてるアレ

恐らく青バッジの月額に対してアカウント収益が無くて青バッジ解除してるっぽいやつが増えてる

あいうのクッソ邪魔なんだけどイーロンなんとかしろカス

2024-02-21

GitHub Copilot使えねー」って言ってる奴はゴミプログラマー

GitHub Copilotは変数名やメソッド名をちゃん規則立てて付けてるとめちゃくちゃ優秀に機能する

例えばダイアログを開くか開かないか変数値を

boolean open

みたいに付けてると微妙なこともあるけど

boolean isDialogOpen

とか付けてるとちゃんと他の場所でも優秀に補完してくれる

他にも、createDataDayっていうメソッドがあって似たようなcreateDataMonthとかが乱立してるとき実装を共有化したいって思ったときなんかは

function createDataBase

ぐらいまで打ち込むと共有部分だけ抽出してくれる

命名規則だけじゃなくて実装アルゴリズムちゃんと整理されて設計されているとこっちがやりたいことを把握して実装してくれる

この辺は例が難しいけれど、なんかCopilotがまともなことを返してこないな、と思う時はこっちの実装微妙場合が多い

整理しなおして分かりやす状態にしておくと綺麗に動いてくれる

Copilot使えねーって言ってる人のソースはほぼ100%こういう最低限のことができてなくて

50%ぐらいの品質かな?」

とか言ってる奴は50%ぐらいの品質命名規則アルゴリズムになってる

なので「Copilot使えます!便利ですよね!」っていうのはプログラマー能力試金石だと思ってる

2024-02-20

ローソンメガホットカフェラテの量が少ない

いまセールで安くなってるので初めてメガサイズに挑戦してみようと、家から2分のローソンウキウキで買ってきたんだけど、めっちゃ量が少ない。

カップはたしかメガサイズコストコドリンクバーで貰えるカップ並に大きいアメリカンサイズ

なのに量が少ないから「えっ、もう抽出終わりなの?」って感じ。

家で重さを測ってみたら約310gだった。

310gって全然メガじゃねえよ! Lサイズだろ!

メガって言われたら500gくらいは期待しちゃうじゃん!!

2024-02-19

anond:20240219211727

アンフェによる投稿フェミニストによる投稿をそれぞれ最低1000件ずつ無作為抽出して法務言語文化専門家比較してもらってから言おうねえ

2024-02-16

anond:20240215202619

そういう意味だと健康にとても良いと言われているサラダオイルのほうが化学的に作られているよね。

原材料(大豆コーン、菜種、オリーブ)をすりつぶして化学溶剤(ヘキサン)と混合してろ過。化学溶剤沸点より高温に熱して溶剤を飛ばす。

化学溶剤猛毒。人体に入ったら即死する。だが製造過程で完全になくなるのであんしんしてもOK。

圧力をかけて抽出するより、溶剤使ったほうが安全なんだけど。クレーマーにギャーギャーいわれるからまり公表してない。

2024-02-13

anond:20240213155020

「600cc ポットで抽出してそこから欲しい量だけカップに入れて売っておくれ、

抽出には必要だったけど飲みきれないから飲まない分のお金も払うから。」

ということで解決してもらえませんか。

anond:20240213121144

紅茶

リーフティでひとりぶんをおいしく抽出するのって大変だよね。つか、無理だろ。

ポットに茶さじ2杯いれて600ccを煎れるのが適量。

 

180ccだったらティーパックのほうが旨い。

ティーパックのほうが旨いのに、ティーパックを供すると客に「バカにすんな」と怒られる。

どうしろと。

ティーバッグでの紅茶の美味しい淹れ方と紅茶党の鬱屈

ティーバッグで紅茶を美味しく入れる方法というのはネットが発達する以前からすでに周知されており、自分も店で出された時は出来る範囲でやっている。

ティーバッグ|紅茶のおいしいいれ方|日東紅茶

https://www.nittoh-tea.com/enjoy/brew/brew02.html

ティーバッグを使ったホットティーのいれ方 | 【神戸紅茶コラムサイト1925年の老舗紅茶メーカーによる紅茶雑学

https://shop.kobetea.co.jp/blog/take_pleasure/pouring/hot/

紅茶プロが教える】ティーバッグ紅茶をとびきり美味しくいれるには | リクナビNEXTジャーナル

https://next.rikunabi.com/journal/20210310_d11_t/

要約するとコツは

・熱々のお湯をつかうこと。出来れば汲んだばかりの水を使えればベスト

カップやポットを温めておき、抽出時の温度を下げないようにすること

抽出中はソーサーなどで蓋をして蒸らすこと

追記

ジャンピング意味無いの?!初めて知ったよ……。

紅茶ジャンピングで味がぐんと美味しくなる。詳しくはこちらの記事を参考に。

紅茶の”ジャンピング”とは? | 【神戸紅茶コラムサイト1925年の老舗紅茶メーカーによる紅茶雑学

https://shop.kobetea.co.jp/blog/2803/

三角ティーバッグが平らなものより優れているといわれるのはこのジャンピングの為の空間が確保されるから

さて、これがティーバッグで淹れるコツになるのだが、紅茶党の自分外食紅茶文句をつけているのは、

珈琲に対するこだわりとの差があるのに同金額提供されること

に集約されている。

まり

・平らなティーバッグ

・冷めたお湯と器

ミルクといいながら珈琲フレッシュ

・を自分で淹れてね

というのを「店主こだわりのブレンド店舗焙煎した一杯」と同金額提供されているからだ。

ここまで極端なことは早々ないが、良いエスプレッソマシーン珈琲自分で淹れるティーバッグの紅茶が同じ料金だったりドリンクのセットとして提供されることはままある。

これが珈琲500円紅茶200円ならまあまあ差が出ても仕方がないと思うのだが、そうではない。だから冷遇されていると思ってしまう。

ブレンドアメリカンのようにダージリンアッサムから選べるようにしろ、などとは言わない。

ただティーバッグで出すにしてももう少し珈琲との格差をなくしてほしい、そう思うのだ。

追記

主に言いたいことは後半なんだけど、珈琲チェーン店だけじゃなくて飲食店全般ありがちなことかな。

id:sds-page さんのブコメがまさにそう!となってる。ありがとう

せめて熱々のお湯を提供してほしい……。

anond:20240213085905

この件でもやっとしてるのはオタクじゃあなくて単なる保守だと思うけどな…

そんでディズニー作品とかもまあそこに片足突っ込んでるけど、

特に有名な作品はその物語がもうすでにそれなりに人々の心に内面化されてたりして、

そこになんか違和感を感じちゃうのは差別とかとまあ全く関係なくはないけどそれとはちょっとまた別の感情があるわけで。

そんでさらリトルマーメイドには原作もっと有名な原作があるわけじゃん?

結末が違うっていうそれはそれで原作原作ファンにとってはもやっとする案件なんだろうけど。ある意味夢小説っていうか…

アンデルセンが見たらどう思うかはしらんけど。

まあそういう人々のもやっとする感情を全て差別意識からだって決めると話がまたややこしいし、

そこは丁寧に明確な差別意識だと思われるものだけを抽出して指摘していかないとこういう話は永遠にまとまらないんじゃあないのかなって思う。

んで逆に黒人アジア人物語白人がやると文化の盗用になったりとかするわけで。

まあ文化の盗用っていうのの理屈もわかるし私も明らかにそれはダメなやつだな?って思うのもあるけど、

じゃあ逆に人魚姫の件は…?っていうとなんかまあ私は別に黒人アリエルだったっていいんじゃねって思うけど、もやっとする人の感情もわからなくはない。

なので明らかにそれは人種差別だろって思われる意見にはちょっと言っとかなきゃかなあってなる時もあるけど、

それ以外のものはそこまで糾弾すべきか?っていうと違うかもなあ…っては思ってる。

2024-02-09

AI絵を作り始めて3日間で分かったこ


やりたかたこ

既存版権キャラの絵を作りたかった。

(できた後どこに公開するとかはノープランで、とにかく絵を作ってみたかった)


結論

不可能ではないが、【要求を満たす学習済みイラスト】が大量に必要

この【要求を満たす学習済みイラスト】というのが肝。


検証過程

例えば「黒い髪の女の子が立っているイラスト」を作りたいのなら、

 「黒い髪」

 「女の子(1人)」

 「立っている」

という3つの要素に分解できる。


予めこういった要素と既存イラストを紐づけて、プログラムに大量に食わせる。

プログラムはそれぞれの要素を学習済みイラストから検索抽出していい感じに融合し、

その結果を出力するというのがAI絵の仕組みなので、

各要素に該当するイラストを1枚でも学習済みならAI絵を作成できる。


裏を返せば、要素に対応する学習済みイラストが1枚もなければAI絵は作れない。

版権キャラともなるとディテールが複雑なので、例えば「中が空洞になっており青色で星形の耳飾りを左耳だけに付けている女の子イラスト」を作りたいとする。

この場合プログラムに対して注文する要素は2つ。

1つは

 「女の子(1人)」

で、こちらは学習済みイラストが大量にヒットすると思われるので作成上の問題はない。


問題はもう1つで、

 「[左耳に] { [中が空洞] [青色] [星形] } 耳飾り 」

となる。

「中が空洞」「青色」「星形」はバラバラの要素にしてはいけない。どれも耳飾りに対して適用されなければいけないので1つの要素にしなければならない。

そしてこの耳飾りは左耳だけに欲しいので、結果的に上のような1つの長い要素となる。

この要素を満たすイラスト学習済みである可能性は限りなく低い。


あるとすれば、同一の版権キャラ二次創作イラストを誰かが描いてくれている場合

それも1枚や2枚では足りない。タッチや向きを何十種類も登録しないと実用的ではない。

版権キャラが正面を向いたイラストだけ学習させると、横向きのイラストを作りたいときに要素がヒットしないか、正面向きの学習済みイラストプログラムが持ってきてしまう。

2Dイラストだけ学習されると、3D風のイラストを作りたいときに(以下略)。


要するに、学習イラスト部分的にでも描ける生身の人間様には叶わないシステムだと実感した。


結論(再掲)

既存版権キャラの絵を作ることは不可能ではないが、【要求を満たす学習済みイラスト】が大量に必要である

2024-02-06

ワクチンツイート分析における「ワクチン賛成派」とは誰か

解答

まとめ(および私見)

人はなぜワクチン反対派になるのか ―コロナ禍におけるワクチンツイート分析

https://www.t.u-tokyo.ac.jp/press/pr2024-02-05-001

研究の内容〉

研究はまず、2021年1月から12月までに収集された「ワクチン」を含む約1億件のツイート収集し、機械学習を用いて「ワクチン賛成ツイート」「ワクチン政策批判ツイート」「ワクチン反対ツイート」の3クラスタ抽出した。次に、「ワクチン反対ツイート」を多くつぶやいたりリツイートしているアカウント特定し、「ワクチン反対ツイート拡散アカウント」として定義した。そして、「ワクチン反対ツイート拡散アカウント」を多くフォローしているユーザを「ワクチン反対派」として定義した。

分析は主に3つの視点から行われた。第1に、ワクチン賛成派と反対派を比較し、反対派の特徴を明らかにした。

ちょっと待て「ワクチン賛成派」って何?

上記プレスリリースの中で「賛成」というワードは4回しか使われておらず、そのいずれにも「賛成派」の定義を示す文というもの存在しない。

幸いにも元論文がPublicで公開されているため、主にMethod項を見てまとめていきたい。

分類方法

1. 「ワクチン」「vaccine」を含む日本語ツイート98,805,971個を取得する。

2. うち2RT以上のツイートのみを検証する。

3. ツイートクラスタリングを行い、20種のクラスターが作成される。

4. 上位3つ(検証ツイートの99%・リツイートの98%を占める)のクラスター(「ワクチン賛成ツイート;pro-vaccine tweets」「ワクチン政策批判ツイート;opposition to the government’s vaccine policy」「ワクチン反対ツイート;anti-vaccine tweets」)を検討する。

5. 上記3クラスターのツイートを行ったアカウントRTしたアカウントを集計する(「ワクチン賛成ツイート拡散アカウント:1,382,065」「政府批判拡散アカウント:248,699」「ワクチン反対ツイート拡散アカウント:196,936」)。

6. 上記3種のアカウントからそれぞれ50,000アカウントずつ無作為抽出し、フォロー中のワクチン反対ツイート拡散アカウント割合を算出する。

7. "ワクチン反対ツイート拡散アカウント/総フォローアカウント"の割合ソートし、上位25%(全体の12.3%以上)を"High anti-vaccine group"、下位25%(全体の0.24%未満)を"Low anti-vaccine group"とする。

ということで増田冒頭の「フォローアカウントのうち、ワクチン反対ツイートをした/RTしたアカウント割合が少ないアカウント」ということになる。

これを「賛成派」という言葉表現するのは実態を表しているようにはみえない。

しかし、元論文においてはこのような表現がほぼされていないといっていい。

基本的日本語プレスリリースにおける「反対派」「賛成派」は上記メソッドで出たHigh group/Low groupとして表現されている。「反ワクチン性が高いグループ」「反ワクチン性が低いグループ」といったところ。

ただ、「ワクチン反対派」に類するフレーズは度々使われている(元からしてHigh/Low anti-vaccine groupだし)。

一方のLow groupでは、anti-vaccineに対してpro-vaccineという表現が使われている。が、ほぼ全ての用法発言ツイートに対してのみ使われており人に対して使われるケースは殆どない(イントロダクションに一回だけある)。

論文では誤解がないような表現にしているにも関わらずプレスリリースで「賛成派」という適切にはみえない表現を使うのはミスリーディングと言われても仕方ないのではないかと感じる。

その他雑な所見

参考文献

Toriumi, F., Sakaki, T., Kobayashi, T. et al. Anti-vaccine rabbit hole leads to political representation: the case of Twitter in Japan. J Comput Soc Sc (2024). https://doi.org/10.1007/s42001-023-00241-8

攻殻機動隊タチコマの声だけ抽出して音声モデル作って

ChatGPTで生成された文章の読み上げをその音声モデルにさせたら面白そう

一般公開は無理だな

ログイン ユーザー登録
ようこそ ゲスト さん