「クラスタリング」を含む日記 RSS

はてなキーワード: クラスタリングとは

2024-06-01

はてなブックマーク卒業しました

正確に言うとプライベートモードにしたただけで、使うのはやめていない。

誰にも読まれることのないコメントを、いかにも☆が付くことを狙って書いてしま自分に驚いているが、さすがに一時的状態だと思う。

距離を置いてみるとブクマカたちの異常性が良く分かる。Twitterのようにクラスタけがされるわけでもない、表舞台しか存在しないプラットフォームが、よくぞこんな長い期間維持されてきたものだ。

普通にブレイクしたWebサービスなら、ユーザ数の桁が増えてクラスタリングなしでは使いものにならなくなっていただろう。といって閑古鳥というわけでもない、中途半端状態を延々長引かせている。変なサービスだ。いくら計算機コストが低くともサポートコストで赤が出そうなものだが。

このまま卒業できると良いんだが……

2024-02-26

anond:20240226095608

過度なクラスタリング疲弊しがちな妻に見せたいが、妻もマイクラやってたんだよな。

マイクラ内でも疲弊してた。

言っても無駄かもしれん。

収納マイクラで学んだ

よく使う物を手前に置く

でっかい倉庫を作るときに奥の方に原木とか石を置くと行くのが面倒になって手前の適当チェストに入れてしま

なので基本的によく使う物ほど手前に収納する

そのためにまず「よく使う物は何か」をしっかり考える

自分はこのワールドで何を目標としているのかを整理して一番使い物、使いたい物は何かを決めて手前に置く

例えばネザライトインゴットはとても貴重だけど別に普段使うことはほぼ無いので奥の方に飾っておけば良い

現実世界でも自分がよく使う物を洗い出すことが収納第一歩になる

大きすぎるチェストを作らない

チェストラーチェスト・樽・シュルカーボックスを量に応じて適切に使い分ける

場所があるから」とラーチェストを作りがちだけれど、スタック出来る物を入れる場合ほとんどの場合がスモールチェスト・樽で十分

下手にラーチェストを作ると「ちょっと一時的に」という感じで別の物を収納しがち

収納する物に対して大きすぎる容器を作らない、ということが大切

大は小を兼ねるが適切では無い

希少物はルールを決めて遵守する

一種類でチェスト必要ブロックは専用チェストを決めて収納すればいいんだけど

「これ、1個か2個しかないんだよな」というものに対してチェストを作るのはもったいない無駄なのでまとめてチェスト収納する

このときに明確なルールを決めて、「ちょっと不便だな」と思ってもそれを遵守する

例えばオークの階段とかオークのハーフブロックがあったとき

階段としてまとめて収納する」

「オークとしてまとめて収納する」

のどちらにするかを明確に決める

このルールはドアやボタンにも適用するし武器にも適用する

ルールを決めたらその通りに必ず収納して例外を作らないことで荷物が散らばることを防ぐ

用途が限られるもの使用する場所の近くに置く

例えばエメラルド交易以外で使わないので交易付近に置いておく

本は交易エンチャントの両方で使うのでその両方に置いておく

エメラルドチェストに入りきらない、ということはほとんど無くて

仮に大量に出来てきたとしてもブロックにしてしまえばいい

使う場所の近くに収納を置くことで使う時に困らないだけではなく

使い終わったときに忘れず片付けられるようになる

過度なクラスタリングをしない

木材系はここ」「石材系はここ」

というようなクラスタリングはするとして

自然物系」「人工物系」とか、複雑なクラスタリングは避ける

それより前述したよく使うかどうかを基準にするか、もしくは適当にさっさと決める

過度なクラスタリングを始めるとクラスタリングすることに時間と労力をかけてしまって

収納のものが疎かになってしま

結果、疲労して「なんでもとりあえず入れとくやつ」を作ってそこに全部ぶち込むことになる

過度に装置化しない

自動仕分け装置を作ったり、ポーション生成機を作ったりすると収納が楽になる場合があるが

作る労力の方が圧倒的に大変なので基本的に導入しなくて良い

もちろん作ることそのものマイクラの楽しみ方なのでそれはそれでいいのだが

2,3周目に突入すると「結局使わないしな」となるので作らなくて良い

それよりも見た目や使いやすさを重視した方が良い

現実世界でいうところの「自動で開閉するゴミ箱」「電動昇降チェスト」なんかがそれにあたる

いらないものは捨てる

ブロック、深層岩、ネザーラックとかはある程度ストックしたら綺麗さっぱり捨てるとして

例えばどうでもいい花とか種とか余ったハーフブロックとかはいっそのこと全部捨てるというルールにしておく

木材系のブロックは燃料になるので自動かまどにぶち込むというのもあり

どうせ原木があれば作れるし花は高山へ行けば手に入る

「今は使わないけど、いつか使うかも」

ではなく

「今は使わないし、いざとなったら手に入る」

という考えで潔く捨てる

そのための便利ゴミ箱を作っておくと良い

現実世界ではそう上手くは行かないが参考にはなる

上記のようなことを現実世界でも実践しているが

実際にはマイクラほど上手く行かない

ただ

マイクラだったらどうするかな」

と考えることでそこそこ収納は上手になった

収納が苦手な人はマイクラをしてみるのがいいかもしれない

2024-02-06

ワクチンツイート分析における「ワクチン賛成派」とは誰か

解答

まとめ(および私見)

人はなぜワクチン反対派になるのか ―コロナ禍におけるワクチンツイート分析

https://www.t.u-tokyo.ac.jp/press/pr2024-02-05-001

研究の内容〉

研究はまず、2021年1月から12月までに収集された「ワクチン」を含む約1億件のツイート収集し、機械学習を用いて「ワクチン賛成ツイート」「ワクチン政策批判ツイート」「ワクチン反対ツイート」の3クラスタ抽出した。次に、「ワクチン反対ツイート」を多くつぶやいたりリツイートしているアカウント特定し、「ワクチン反対ツイート拡散アカウント」として定義した。そして、「ワクチン反対ツイート拡散アカウント」を多くフォローしているユーザを「ワクチン反対派」として定義した。

分析は主に3つの視点から行われた。第1に、ワクチン賛成派と反対派を比較し、反対派の特徴を明らかにした。

ちょっと待て「ワクチン賛成派」って何?

上記プレスリリースの中で「賛成」というワードは4回しか使われておらず、そのいずれにも「賛成派」の定義を示す文というもの存在しない。

幸いにも元論文がPublicで公開されているため、主にMethod項を見てまとめていきたい。

分類方法

1. 「ワクチン」「vaccine」を含む日本語ツイート98,805,971個を取得する。

2. うち2RT以上のツイートのみを検証する。

3. ツイートクラスタリングを行い、20種のクラスターが作成される。

4. 上位3つ(検証ツイートの99%・リツイートの98%を占める)のクラスター(「ワクチン賛成ツイート;pro-vaccine tweets」「ワクチン政策批判ツイート;opposition to the government’s vaccine policy」「ワクチン反対ツイート;anti-vaccine tweets」)を検討する。

5. 上記3クラスターのツイートを行ったアカウントRTしたアカウントを集計する(「ワクチン賛成ツイート拡散アカウント:1,382,065」「政府批判拡散アカウント:248,699」「ワクチン反対ツイート拡散アカウント:196,936」)。

6. 上記3種のアカウントからそれぞれ50,000アカウントずつ無作為抽出し、フォロー中のワクチン反対ツイート拡散アカウント割合を算出する。

7. "ワクチン反対ツイート拡散アカウント/総フォローアカウント"の割合ソートし、上位25%(全体の12.3%以上)を"High anti-vaccine group"、下位25%(全体の0.24%未満)を"Low anti-vaccine group"とする。

ということで増田冒頭の「フォローアカウントのうち、ワクチン反対ツイートをした/RTしたアカウント割合が少ないアカウント」ということになる。

これを「賛成派」という言葉表現するのは実態を表しているようにはみえない。

しかし、元論文においてはこのような表現がほぼされていないといっていい。

基本的日本語プレスリリースにおける「反対派」「賛成派」は上記メソッドで出たHigh group/Low groupとして表現されている。「反ワクチン性が高いグループ」「反ワクチン性が低いグループ」といったところ。

ただ、「ワクチン反対派」に類するフレーズは度々使われている(元からしてHigh/Low anti-vaccine groupだし)。

一方のLow groupでは、anti-vaccineに対してpro-vaccineという表現が使われている。が、ほぼ全ての用法発言ツイートに対してのみ使われており人に対して使われるケースは殆どない(イントロダクションに一回だけある)。

論文では誤解がないような表現にしているにも関わらずプレスリリースで「賛成派」という適切にはみえない表現を使うのはミスリーディングと言われても仕方ないのではないかと感じる。

その他雑な所見

参考文献

Toriumi, F., Sakaki, T., Kobayashi, T. et al. Anti-vaccine rabbit hole leads to political representation: the case of Twitter in Japan. J Comput Soc Sc (2024). https://doi.org/10.1007/s42001-023-00241-8

2023-07-28

anond:20230727192336

幼稚すぎるキモコメント書く奴もSNSコメント欄をベタ世界認識して雑なクラスタリングする増田

現実では両方キツくてキモいのでやめた方がいいとは思います

2023-02-19

anond:20230219190356

再利用クラスタリングも厳しいとか言うから誤解されるんだろ。

再利用クラスタリングが厳しいって根拠なんだよ?

別に、推力がそこまで多くなくても、それこそガスジェネサイクルでできることなら、できるだろ。

雰囲気で、批判してるんじゃねーよ。

どこかの記事でも読んだニワカかな。

2022-07-13

右翼とか左翼って曖昧すぎるよな

本質を表しておらず、歴史上のとある議会座席位置を参照する名称だ。コードレビューでこんな変数名でてきたとしたら修正されるだろ。

だって今、右翼韓国宗教国家中枢に絡みついてるのを有耶無耶にしてて、左翼が激しく糾弾してんだぞ。意味わからんだろ。

ちょっと前まで右翼が「韓国とかありえん」って怒って、左翼が「韓国差別するな」って怒ってなかったか

やはり政治的ポジションってのは表で示されるべきだな。列名が「賛成、反対」で行に各政治的トピックが並んでるやつ。

それをもとにクラスタリングしたら右翼的な固まりだったりはあるんだろうけど。

ただ、クラスタリングする意味は薄いと思う。自分右派だというアイデンティティ帰属意識を持ってしまうと、元々持ってた論理破綻したり、意見多様性が失われたりしそうだから良くないね

2021-12-11

自分よりできる人までlog4j脆弱性の経緯の理解が間違ってる気がしてもにょる

log4j自体問題なのは当然だけど、

ブコメ分散オブジェクト指向と書いてる人がいたけど、

その辺の指摘が正しいのではないかと思うんだけど

そもそもJava分散オブジェクト指向流行したのが問題歴史的な発端だと思ってる

まりRMI(いわゆるRPC)とかCORBA(それは紛れもなくヤツさではないです)とかHORB(産総研だっけ?)とか、

ネットワーク透過だのRPCスケルトンだの、そういう話が発端な気がする

から、なんでそんな変なことわざわざやるの?という話は、

そういう分散オブジェクト指向だのネットワーク透過だの、

まりインターネット上ではマシンは当然ネットワークで繋がってはいるけど、

別々のマシンであって、マシンAとマシンBは分断されている

でも、クラスタリングとかされたネットワークの中で、

マシンAのJavaプロセスマシンB上のJavaクラスを読み込んで実行できたり、

マシンBに肩代わりさせても、それを意識しないように書けると便利だよね、

という話であって、

ぶっちゃけ、今になっても、

例えば異なる言語プロセス通信するためにRPCはあるし、

世の中的に、今はJavaよりイケてると思われてる言語にも、この手のネットワーク透過にする機能とか、

よー知らんけど、クラウドコンピューティング()だなんだの機能としてあっても不思議ではない気がする

昔で言うなら、ソニーのTelescriptとかよー知らんけど、

エージェントだのエージェント指向だのが流行したけど、

ネットワーク上の複数マシン渡り歩くプロセスというかプログラムみたいなのが実現できるのって、

今になって考えてみると脆弱性の温床でしかない気がするし、理解はできる

理解はできるが、じゃあ、まったくメリットがないのかというとそうでもなくて、

しかし、Javaのかつての流行放置されたままになってるとか、そういう問題はあるわけで、

その辺がセブン&アイだったかの、Struts2のOGNLインジェクションもそんな感じで、

ぶっちゃけマシンAからHTTPマシンBのJavaクラスとか実行できたら便利だよね、みたいな話で、

でも、それはマシンAとマシンBが信頼関係があり、

マシンAとマシンBが外のネットワークと敷居があるという前提があるから問題がないのであって、

CGIでもよくあったけど、サーバー側の任意コマンドを実行できるというのは、

サーバー状態監視するとかには便利だけど、当たり前だけど危険だよね、という話であって

眠くてまとまらない…

おやすみ

あ、言い忘れるところだった

知らんけど

2021-07-15

コロナ期間の特定人物言動の変遷を検索できるサイトって無いの?

検索ボックス名前を入れて検索すると、その人物コロナについてどんなメディアでどんなことを言っていたのかが時系列に一覧で出るサイト

いくつかの指標が設けてあって、それについて賛成反対の程度が数値化されて時系列グラフになっていると面白い

数値化のソース記事テキスト解析による。

同じような言説をたどったひとをクラスタリングできたりすると面白い

2021-06-06

anond:20210606190250

つけまくってる人の星の重みを下げたり、機械学習コメントクラスタリングして特定の傾向が強い人の星の重みを下げたりはしてると思う

2021-05-26

anond:20210526083319

一人400台とかの間違いでは?クラスタリングとか、分散とかがあたりまえの時代

ひとり1台だと圧倒的に足りないぞ、Googleじゃねーんだからよ、時代遅れなんだよ

2021-01-30

anond:20210129144738

実現したいことがそこまで定まってるのなら、「自動分類AI」なんておおざっぱな表現じゃなくて

自然言語処理パターン認識クラスタリングみたいな粒度で調べた方が答えにたどり着けそう

2020-09-25

チャートの形でクラスタリングして共通項は何か、各指標のどれが特徴となっているかとか出すみたいなベタ銘柄分析って意外と提供されないし俺が昨日手放したはてな株価が急騰するしもう嫌

2020-09-22

anond:20200922033233

20年以上は現場プログラマーをやっているが停滞を感じたことはない。

DOSが3.3から5へ

メモリEMSになり

インメモリがいまや128Gなどの時代になり32コア64スレッド時代となり、技術はまだまだ伸びていき、C言語ですらC++となりC++11となりC++2Aとなった。

Java

オラクルJava

Android Java時代になり一時期はJavaを名乗れなかったAndroidもついにAndroid JavaJavaを名乗り始め

CUDAも3SLIからさらなるクラスタリングへと踏み出す

(GRID)

2020-09-01

anond:20200901232957

1日あたり40G*クラスタリング台数 ぐらいだった気がする。

ログの簡易集計にすらクラスタリングいるからな

2020-08-22

anond:20200822102351

Twitterはそうやって緩やかにクラスタリングされていくのが特徴だから

フォロワーを(義理フォロー返しとかせずに)厳選して

タイムラインを新着順に切り替えれば

見たくないツイートほとんど流れてこなくなるはずだが

2020-05-25

anond:20200525111503

Twitter発明

フォロー機能によってユーザー毎に「タイムライン」を作り上げて

緩やかなクラスタリングを実現したことなんだよ

それをリコメンドでかき混ぜようとしてることが問題なの

2020-01-04

anond:20200104031644

自己顕示欲は元から強かったよ。

当たり前じゃん、人間なんて自己顕示欲の塊だよ。

Twitter問題点は、

クラスタリングして偏った環境を作り出しつつ、

たとえば炎上しているツイートRTで回ってくるのであったり、

ちょっとした反論リプライがいちいち通知されてくるのであったり、

コメンドで他人お気に入りしたツイートが流れてくるのであったり、

そういった「クラスタを突き破りやすい」機能が揃っているという状況、

相手クラスタの規模を見誤りやすい、

あるいは遠くのクラスタ攻撃してくるように錯覚やす環境になっているというところ。

まり信者側の変化ではなく受信者側の変化として考えるべき。

あとスパブロ厨は死ね

2019-11-21

趣味世界自然学歴によるクラスタが作られてた

自分腐女子なんだけど、そこそこ人のいるジャンルにいた。

そこそこ人がいれば、ジャンル内で、派閥ってほどじゃなくても自然グループできるじゃないですか。同人関係なので、大手を中心にして。

普段ジャンルの話しかしてなかったんだけど、ある人が「わたし高卒から……」って学歴コンプあることを告白したんですよ。

そしたらその人の仲良しグループが次々「わたし高卒なんです」って言い出してね。中心になってる大手含めて。趣味で繋がってるはずなのに、自然クラスタリングされてたんだってびっくりした。

まあ、だからどうだってわけじゃないですけど。

2019-11-20

6あのさ、パソコン認証なんてCPU-IDとかつかえよ

一発じゃん。間違わないし固有IDだし

おまえにはちょっとレべr高い技かもしれないけどCPU-IDつかえばパソコン識別なんて簡単

あとはネットSSL送信してDB登録すれば 顧客判別なんて 超簡単だろ

障害耐性だってクラスタリングとかつかってAmazonにあげとけば、ばっちり

いまはすごい安くユーザー認証できるんだぜ

そんなにかねかからねーよ

アセンブラ使えアセンブラ技術勉強してねーからできねーんだよCPU-IDぐらいひろえろガキ

2018-04-25

任意の立ち上がり波形1ショット×n個を特徴別に分類したい

ざっと眺めた感じではコンデンサの充電曲線みたいなやつと矩形波の立ち上がりみたいなやつ

あとは指数関数みたいな立ち上がりのやつがそれぞれわちゃわちゃある感じ

見ての通り、自分はここらの分野については全くのド素人

10分だけネット眺めて考えた感じでは、フーリエ変換かまして級数の各項にかかっている数字を取り出して、

それでクラスタリングすればいいかなーとか

しかしこっちもとってもド素人なんだなあ

クラスタリング方法としてもk-meansくらいしか知らない

でもデータを眺めた感じでは各クラスタに入るデータ数は、必ずしも同じになるとは限らないんだよな

まあ最悪GWあるし、この仕事が向いてない、ってなっても戻る場所はあるので、

のんびり気軽に考えてみるか

ログイン ユーザー登録
ようこそ ゲスト さん