はてなキーワード: 抽出とは
それは特にO-1グランプリ(沖縄1グランプリ)なる、沖縄ご当地お笑いコンテストを見ているときに感じる。そこで行われている惨状は、恥ずかしくて見ていられない時すらあるほどだ。
そんなひどい感想には、あまりにも個人的な偏見が含まれていると思っているそこの心優しき人も、「ありんくりん」というお笑い芸人は存じあげないであろう。なんとその得体のしれないコンビが0−1グランプリを3度も制覇しているのである。由々しき事態だ。
「ありんくりん」はよしもと沖縄所属のお笑い芸人だ。そもそも沖縄にも吉本があったことに驚かれる方も多いと思う。「ガレッジセール」や「スリムクラブ」などの、世間一般にも認知された沖縄芸人はともに東京吉本所属である。結局のところ、沖縄の才能がある人たちは活動拠点を本土に移してしまうことが多い。
この事実を踏まえると、大阪・東京のどちらでもなく、敢えてよしもと沖縄に所属するということは、よくてご当地テレビお抱え芸人に甘んじる選択に他ならない。歴史が浅いこともあるが、よしもと沖縄から全国に羽ばたいた芸人は存在しないし、今の若手にもその萌芽すら見受けられない。
「ありんくりん」はもともとトリオだったが、一人のメンバーが脱退し、今のコンビになったそうだ。トリオから抜けたメンバーは本土風の笑いがしたかったらしいが、残りのメンバー、つまり現ありんくりんの二人は、沖縄らしいお笑いに拘ったそうだ。
O-1グランプリに出場している多くの芸人が、本家のM-1グランプリにも殆どがネタを使い回しの上で出場している。沖縄芸人は本土風のお笑いをするにしても、沖縄らしいお笑いをするにしても、どちらにせよ、すべてが中途半端に見える。
まず第一に、東京や大阪の芸人がやるようなスタンダードなネタを沖縄芸人がやると、積み上げてきた経験の差が如実に現れ、ただ芸人っぽいものを集めてまとめたようなネタが見られる。それはプロを名乗りつつも、芸人の真似をしているだけだ。これは養成所のライブや大学の学園祭のお笑いライブにも同じ感想になるので、沖縄の芸人特有のものではなく、単純な技術不足と恥ずかしさを捨てきれていない情けなさからくるものだろう。売れている芸人でも養成所時代のネタなんて黒歴史として封印していることのほうが多い。
誰しもはじめから立派な漫才はできない。出来ないことは問題ではない。失敗をしないと成長もない。沖縄の芸人が問題なのは、東京や大阪の芸人がやるようなスタンダードのネタから逃げて、安易に沖縄にすがることだ。それが非常にダサい。
自分たちの個性を模索するのは結構なことだが、彼らの選択はただ勝負から逃げているように見えてしまう。それはおそらく、本人たちも自覚していないことだろう。彼らにこんなことを言うと、顔を真っ赤にし、自分たちは沖縄を愛しているから、沖縄らしいお笑いをすると言うだろう。もしかしたら、匿名で攻撃している私に向かって、「この内地かぶれは黙ってろ!」と叫びだすかもしれない。
「ありんくりん」本人でもないし、何ならファンですらない私が、彼らのネタから彼らがいう沖縄らしさを抽出したところ、
・強烈な訛りと方言(ボケが典型的な沖縄訛りで多くの若者が普通は使わない方言を多用。ツッコミはアメリカとのハーフでこちらも訛っている)
・どこの地元にも存在するような、県民だけに伝わる細かなあるあるネタ(どこどこの交差点は交通ルールが分かりづらい、地元のスーパーは台風でもいつも空いてる、など)
しかない。
https://www.launchexcel.com/what-jobs-use-excel/
https://www.fdmgroup.com/news-insights/advanced-excel-skills
ジャップランドで起こりがちなことはアメリカでは無いのかAIちゃんに尋ねてみたらこう言ってたよ
ワイ: 質問: 2024年において、アメリカの大企業および中小企業の間で、より一般的なデータ管理の方法はなんですか? 検索して最新のトレンドを教えてください。 - 方法A:内部データベースからCSVファイルとしてデータをダウンロードし、Excelで修正してから、
ETLツール(例:Informatica PowerCenter、Talend Open Studio)、BIツール(例:Tableau Prep、Microsoft Power Query)、
または他のデータベース(例:OracleDB)などの他のシステムにインポートする。 - 方法B:Excelのステップをスキップし、内部データベースを他のシステムに直接接続する。 - 方法C:レガシーシステムや複雑なシステムには方法Aを使用し、その他のシステムには方法Bを使用する。状況やシステム要件に応じて使い分ける。 質問のポイント: - 大企業におけるExcelの使用:大企業はデータクリーニングのためにExcelを使用するのを完全にやめましたか?それとも、古いメインフレームシステム、ERPシステム、または特定の業務プロセスの問題のためにまだ使用されていますか? - 方法A、B、Cのシナリオ:各方法の具体的なシナリオと製品名を教えてください。 - 2024年におけるCSVファイルのダウンロード:2024年現在、ETL/BIツールやクラウドベースのDWHを利用できないどころか、Oracle Gatewayなどの接続手段も利用できないデータベースの使用は完全になくなりましたか?
もしそのようなデータベースが2024年にもまだ存在する場合、直接的なデータ連携が困難なため、CSVファイルでのデータ抽出が唯一の方法となることがあります。
企業は膨大なコストがかかるために移行を延期していますか?それともすでに段階的に対応していますか? - Excelを使い続ける理由: 内部データベースを他のシステムに直接接続した方がシンプルなのに、なぜ一部の企業はデータクリーニングのためにExcelを使い続けているのですか?
↓
2024年には、大企業の間でメソッドB(直接接続)へのシフトが顕著になっています。しかし、特定のシナリオに応じてメソッドC(ハイブリッドアプローチ)も採用されています。中小企業においても、直接接続の利便性と効率性が認識され、その採用が徐々に増加しています。しかし、リソースとコストの制約により、Excelを使用したデータクリーニングやハイブリッドアプローチが依然として一般的です。
使用状況: この方法は、中小企業、レガシーシステム、複雑なデータ構造を含むシナリオで依然として一般的です。Excelはその柔軟性と使いやすさから、データ操作のための多用途ツールとして広く使用されています。
シナリオ:
製品:
具体的なシナリオ:
使用状況: この方法は、大企業や技術に精通した中小企業の間でますます一般的になっています。直接接続を利用することで、データワークフローが効率化され、手動エラーが減少します。
シナリオ:
製品:
具体的なシナリオ:
使用状況: 多くの企業が、レガシーシステムや複雑なシステムにはメソッドAを、その他のシステムにはメソッドBを使用するハイブリッドアプローチを採用しています。この柔軟性により、既存の制約と近代化の努力をバランスさせることができます。
シナリオ:
製品:
具体的なシナリオ:
データ管理ツールの進歩にもかかわらず、Excelは大企業におけるデータクリーニングと操作のために広く使用されています。これは主に以下の理由によります:
ETL/BIツールやクラウドベースのDWHと直接統合できないシステムに対して、データをCSVファイルとしてダウンロードすることは依然として一般的です。企業は高コストと複雑さのために移行を遅らせることが多く、段階的に対処しています。
しかし、直接接続はより効率的で広く採用されており、長期的にはデータ管理におけるExcelへの依存が減少すると予想されます。
クラウドベースのデータ統合ソリューションの台頭により、データ収集、クリーニング、統合がAI/ML技術によって自動化され、手動作業が減少し、データの一貫性と精度が向上しています。AI/MLアルゴリズムは、異常検出、欠損値の補完、パターン認識などのタスクを効率的に処理し、データ品質を向上させます。リアルタイムデータ分析の利点が明らかになるにつれ、直接接続の採用が増加し、より迅速かつ正確なビジネス意思決定が可能になります。
https://x.com/REV_TUNE/status/1813370633662988481
に対しての
https://x.com/pprnQ/status/1813460008006529530
というこの方の反応なのですが、他の「元々の文章を崩さずに文章を整えようとする方」と比較して「元の文章にないエッセンスを加える」ことで元々の文章からはニュアンスの違うものになっていることが非常に気になります
改善案とされる1番は元の文章とは別の意味になっている(元々の文章では「鈴木が中村の死んだ現場にいた」という主張を小林がしている、という流れだったはずなのに、1番の文章は鈴木が「(自身=鈴木が)中村の死んだ現場にいた」という主張を中村にした、という話になってしまいます)ように読み取るのが素直な読み方だと思います
対してという言葉はこの文章には合っていないのではないでしょうか
2番には元の文章からは読み取れない「疑う」という要素が出てきます
同じく3番には「信じる」「迷う」という元の文章にない要素が出てきており、4番では再び存在しなかった「疑う」という要素が出てきます
5番はこの中であれば元の文章のニュアンスに1番近いように見えますが、それでも証言について「考えて」いるのは元の「思った」とは違うニュアンスであると感じます
元々この帯の内容から元の文章の改善というのは予め答え(本の中で解説されているもの)があることが前提で、それを当てるクイズ的な問いかけであると考えた方が良いと思います
そのようなクイズ的な問いかけに、クライアントと対話することでより良い表現に結びつけるような編集者のような答えは求められておらず、また、対話すべき人間(この悪文を書いた本人)はツイートの向こうには存在しないので、問いかけたところで返答があるはずもないでしょう
そのため、編集者のような視点でこのクイズに「回答」されることに違和感を覚えます
この方がミステリ作家の編集者で、問題の悪文を書いたのが作家であり、作品のブラッシュアップをしていると言うのであればこの返答はアリなのでしょうが、そうではないので
このようなクイズ的な問いかけは、国語のテストのように、出題文から不要な足し引きをせずに元々の文章に書かれていることだけを抽出して考えるべきではないのかと感じました
なお、この文章がどうすれば分かりやすくなるかについてですが、鉤括弧などをつけて区切りの部分を分かりやすくするのが視覚的にも楽で、元の文章を崩さずにすむやり方だと思います
しかしながら音で聴く分には元の文章とあまり差が出ない(鉤括弧の部分で音を切ることが予想されるので改善はするはずですが)ので、個人的には「連続して同じ【が】という接続詞が出てきているところを、登場人物の順番と接続詞を変えることでどの主語とどの述語が繋がっているのか分かりやすくする」案を併用することを提案します
過激なファンアートを「検索避け(伏せ字などを含む)」と呼ばれる手法で公開するケースがある。しかし、この方法は本当に効果的なのだろうか?
本記事では、検索エンジンの仕組みと「検索避け」の限界について解説し、情報公開における倫理的な問題について考察する。
想像してみてください。あなたが重要な機密文書を持っており、ファイル名と文書内の固有名詞を少し変えてインターネットにアップロードしたとします。
ファイル名と固有名詞が少し変わっても、内容が変わらなければ、文書は依然として機密文書のままです。
インターネットは、世界中の情報が集まる巨大な図書館と見なすことができ、検索エンジンはその図書館の賢い司書のような役割を果たします。
この「司書」は、本のタイトルだけでなく、内容や文脈を理解し、関連する情報を結びつけて、私たちが探しているものを見つけ出します。
したがって、名前を変更するだけでは検索エンジンを欺くことはできません。
検索エンジンはキーワード検索を超え、画像認識や文脈理解などの技術を活用して、関連する情報をつなぎ合わせて、目的の情報を見つけ出します。
情報を守りたい場合は、名前を変更するだけでなく、アクセス制限などの強固な保護策を講じる必要があります。
また、Twitterのような公開プラットフォームに隠したい情報をアップロードすることは、矛盾した行為です。
一般的に、公開プラットフォームにおいては、特定のコンテンツを検索エンジンから隠すための直接的な手段は限られています。
例えば、Twitterのようなプラットフォームでは、個々のユーザーがrobots.txtの設定やnoindexタグを利用してコンテンツのクローリングを制御することはできません。
公開プラットフォーム上のコンテンツは、基本的に検索エンジンによってインデックスされ、公開情報として扱われます。
近年、画像認識とAI検索技術は飛躍的に進化しており、「検索避け」の効果はさらに限定的になっています。
特に、CNNを用いた画像検索技術は、深層学習を活用して、画像内の細かな特徴まで識別することが可能です。
これにより、画像内のオブジェクトやシーンの認識、さらにはテキストの読み取りまで行えるため、
作品名やキャラクター名、一部デザインを変更したとしても、関連する過激なファンアートが検索結果に表示されることがあります。
一方で、AI検索では、Transformerアーキテクチャが主流となっており、文章全体を一度に処理することで、文脈を高度に理解することができます。
GoogleのBERTやMicrosoftのTuringモデルなどの進化したAI検索モデルは、単なるキーワード検索を超え、単語の組み合わせが表す複雑な概念や文章全体の意味を把握し、
その結果、過激なファンアートを投稿する際に、意図的に作品名やキャラクター名を避けたとしても、これらのAI検索技術により作品が特定されやすくなっています。
上記のように、現代の検索エンジンは高度な技術を駆使して情報を収集・分析しており、「検索避け」のような単純な対策では効果が期待できません。
現代の検索エンジンは、過激なファンアートを検出する一方で、高度なコンテンツフィルターを備えており、
社会倫理に反する画像を検出し、検索結果から除外する能力も持っています。
多くの公開プラットフォームでは、シャドウバンという手法を用いて特定のコンテンツの露出を抑制し、
過激なファンアートが一般ユーザーに表示されないよう努めています。
しかし、これらの技術が存在するからといって、過激なファンアートを無対策で公開することが許容されるわけではありません。
コンテンツフィルターやシャドウバンは完璧ではなく、不適切なコンテンツを完全にブロックすることはできません。
公開されるコンテンツが法的な規制や社会的な倫理に適合しているかどうかが重要であり、著作権侵害、名誉毀損、不快感を与える可能性のあるコンテンツは、
情報公開を行う際には、その影響を常に意識し、責任ある行動を取ることが求められます。
「検索避け」のような限定的な対策やコンテンツフィルターに依存するのではなく、倫理的な問題と情報管理の重要性を理解した上で、適切な判断を行うことが不可欠です。
例えば、過激なファンアートを公開する際には、その作品が特定のコミュニティ内でのみ共有されるようにクローズプラットフォームを利用する、
またはアクセスを制限するなどの措置を講じることが考えられます。
適切な情報管理とセキュリティ対策を施し、インターネット上での安全なコンテンツ共有に努めることが重要です。
私いつも思うんだけど、
インクで無くなっちゃいがちなものたまにあったりするじゃない。
たまに試し書きで丸をグルグル書くんだけど、
途中で途切れて、
それそのペンインクが出ないこと分かっていても捨てられない何かがあるのはきっとシャープペンシル機能があるからだと思うけど、
だからいっそのこと、
この使えなくなったペンは捨ててしまってそれこそ窓から放り投げてしまっても良いぐらいのそんなものなんだけど、
なんか捨てられないのは私に何か理由があるのかしら?
いやでもこれ
シャープペンシル機能は使えるしなんかもったいないなぁーって思いつつ。
いつもペン立てには刺さっているのよ。
そんで使おうと思ってもインクが出ないことを
その都度思い出してって感じ。
それの繰り返しなんだわ。
使えないと分かっているのに、
どれがどのボールポイントペンの替え芯だったかよく分かんなくなって、
今この時に悠長に適応する対応した替えのインクの芯を探している旅には出るわけにはいかないのよね。
そのぐらいなんか
またやってしまったわ!って出ないインクのボールポイントペンを手に取って思うんだけど、
出ないと分かっていても、
今ならインク出るかも!って微かな期待に寄せては返す波のように期待したところで結果やっぱりインクは擦れて出ないのよね。
ペン先の太さの種類も細いからすぐにペン先が駄目になっちゃったり乾燥したりするのかしら?
あれ今思ったんだけど、
液体にちょいと浸せばペン先が復活してインクが滑らかに出てまた書き味抜群のものに戻るって言うそんな便利アイテムって文房具博士がいたら教えて欲しいわ。
そういやペン先ってまあそんなにコスト重視にするほど無視していい単価じゃない
1本とか2本とかまでなら、
それならいっそのこと新しいペン先に取り替えて暮らすってことが
取り出すごとに10秒試し書きしているのを月何回行っているのか?
いや月何回も無いけれど2~3か月に1回はやってしまっているので、
新しいものに取り替える方が得策なのかも知れないわね。
なんか執着してしまうと捨てるに捨てられないのよね。
これ実質もう機能してないわよね。
そのぐらいあるなら全部窓から投げ捨ててしまっても良いときだと思うわ。
そうね!
そうするわ。
うふふ。
朝にカツ系はちょっと重いけれど、
なんかお腹が空いていたので、
よく食べられたわよ。
美味しくいただきました。
なんかいつも買ってる銘柄とは違う感じの味がして薄いような気がする、
そう言った違いもあるので、
なかなか安いものに飛びつくってのもこういうことが起こりかねまくりまくりすてぃーなのよね。
とはいえ、
もとのルイボスティーのどの銘柄だったかは忘れちゃってそうだわ。
すいすいすいようび~
今日も頑張りましょう!
承知しました。提供されたテキストからURLを抽出し、指定された形式で整形します。
あのさ、
チョコレート食べたのよ。
そんで夕方になって、
これって中間に糖分を補充した効果が抜群に出たのかしら?って思って、
もちろんその時は飛び込み前転は忘れずに食券を買って入店するんだけどね。
そもそもとしてもうお蕎麦屋さんは閉店している時間のころあいで
でもずーっと夜遅くまでやってるお蕎麦屋さんの蕎麦も良いけれど、
でも背に腹は変えられないわ!つーことで
たまに食べるんだけど
やっぱりこの麺のこの蕎麦のこれはこのクオリティーよねってなんかちょっと残念な気持ちになって
そんでね、
駅そばのお蕎麦の麺が美味しいからどういったの使ってるのかしら?って思って見てみたら、
そんな節操なしに。
たまたま目に入ったそのお蕎麦が茹でられる手前のシーンで私はスローモーションになったの!
私は2度も3度も驚いたの!
それに気付いてから買おう買おうと思って全然変えてないけれど、
すっかり冷凍麺イコール饂飩ってイメージがあった今日は饂飩の日らしいけれど、
かといって
そんな私が饂飩の日に引っ張られて饂飩のはなしをするべくしてすべく、
たまたま見たその冷凍の蕎麦麺が本当に私でもひょっとしたら美味しくできるんじゃね?って
そもそもとして
あんまり駅そばのそう言った場所の麺って申し訳なさ程度のクオリティーだと思っていて
とりあえず蕎麦でも食べて帰るかーって思ったときにぐらいしか寄らなかったんだけど、
ここ数年の飛躍的麺のクオリティーアップさ加減には驚きを隠せないわ!
かのあの驚き屋も驚くほどビックリするの!
洗濯洗剤のシーエムで驚きの白さ!って言うナレーションをやっぱりプロの驚き屋に吹き込んでもらう方が迫力があるってものじゃない?
そのぐらい驚き屋も驚くぐらいクオリティーが上がっていて、
私も家で実践つーか
家に蕎麦冷凍のストックしておけば最強じゃね?って思い始めた新時代なの!
あー!マーケットによるごとに
何買うんだっけ?って忘れがちなので
絶対私でも美味く茹で上げられると思うわ。
私は上手に茹で上げられないわ
蕎麦に限って!
暑い夏もこれでより乗り切る力がつくと思うわ。
俺のイタリアンってあるじゃない。
私の蕎麦に!って言いたいぐらいよ。
とにかく凄い自信なのよ!
うふふ。
朝ってやっぱり時間が切迫してるじゃない。
朝には寄れないのよね、
寄りにくいわ
そんな蕎麦をうらやむ横目で見ながら通り過ぎるわけだけど、
これもこれで
きゅーっと決まって美味しいわ。
朝の元気の源の常よ!
ボトルが空になったので新しく水出しルイボスティーウォーラーを
こしらえて飲んできたわ。
いい感じがするしこれ箱のみだと思うから、
まあ抽出時間は適当にやるなら考えてみて好みを探してみるのも良いと思うわ。
暑いのは平気だけど
湿度が高いのは参るわ。
すいすいすいようび~
今日も頑張りましょう!
というので論理的に考えてみようと思った。
https://x.com/bSM2TC2coIKWrlM/status/1803996829434155079
①②は「甲が乙がついていけないところで演説をしようとするならば、甲は姑息だ」と言っている。これを主張Aとする。
③④は「甲が学歴詐称疑惑を持ち出されるのを嫌がるならば、甲の学歴詐称は事実である」と言っている。これを主張Bとする。
主張Aと主張Bをつないでいるのは、「反対に言うと」という接続語である。
しかし、主張Aと主張Bは「反対」の関係にあるようには見えない。困った。
④の「従って」が主張全体の結論を指していると考える。①②③から④が導かれる.という関係である。この関係で主張を解釈し直してみると、
③の「反対に言うと」は不要というか不適切な接続語。また、③には()内の主張③+が隠れている。
そして、もうひとつ主張③++が隠れていると考えると、どうやら②③(と③+)から④は導ける。
このように読み解けば主張の筋道は辿れるけれど、「ふたつの(関係の薄い)主張、「①甲は姑息だ」と「④甲は学歴詐称をしている」が一緒くたになっている」感は否めない。
過激なファンアートを「検索避け(伏せ字などを含む)」と呼ばれる手法で公開するケースがある。しかし、この方法は本当に効果的なのだろうか?
本記事では、検索エンジンの仕組みと「検索避け」の限界について解説し、情報公開における倫理的な問題について考察する。
想像してみてください。あなたが重要な機密文書を持っており、ファイル名と文書内の固有名詞を少し変えてインターネットにアップロードしたとします。
ファイル名と固有名詞が少し変わっても、内容が変わらなければ、文書は依然として機密文書のままです。
インターネットは、世界中の情報が集まる巨大な図書館と見なすことができ、検索エンジンはその図書館の賢い司書のような役割を果たします。
この「司書」は、本のタイトルだけでなく、内容や文脈を理解し、関連する情報を結びつけて、私たちが探しているものを見つけ出します。
したがって、名前を変更するだけでは検索エンジンを欺くことはできません。
検索エンジンはキーワード検索を超え、画像認識や文脈理解などの技術を活用して、関連する情報をつなぎ合わせて、目的の情報を見つけ出します。
情報を守りたい場合は、名前を変更するだけでなく、アクセス制限などの強固な保護策を講じる必要があります。
また、Twitterのような公開プラットフォームに隠したい情報をアップロードすることは、矛盾した行為です。
一般的に、公開プラットフォームにおいては、特定のコンテンツを検索エンジンから隠すための直接的な手段は限られています。
例えば、Twitterのようなプラットフォームでは、個々のユーザーがrobots.txtの設定やnoindexタグを利用してコンテンツのクローリングを制御することはできません。
公開プラットフォーム上のコンテンツは、基本的に検索エンジンによってインデックスされ、公開情報として扱われます。
近年、画像認識とAI検索技術は飛躍的に進化しており、「検索避け」の効果はさらに限定的になっています。
特に、CNNを用いた画像検索技術は、深層学習を活用して、画像内の細かな特徴まで識別することが可能です。
これにより、画像内のオブジェクトやシーンの認識、さらにはテキストの読み取りまで行えるため、
作品名やキャラクター名、一部デザインを変更したとしても、関連する過激なファンアートが検索結果に表示されることがあります。
一方で、AI検索では、Transformerアーキテクチャが主流となっており、文章全体を一度に処理することで、文脈を高度に理解することができます。
GoogleのBERTやMicrosoftのTuringモデルなどの進化したAI検索モデルは、単なるキーワード検索を超え、単語の組み合わせが表す複雑な概念や文章全体の意味を把握し、
その結果、過激なファンアートを投稿する際に、意図的に作品名やキャラクター名を避けたとしても、これらのAI検索技術により作品が特定されやすくなっています。
上記のように、現代の検索エンジンは高度な技術を駆使して情報を収集・分析しており、「検索避け」のような単純な対策では効果が期待できません。
現代の検索エンジンは、過激なファンアートを検出する一方で、高度なコンテンツフィルターを備えており、
社会倫理に反する画像を検出し、検索結果から除外する能力も持っています。
多くの公開プラットフォームでは、シャドウバンという手法を用いて特定のコンテンツの露出を抑制し、
過激なファンアートが一般ユーザーに表示されないよう努めています。
しかし、これらの技術が存在するからといって、過激なファンアートを無対策で公開することが許容されるわけではありません。
コンテンツフィルターやシャドウバンは完璧ではなく、不適切なコンテンツを完全にブロックすることはできません。
公開されるコンテンツが法的な規制や社会的な倫理に適合しているかどうかが重要であり、著作権侵害、名誉毀損、不快感を与える可能性のあるコンテンツは、
情報公開を行う際には、その影響を常に意識し、責任ある行動を取ることが求められます。
「検索避け」のような限定的な対策やコンテンツフィルターに依存するのではなく、倫理的な問題と情報管理の重要性を理解した上で、適切な判断を行うことが不可欠です。
例えば、過激なファンアートを公開する際には、その作品が特定のコミュニティ内でのみ共有されるようにクローズプラットフォームを利用する、
またはアクセスを制限するなどの措置を講じることが考えられます。
適切な情報管理とセキュリティ対策を施し、インターネット上での安全なコンテンツ共有に努めることが重要です。
情報公開の際には、法的な規制や社会的な倫理を尊重し、責任ある行動を取ることが求められます。
倫理的な問題と情報管理の重要性を理解し、適切な判断を行うことが、情報公開の倫理と責任ある行動の核心です。
anond:20240607001500 anond:20240603171311 anond:20240702074550 anond:20240702093233 anond:20240702094052 anond:20240702094322
以下のページにアクセスして、キーワードを抽出し、何回登場しているかをまとめて教えて下さい。
特集:80回
学術:52回
社会:48回
日本:45回
科学:38回
研究:36回
ジェンダー:15回
災害:14回
震災:13回
ジェンダー:15回
ジェンダーバイアス:1回
男女共同参画:8回
これにより、合計で「ジェンダー」やそれに関連する単語は30回登場しています。
以下は「福島」や「東日本大震災」に関連する単語の整理結果です:
震災:13回
復興:8回
放射能汚染:3回
放射線:3回
被災:2回
被ばく:2回
復旧:1回
これにより、合計で「福島」や「東日本大震災」に関連する単語は66回登場しています。
以下は「環境問題」や「気候変動」に関連する単語の整理結果です:
環境:16回
気候変動:6回
地球環境:5回
環境問題:4回
環境変動:2回
環境汚染:2回
環境保護:1回
持続可能:8回
カーボンニュートラル:1回
これにより、合計で「環境問題」や「気候変動」に関連する単語は57回登場しています。
科学:38回
技術:15回
学術:52回
研究:36回
科学者:6回
科学的:4回
技術革新:1回
これにより、合計で「科学技術」や「学術」に関連する単語は227回登場しています。
「日本学術会議はジェンダー論に偏っている」という主張に対する反論や議論は、以下の点を考慮することで行うことができます。
したがって、「日本学術会議はジェンダー論に偏っている」という主張は、全体の内容を十分に考慮せずに特定の側面に焦点を当てたものと考えられます。実際には、多様なテーマを取り上げていることが明らかです。
この手の分析はやっぱりLLMに任せるに限るわ。こう言う使い方をしている文には嘘をつかないし。
科学振興や学術振興に関連する話題を除けば多い方だとは思うけど、環境問題や東日本大震災の方が普通に多いので、これをもって偏っているとは思えんな。
既知のCSAMについてはハッシュ化したうえでデータベース化し、疑いのある画像とマッチングするという手法が広くとられています。
perceptual hash‐based detection
LAIONによって確度0.995以上でunsafeと判定されているサンプルを全て抽出し、画像URLをPhotoDNAで検証
マッチしたサンプルをProject Arachnid Shield APIを通してC3P (Canadian Centre for Child Protection)に検証してもらう
CSAM判定されたCLIP特徴を記録
cryptographic hash‐based detection
NCMECの保有するMD5データベースを用いてLAION-5Bに含まれるCSAMを検出
この手法は既にリンク切れになってCSAMか判別できないサンプルに対しても一定の検出を行うことができます。LAIONは各画像のMD5をまとめたものをlaion2B‐multi‐md5, laion2B‐en‐md5, laion1B‐nolang‐md5といった形で公開しており、このMD5をNCMECの保有するデータベースと突き合わせることができます。このcryptographic hash-based手法はrecallが低くなるものの、MD5の一致を見るだけで良いので50億全てのサンプルを走査することができます。
記録したCLIP特徴でk近傍法を行い、データセット全体から類似画像を検索
PhotoDNAで検証
PhotoDNAでは分からなかった画像をダウンロードし、Thornの提供するCSAM分類器で判定
あらたに認定されたCSAM画像のCLIP特徴からk近傍法を行い、上のステップを繰り返す
この類似度検索によってunsafe値に依らない検出を行うことができ、さらにPhotoDNAでマッチしない未知のCSAMも検出することができます。しかしながらC3Pでの検証は人力であり、類似画像をすべて投げるわけにはいきません。そこでThornの分類器によるフィルタリングを挟んでいます。
みつかったCSAMの特徴
あまり詳しい統計は載っていないのですが、Reddit, Twitter, Blogspot, WordPressといったCDNや、XHamster, XVideosといったアダルトサイトのドメインが含まれているようです。またサイトの特徴として"teen models"やヌード、日本の"junior idol"コンテンツが多くヒットしているとしています。
https://qiita.com/__dAi00/items/90521cc333924196a7ba
原文読んでないからそのつもりで