はてなキーワード: 正規表現とは
箇条書きされている疑問への回答を書いてみました。
生活に大きく関わります。生活で困った時や不利な状況になった時には、政府や行政の様々な補助やセーフティネットが利用できますが、その理念、制度設計、成り立ちを教養として知っておくと何かと便利です。。あらかじめ概念を理解していると、最新の細かいルールは必要な時に簡単に調べられます。
例えば起業・転職・転居・出産などの人生で大きな決定で貧困や困難を避けることができ、人生に関わる大きなチャレンジもしやすいです。
また、日常生活や旅行で時間が余った時に無料や低価格で公的文化施設を楽しめます。行政が国民のために用意してくれているサービスを最大限利用するには教養があった方が有利です。(行政は低リテラシーの方向けに理解を支援する取り組みも最大限行ってくれてはいますが、各人の素養の差は完全には解消できていません。)
マーケティングを教養として知っておくとドアノック商品などはすぐにわかるようになるし、基本的な心理手法を知ってるとハロー効果を利用してるなあとかもすぐにわかるようになって、相手に一方的に有利な交渉をされるのを簡単に避けられるようになります。
また基本的な計算が素早くできるようになっておくと、3割ポイント付与と3割値引きがどちらがお得とか簡単な損得もすぐにわかります。
基本的な判断は基礎教養で乗り越えて、教養のみでは容易に判断できない難しい内容に自頭を使うのが良いと思います。
mRNAの理屈は高校生物あたりで学んでいるかと思います。薬となるタンパクは複雑なものほど長期間安定して保存する事が難しかったり、作成が難しいです。mRNAの形で薬として作成し投与して、体の中でそれが翻訳され薬(タンパク質)を作る方が合理的な事もあるというのが基本中の基本。ウイルスの新たな変異に対する対応も、mRNAを利用した方が短期間で新薬が作成可能。
基本的な生物理論からあまりにも外れたトンデモワクチン理論を言ってる医師や科学者はもう一度勉強しなおしてほしいなあと思ってしまいます。私自身の専門外の話ですので難しい知識は忘れていますが、昔勉強しておいて基本的なルールは理解していたおかげで新技術も把握しやすくて過去の教育に感謝しています。
簿記や会計の教養があって有価証券報告書などのIR資料が読めると、明らかな地雷企業は避けられるようになります。また非上場企業への就職でも業界地図的な本を読めて判断する教養があると、業界全体の給与水準・労働水準がわかります。
業務遂行能力が同じでも、より給料が高く、よりホワイトな企業へ就職・転職できる可能性がぐっと上がります。
また就職面談でPRする程度の実績であれば、教養があればより少ない苦労で実績の作成が可能になります。
マネーリテラシーがしっかりしていると余裕が出ます。若い時の堅実な節約・貯蓄はとても重要だし、たまったお金で堅実な投資することで中年以降のお金の余裕が変わってくるし、それが変わると人生の選択肢が広くなり有利な選択を取りやすくなりますし、余裕がでてくると思います。
難しい話ではなく、若い時から給料の1割くらいをちゃんと貯蓄して、ある程度の年齢からはインデックス投資や10年変動個人向け国債を利用する程度の話です。
スマホ、LINE、Google Map、音声文字入力、ChatGPT、表計算(excel,Spreadsheet)、自動操作ツール(Zapier、IFTTT)、ちょっとしたプログラム(正規表現、シェルスクリプト、GAS、Python)、ちょっとしたサーバー(VPSやLambda)が使えると何かと便利です。無駄で面倒な繰り返し作業が減って時間効率が上がり、心にも余裕がでます。どのレベルまで学習するかは人それぞれですが。
そういえば生成AI(ChatGPT)の活用は教養の有無がとても大事と感じています。各人の基礎能力を数段階上昇させてくれるツールだと思っています。教養があればより高度な出力が期待できますし、出力結果からハルシネーションを除外する判断には教養の有無が重要だと感じています。
逆に過去に全く学んでなかった分野については正誤の判断ができず、ChatGPTが全く活用できていません。
教養なんて幅広いものですので、どれもこれも他にもっといい回答(教養の活用方法)があると思います。
---
以下お返事
図書館で競争が激しい事の1つは、新着図書をいち早く借りる事です。開館時刻に並んでも早く借りられない事が多いので並ぶ人をあまり見ないだけです。
各図書館によって攻略方法は異なりますが、ネット予約や予約カードを駆使した方法が一般的で、見えない所でかなり熱い争奪戦が行われています。
私は熟女モノとか人妻モノは眼中にないのですが、なぜだか最近そっち系の作品が多くて閉口しています。
しかしFANZA側の検索システムはNOT検索できるようになっていません。そこで、検索結果から除外できそうなものを除外するブックマークレットを作ることにしました。
さいわい近年は内容の概要文をそのままタイトルにしたような作品ばかりなので、タイトルに含まれるキーワードで除外が簡単にできそうです。
「熟女」とか「五十路」のような単語を含む作品を非表示にしてしまえばよいのです。
javascript: (() => {
const r = /熟女|完熟|熟れ|四十路|五十路|六十路|人妻|奥様|妻|夫|母|ママ|おばさん|BBA|姑|嫁/;
const q = '#list>li';
document.querySelectorAll(q).forEach(l => {
if (r.test(l.textContent)) {
l.remove();
}
});
})();
javascript:(()=>{const r=/熟女|完熟|熟れ|四十路|五十路|六十路|人妻|奥様|妻|夫|母|ママ|おばさん|BBA|姑|嫁/;const q='#list>li';document.querySelectorAll(q).forEach(l=>{if(r.test(l.textContent)){l.remove()}})})()
このブックマークレットで、検索結果に含まれる熟女系作品の数を1/3くらいにまで減らすことができます。
ブックマークレットとは、ブックマークにURLではなくJavaScriptを登録して、閲覧中のページ上で自分(やほかの誰か)が作ったプログラムを実行できるしくみのことです。普通のブックマークと同じようにブックマークバーなどに並べておいて、クリックひとつで呼び出すことができて便利です。
①まず、どこのページでもいいので(今読んでいるこのページでもよい)ブックマークをひとつ作り、ブックマークバーなどの呼び出しやすいところに置きます。
②できたブックマークを右クリックして「編集...」を選びます。
③「名前」欄は、自分にわかりやすい名前に変更します。でも「FANZAフィルター」などあけすけな名前をつけると、誰かに画面を覗かれた時に困りますよ。
④「URL」欄に、上記したプログラムコードを入力します。ただし上記のコードは私向けのキーワード選定になっていますので、ご自身の好みに合わせたキーワード選定をしていただければよいかと思います。/単語1|単語2|単語3/
のように記述してください。
ふつうのソースコードと、改行・インデントなどを省いてミニファイ(最小化)したもの、どちらをコピペしても大丈夫です。
⑦このブックマークレットを起動します。すると、瞬時に検索結果が減ります。
キーワードだけが異なる複数のブックマークレットを登録しておいて、場面に応じて使い分けるなどの工夫もできるでしょう。
上記のスクリプトが何か悪さをするようなものではないことを説明するために、また、JavaScript を学習し始めたばかりの人のために、このシンプルなスクリプトの解説をします。
javascript:
URLの種類を示すスキーム名です。一般的なURLは https:
や mailto:
などで始まりますが、javascript:
と書くと、これに続くコードがプログラムとして実行されます。
(() => {
// 処理
})();
ここからが JavaScript です。まず処理全体をくるむ大きなカッコと最後に付け足された () は、自己実行無名関数という形式です。今回のブックマークレットは変数を含みますので、実行するページに元々ある変数たちとバッティングしないようこのようなかたちにします。
const r = /熟女|完熟|熟れ|四十路|五十路|六十路|人妻|奥様|妻|夫|母|ママ|おばさん|BBA|姑|嫁/;
除外したい単語を羅列した正規表現です。個人個人で設定が変わる部分なので、編集しやすいように切り出しておきました。
const q = '#list>li';
フィルター対象とするHTML要素群のクエリーセレクター文字列です。検索結果に一覧表示される、個々の作品要素を選択します。FANZAがシステム改修を行うと変わってしまう可能性がある部分なので、メンテしやすいようにここだけ切り出しておきました。
document.querySelectorAll(q).forEach(l => {
// 処理
});
クエリーセレクター q
に一致する要素 l
ひとつひとつについて反復して処理を行います。
if (r.test(l.textContent)) {
l.remove();
}
もし要素 l
内のテキストが正規表現 r
と一致していたら、要素 l
を取り除く、という処理です。正規表現 r
はキーワードの羅列ですので、テキストの一部にキーワードのどれかが含まれていたら一致したことになります。
正解が「数学的」に決まるところ。たとえば「1■1=2 のときに ■を答えなさい」というときに競プロは■を答えるだろうし、それを早く答えて悦に入るだろう。
それもいいけど、いちど数学的に答えが決まっちゃう問題はライブラリにまとめられて、一般的なコーダはなにも考えなくてもインポートして処理できちゃうわけ。上の例えだとふつーのプログラマなら「枯れたライブラリをインポートして、正しく答えが出ると確信できるなら『答えは正しいとか考えなくても』それを使って対処する」ので、データの振る舞いとか気にしないで済む。たとえば SQL なんて、実行時計画という「アルゴリズムを常に指定するなら不要な」話題があるのだけど、データ量によって適切なアルゴリズムが変化するから仕方ないし、概ね RDB は賢いのでヒューマンが考慮するのは問題がある場合だけなのだ。よって、競技プログラマが生産性を確実に上げるという根拠はない。
もちろん、アルゴリズム知識を身につけるのは大切だし、クヌース先生も書いてたけど分散処理アルゴリズムはフロンテイアだろうよ。というか、暗号分野やセキュリティの領域や、条件が過酷な場合(宇宙線の影響下とか、メモリの少ないエッジコンピューティングとか)だと、アルゴリズムの研究や追求は大切なのは今も同じだ。でも、競技プログラマが新規にアルゴリズムを開発したり、セキュリティに向上したという話は聞いたことがないが、レッドコーダー諸君は自前で創造して使われた実績はあるのだろうか?
ついでに聞いてみたいのだが、競技プログラマたちは「マルチスレッドなコードで早く書こうとしないのはなぜ?」「そもそも、競技プログラミングで使うコードは便利なスニペッツがあるけどそれってチートでは?」「ときどき正規表現で解く問題があるけど、そのときの計算量は無視してない?」という矛盾を抱えているのてはないか?と思うのだが如何か。
究極的には競技プログラミングに必要な知識というのは、産業用途で要求される知識の一部でしかないのが問題なんだと思うよ。ほら、アレだよ、むかし話題になった「数学だけデキる人向けの東工入試をやったら、英語ができなくて卒業できなかった」という童話に近いんだよ。競技プログラムってインとアウトしか見てないブラックボックステストだから、ここだけしか計算機科学の知識が無いというヤバ人材の育成しかなってないのだろうな。
単語をひとつだけ返すが、「ぬ」で始まらなかったり、「ん」で終わらなかったり。
「沼地(ぬまち)」とか。
「布団(ぬとん)」とか。
そのうちに、ないと言い出す。
ひとつ教えても、回答が安定しない。
あっさりとあきらめて、「ない」と答える。
あるでしょうと聞くと、教えて、と返してくる。
ひとつ教えると、それは返すが、他のは間違い。
名詞、動詞などに分類して、たくさん答えてくるが、「ん」で終わる単語がひとつもない。
問い返すと、カタカナで10個ほど返すが、「ヌ」で始まるものの「ン」で終わらないものも多く、
ChatGPT と似たような回答を返すが、同じじゃない。
「沼メン(ぬまめん)」がちょっと怪しいが、全て存在する単語。
すばらしい。
これに続けて、正規表現が使える辞書サイトを教えて、って聞いたんだけど、
全滅。
延々と正規表現自体を調べられるところを回答し続けたり、インチキな URL を返して来たり。
まだまだ、って感じ。
住民はもちろん自由に名乗るのだが、「安倍晋三」を名乗る住民が圧倒的多数派であるため安倍晋三以外を正規表現NGすることで掲示板がまともに機能するようになった。
(貶められる例:安倍を「カラーコーン」と呼ぶ(安倍銃撃現場に赤いカラーコーンが置かれ、墓標のようなそれに野田佳彦が合掌したことから)等)
嬉しい副作用として、安倍晋三を名乗るというバカのような踏み絵を行うことで、なぜだかスクリプト荒らしでないネトウヨ・ネトサポと呼ばれる自民・維新を擁護するレス、更にアフィリエイトまとめサイトが好むレス(男女対立分断、弱者男性系)が激減した。元々嫌われていたコテハンや、こういう時に名前欄で個性主張する住民(往々にしてつまらない)のレスも無視できるようになった。
これは安倍バリア、ABフィールド、アベガード等と呼ばれている。(エヴァのATフィールド、広告ブロックアプリのAdGuardが由来)
年単位で埋め立てスクリプトに荒らされていることでお馴染みの5chニュース速報(嫌儲)。
スクリプトは自動生成された文章と海外画像SNS(imgur)にアップされたグロ画像を織り交ぜて果てのない回線数(ワッチョイ)でレスしまくるため、NGワード・NGネーム・NG IDによって無視することは不可能であり住民には対抗手段がなかった。
運営がグルで荒らしてるとさえ思えるくらい、荒らしに対して運営は無策であった。
そこでつい先日発案されたのが嫌儲のデフォルト名無し「番組の途中ですがアフィサイトへの転載は禁止です」を住民個々がNGネーム登録し、それぞれが名前欄に別物を入力してレスするというもの。
デフォルト名無し(名前欄無記入)で荒らすスクリプトが名前欄変更に対応するまでのイタチごっこと思われたが、なぜだが対応してこない。
これにより、スレが埋められること自体は仕方ないものの、スクリプトを完全に無視して会話することが可能になった。
対応してこない理由には、スクリプトをどこかで拾ったまま使用しているからイジる技術がない説、荒らし業務受注先の許可が必要説(土日であるため)などがある。
住民はもちろん自由に名乗るのだが、「安倍晋三」を名乗る住民が圧倒的多数派であるため安倍晋三以外を正規表現NGすることで掲示板がまともに機能するようになった。
荒らしのブラックリスト方式から住民ホワイトリスト方式というわけだ。嫌儲の宿敵安倍晋三により個々の名前欄の文が鮮明に統一されるとは皮肉なものだ。
スクリプト荒らしは自民党委託のDAPPIによる業務説もあるため、住民を真似て安倍をバカにする名前欄には対応できないとの期待もあった。
昔から嫌儲による安倍への愛執は並々ならぬものがあり、安倍の亡き今でも安倍は親しまれ、貶められ、ネタとして崇められ、安倍語録がレスに使われ、生成AIにより新たな安倍画像が生まれていた。
(親しまれる例:安倍を「安倍ちゃん」と呼ぶ、意味もなく「安倍晋三」とレスする、スレタイに関連する安倍の画像を貼る等)
(貶められる例:安倍を「カラーコーン」と呼ぶ(安倍銃撃現場に赤いカラーコーンが置かれ、墓標のようなそれに野田佳彦が合掌したことから)等)
(崇められる例:安倍を「聖帝」と呼ぶ等)
(安倍語録レス例:意味のない○○だよ、くだらない○○で終わっちゃったね、○○すればいいというわけではない、○○したが○○していない、いわばまさに、非常にしつこい等)
嬉しい副作用として、安倍晋三を名乗るというバカのような踏み絵を行うことで、なぜだかスクリプト荒らしでないネトウヨ・ネトサポと呼ばれる自民・維新を擁護するレス、更にアフィリエイトまとめサイトが好むレス(男女対立分断、弱者男性系)が激減した。元々嫌われていたコテハンや、こういう時に名前欄で個性主張する住民(往々にしてつまらない)のレスも無視できるようになった。
これは安倍バリア、ABフィールド、アベガード等と呼ばれている。(エヴァのATフィールド、広告ブロックアプリのAdGuardが由来)
切り落としたメドューサを首を武器にした英雄ペルセウス、盾に猫をくくりつけて古代エジプト軍の戦意を削いだ古代ペルシア、処刑されたのに救世主として持ち上げられるキリスト、そして安倍昭恵の「思い出していただければ何よりの供養」という言葉も引用され、嫌儲では今日も安倍晋三はネタにされている。
本当にあった話だけど、JavaScriptでstrっていう変数にテキストが入っていて
その変数に'apple'とか'banana'とかが入ってるかどうかを判別するっていうロジックを作るときに
const re = new RegExp("apple") if(re.test(str)) console.log("match")
const re_apple = new RegExp("apple") const re_banana = new RegExp("banana") if ( re_apple.test(str) || re_banana.test(str) ) console.log("match")
っていうコードを書く人がおるんよ
別にプログラミング初めて3ヶ月の初心者じゃ無くて20年以上やってるようなベテランだったり
なんならチーフプログラマーとして若手指導してるような人でもこういうレベルの人って割といるわけ
これに対して
「正規表現でORを書くべき」
「includeで十分」
綺麗にコードを書くっていうのは
「これってappleとかbanana以外に増えたりしないの?」
「fruitsかどうかを判別するならその変数を作った方が良くない?」
っていうのを考えて実装するのが綺麗にコードを書くっていうことで
ちなみに
「正規表現でORを書きましょう」
「動いてるからいいじゃない」
「綺麗に書いても性能上意味ない」
「言ってることが良く分からない。何が違うのか」
とか言ってくるし