はてなキーワード: 全文検索とは
デジタル化したせいで余計な作業が増えているという記事を読んだ。
https://blog.tinect.jp/?p=86085
自分は80年代生まれのオッサンで記事の著者よりも年配なのだが、これっぽっちも共感できなかった。と言うのも社会のデジタル化が進んだ時代でなければ、まともな生活を送れていなかったであろうと断言出来るくらいデジタル技術に助けられているからだ。
子供の頃より発達障害の気があったのか、とにかく紙を使った事務作業的なことができなかった。手書きの文字が汚すぎて第三者が読めない、学校で配布されるプリント類はまともに整理できないわ、授業の板書はただの走り書きになって見返しても意味不明になるわと、とにかく書類が扱えなかった。手帳を買ってもまともに記録できなくて予定管理もダメダメだった。
そんなわけで、高校までの授業態度を加味した学校の成績は壊滅的だったが、勉強自体はそこそこできたので大学進学はできた。大学生になると授業のレポート作成にPCを使えるようになって生活が一変した。壊滅的だと思っていた事務能力が、PCのおかげで飛躍的に向上したのだ。
まず、まともに資料が作れるようになった。手書きのノートと違って、誰でも美しい文字がかけて何度でも修正が効く。メモ帳でテキスト形式の文章を作っておけば、後から内容を検索して見返すことができる。PCのおかげで高校生まで苦手意識のあった資料作成が得意分野に変わったのだ。
次にデータ管理。PCの検索機能やソート機能には本当に助けられた。ファイル整理を一切しなくても、全文検索や拡張子別に並べて日付ソートすれば目当ての資料が見つかるというのは最高すぎた。紙だとそうはいかないので大変だった。
↓
数ヶ月後に別の書類が必要になった時、前回の捜索でひっくり返したせいで資料がぐちゃぐちゃになって見つからずさらにひっくり返して探しまくる
↓
その次、別の書類が必要となった時にはさらに棚が混沌としておりもはや発見困難…
というような悪循環を繰り返していたので、デジタル化によってようやくまともに資料管理ができるようになったのだ。
就職活動のときもデジタル化に助けられた。そもそも手帳が使えない人だったので、PCからでも携帯からでも入力できるGoogleカレンダーがなければスケジュール管理が不可能だった。履歴書だって、手書きで作ると字が汚すぎて門前払い喰らっていたかもしれない。
学生の時点でこうなので、就職してからはなおさらである。紙ベースで仕事する職場だったら、入社直後に社会不適合者のレッテルを貼られてしまい、干されてパワハラ受けて鬱で退職していたかもしれない。今の職場で15年以上働き続けて、いつしか管理職になり、今では部下を持ってそこそこ仕事が出来ているのはデジタル化のおかげとしか言いようがない。
仮に自分が昭和や平成初期に社外人になっていたかと思うとゾッとするので、デジタル化が進んだ時代に生きることができて本当に良かったと思っている。そんなわけで、この手の社会のデジタル化の議論をする時は、効率の面だけでなくて発達障害の気のある人の救済になっているという側面についても、もう少し注目されても良いのではないかと思う。
方言禁止が話題になって増田もぜんぜん歴史のこと知らなかったんだけどさ、一瞥して企画の意図はわかった、というか、正解かわからないけど増田の脳内の経験においてそういうことだろうってイメージはわいたよね。
いわゆる英語/カタカナ禁止ゲームみたいなやつの一種だなこれ。って。逆ルー語っつーのかな。
そういう普段の出力に一回変換をかませて言いよどんだりウッカリ変換できなかったりを笑う、人間性を笑うというと言葉が悪いけど、人間ならではの労働の苦しみと創造性を楽しむ笑い。
増田は関西人だけど関西弁禁止で話してっていわれても不快感はないしぼろぼろ失敗して笑われて自分でも笑うだろうなって思う。
だからなんだ、こんなもんに沖縄だけ特別視すんなよとか(他地方版では好評らしいし?)、実際今を生きる沖縄人の若者がこの企画の文脈を独自に読み取ってどれだけ憤るかってのはすごーく疑問に思ったりする。
まあこんな雑な感想はどうでもいいんだが。
それでまあこういう企画ってやっぱ面白いよねって。何が面白いってさっきも書いたけどユニークな表現もあるけどメインはやっぱり人の焦りとか苦悩とか失敗な部分なわけじゃないですか。それを起こすってのは一言で言って「脳に負荷をかける」。
じゃあほかにどんな脳に負荷かけての回答を楽しむ方法があるのかなーって気になるのよね。
第一は今回問題になった方言やルー語といった変換系。変換対象を見つける能力と適切に変換する能力が必要で、脳に全文検索を強いるから難しいと思う。
次はー、時間制限?王道の王道だよね。タイムリミットギリギリでの焦りから珍回答を連発する姿が滑稽で面白い。タイムショック(古すぎだ)とかネプリーグとか。
ネプリーグのタイムボンバーは時間制限もだけど、チーム戦で後半になるほど有効回答が減っていくという使えるものが減っていく点もちょっとだけ似たような構図になるのかな?幽遊白書の使える言葉が減っていくゲームとかもこれで考えて喋らないといけない。
脳を働かせないとでいうと酸欠系はあるだろうか?激しい運動を伴うやつ。フレンドパーク(これも通じないだろうな)のルームランナーで走りながら答えるやつって走る人と答える人別々だったっけ?忘れたけど走りながら答えるなら大変だよね。ほかに具体例は思いつかないけど若手芸人が早いもの勝ちのビーチフラッグみたいに回答権を競うやつはありそう。はあはあ言いながら瞬発力で答えるのは大変で笑いになるはず。
もっとシンプルに「脳を働かせない」なら簡単だ。飲酒。これに勝るものなし。芸能人はぁ、あんまりしなかったりする?ドッキリ・隠し撮り系とか?あまり見ないからわからないけど、テレビで飲酒した素人との会話が笑いになってるといえば月曜から夜更かしだろうか。かなりメイン企画になってたと思う。ネットではもう「飲酒実況」とか古くからの笑えるコンテンツだね。
あー酸欠系に似た感じだと欲求・疲労系みたいなものもありそう。たとえばまたネットで言うと「耐久配信」みたいな長時間やったり眠らなかったり。これは増田は見たこと無いんだけど。後半は面白いのだろうか?テレビだと帰れま10?食欲を満たす方向と長時間拘束の疲労がウケてたのだろうか。ガキつかの24時間の寝る前や終了前はかなりぐだぐだになるよね。いや書いてて思うけど喋りは面白くないなこれ。疲労系は単純に出てくる量も質も悪くなってその状態を左団扇で見て楽しむもうちょっとハイコンテクストな笑いだわ。
こんなもんかな?増田、あまりバラエティは見るほうじゃないから思ったほどでなかったわ。あとはー…危険球でいうと、どんな話題でも「与党がー」みたいにこじつけてくる人は脳死で書いてる~みたいに言われてこれも「脳が働いてない笑い」になるのだろうか?おおあぶないあぶない。
TSや男女入れ代わりは女性文化を模倣しきれない男性を楽しむコンテンツ?スカートで股開いたり?いやーやりすぎると無能・低能力を嗤うに繋がりそうでダメだね。あくまで一時的にってのが大事だと思う。
このまとめを読んで、確かにこのままいくのはマズいと感じたので、思ってることを一応自分もまとめておきたい。
イーロン・マスクがXを「出会い系アプリにする」とか言い出したけどXをやめたい→でも、こんな理由があるのでXをやめるのは簡単ではない
さもなければ日本人と日本企業は X(Twitter) を利用することが事実上できなくなる。
面識のない異性と交際したい人=「異性交際希望者」といい、交際したい書き込み=「誘引情報」という。
という「出会い系サイトの4要件」というのがあり、これに当てはまると出会い系サイトということになる。
→ これにより X(Twitter) は、日本法でもマジで出会い系サイトに該当することになりそうだが
→ 現行の法制では恐らくならない。
→ なぜなら X(Twitter) は異性交際だけでなく同性交際もできる仕組みなので、出会い系サイトではないと言い張れるのである。
まとめると、 X(Twitter) は本来、ギリギリで出会い系サイト扱いされずに済んでたサービスなのだが、「出会い系サイトにする」と明言されてしまうと、それは出会い系サイトになる可能性が高まるのである。
- (問)あるサイトが、開設者が知らないうちに実質的に出会い系サイトとして利用されていた場合、そのサイトは「インターネット異性紹介事業」に該当するのか。
- (答)自らが運営するサイトが知らないうちに、実質的にインターネット異性紹介事業に利用されていた場合、サイト開設者はサイトの運営方針として「異性交際希望者」を対象としてサービスを提供していないことから、基本的には「インターネット異性紹介事業」には該当しませんが、異性交際を求める書き込みを知りながら放置するなどサイト開設者がその利用実態を許容していると認められるときは、「インターネット異性紹介事業」に該当する場合があります。
「インターネット異性紹介事業」の定義に関するガイドライン
出会い系サイト規制法(インターネット異性紹介事業を利用して児童を誘引する行為の規制等に関する法律)の規制がある。
つまり 18 歳未満がサービスに絡むことを徹底的に排除し監視する義務を負うのである。
守らないと違法。
JC/JK が X(Twitter) 上で「私 JC だけど新宿でこれから即ホ苺」みたいな書き込みを放置した瞬間にアウトになり、警察はサービス中止命令ができる。
インターネット異性紹介事業を利用して児童を誘引する行為の規制等に関する法律等の解釈基準
https://www.npa.go.jp/laws/notification/seian/shounen/shounen230705.pdf
インターネット異性紹介事業者の閲覧防止措置義務(いわゆる削除義務)に関するガイドライン
もちろん「成人指定」とか「18禁」とかと同じアダルトサイトという括りになるため、教育現場で X(Twitter) を使用することが出来なくなるであろう。コンプラを意識する法人も 18 禁サイトは非常に使いにくくなる。出会い系サイトを名乗るということは、そういうことなのである。
これを乗り越えた人しか X(Twitter) を利用することができなくなってしまう。この時点で相当数の離脱者が出てくる可能性が大。
ほんとにそう。昨今の未成年淫行なんてほとんど X(Twitter) やインスタの DM がキッカケになってると思う。警察も X(Twitter) のタイムラインを熱心にパトロールするようになったが、防ぎきれていない。なので SNS は警察が今までやってきた青少年保護育成に対する障壁になっているのである。
実は出会い系サイトで「未成年淫行」が問題になることはほぼ無い。出会い系サイト運営側はかなりしつこく未成年を排除している。そのためなら全文検索するし AI も活用するし目視でも確認する。ところが X(Twitter) にはそれがない。「未成年が守られていないサービスはむしろ SNS のほう」であることを認識すべきである。
究極のメモを教えてあげよう
そう、Microsoft Wordで使っているWordファイルだ
WordファイルはMicrosoft Word以外でも普通に更新できる
もうユーザーインターフェースが〜とかアプリの使い心地が〜とか騒ぐ必要はないぞ、自分で好きなものを選べ
WordファイルをOneDriveにおいておけば勝手に同期してくれる
もうマルチデバイスが〜とか同期するデバイスの数が〜とか騒ぐ必要はないぞ、OneDriveがいやなら他のストレージ使って同期しろ
Wordファイルなら大体のものをコピペして無理やり突っ込める
全文検索? 使ってるOSのファイルマネージャで検索すればヒットするだろ
じゃあな
「パイの奪い合い」っていうけど、日本人ならパイではなくピザでは? https://anond.hatelabo.jp/20230606141141
これ見て「経済のパイっていつから使われてるのだろう」と思ってChatGPTとBingとBardに「いつ、誰が使い始めた?」と質問を投げかけた。英語で。
「アダム・スミスです」「ケインズです」「マーシャルです」「マルサスです」って全く一致した回答がでない
それぞれの回答を個別に検索してもパイに言及した文章は出てこない
Bardで何度か質問した後で「マーシャルです」しか言わなくなった
そこで「経済のパイはマーシャルが最初?」と聞いたら「いいえ、マルサスです」と答えたから「マルサスが最初?」と聞いたら「いいえマーシャルです」だって
その後、自信満々に「マーシャルは「経済学原理」という著名な書籍で経済をパイに例えました。書籍からその部分を引用します」って「国家経済はケーキに例えられる~ホニャララ」って文章が出てきて(いやパイじゃないやん)って思ったけど、ケーキでもいいやってとりあえず検索チェックしてみたけど、一致する文章は出てこない。
この記事の主旨は「ウクライナのゼレンスキー大統領のパーカーは略式軍服である」ということではない。
あくまで「略式軍服という日本語はなかった」「一年ほど前から急に現れた言葉だ」という誤認を訂正したいだけである。
「略式軍服」という言葉の使用例は、国立国会図書館デジタルコレクションの全文検索では33件 - 法華狼の日記
どう見ても定着した言葉や概念ではない。ほとんどが翻訳で採用された言葉だったり、あくまで「略式の軍服」という意味の表現にすぎない。同一作品の重複も多い。
法華狼氏のエントリでは近年の用例はないとされているが、実際にはそうした用例は存在する。
枯野瑛『終末なにしてますか? 忙しいですか? 救ってもらっていいですか?』
あえて翻訳は除外したが、日本人作家の商業作品に限定してもこうしていくつかの使用例がある。
池波正太郎以外は、2000年ごろから2020年までに刊行された新しい書籍である。
もちろん10件足らずでは「定着していた」とまでは言えない。
しかし「用例がまったく無いわけではない」ということはわかるはずだ。
「用例」の存在を確認したところで、次は「用法」の確認をしたい。
国立国会図書館デジタルコレクションで「略式軍服」を検索すると、1940年発行の岡倉由三郎編『新英和大辞典』がヒットし、以下のような項目を見つけることができる。
tu'-nic [tjúːnɪk] n. 1) 〘古代ギリシャ・ローマ〙襦袢, 肌着, シャチ; 2) 一種の陣羽織; 3)(現代婦人の用ひる)腰部緊着上衣; 4) 〘俗〙密着短上衣, 略式軍服(又は, 警官服); 5)〘解・動〙被膜, 膜(=integument); 7)〘植〙膜質外皮, 種皮(=husuk). [OF tunique, < L tunica]
つまり辞書レベルで「略式軍服」は「(軍服の)チュニック」の訳語だったのである。
これは法華狼氏が「ほとんどが翻訳で採用された言葉だった」と書いているのにもつながる。
実際に、国立国会図書館デジタルコレクションで読めるいくつかの翻訳書籍の原文を確認してみると、
エリック・アンブラー著・宇野利泰訳『真昼の翳』(1963年)
He stood up, as if to end the discussion, and smoothed down the front of his tunic.
when he came back he looked lovely in his uniform, with all those pretty ribbons on his tunic,
コーネリアス・ライアン著・木村忠雄訳『ヒトラー最後の戦闘』(1966年)
Golbov took out of his tunic pocket a folded copy of the newspaper Red Star
用例が少ないために「それが定訳だった」とまでは言えないかもしれないが、「チュニックを略式軍服と訳していた」ということの証左にはなっていると思う。
そりゃそうなんだろうけども。そんなに?
追記:FESSをOSに直接インストールするのに参考にしたというよりコピペさせてもらったのは以下の記事
https://qiita.com/hyoshiaki/items/598127fe30b94bd82b6e
半年前に辞めてしまった前任者から存在すら知らされていない客先のメールアカウントが必要になった。
無いならないであきらめてもらえるんだが、僕は優しいのでファイルサーバに無いかくらいは確認しようと思ったが
なので昔うっすら使ったことのあるFESSで全文検索しよう、多分txtかxlsだろう。
とウェブサイトで構築方法を見ると今はDockerで動かすのが良いらしい。何がいいか知らんが。
ドキュメントに従いインストールし、なんとかクローリングまで実行できたが、重い。重すぎる。
サブフォルダ無しで100ファイルくらいのフォルダでも2,3日回しても終わってない。
CPU使用率が50%超えてるんだよ!ってログが出まくっている。そのログ出力無駄じゃない?
使えないかー、とググってみるとDockerではなく素で構築する方法を有志の方が書かれているのを発見。
それに従い構築。するとサブフォルダ5階層くらいのフォルダが3分くらいで終了。
ログにCPUがーっていうのも出てないわけではないが、明らかに少ない。なんだこれ。
Dockerは構築楽らしいしVMよりエコだっていうのは聞いたことあるんですが、