「全文検索」を含む日記 RSS

はてなキーワード: 全文検索とは

2024-06-06

生成AIは生成するために使ってくれ

生成AIバブルだけど、大半の要望は「ファイル検索」なんよ

「生成AIならファイルの中身を学習して回答してくれるんでしょ?」

って99%の担当者が言ってくる

かにそういう使い方はできるけど、そもそも全文検索でできるから

文章を生成しなくても

「このファイルのここに書いてありますよ」

って教えてあげるだけで問題解決するから

それで解決しない課題解決しない理由がどこかにちゃんとあるはずなのでそれを洗い出してください

まぁ大抵は「文章化されていない」「制度が整備されていない」のどっちかだけどな

2024-06-02

anond:20240601112828

青空文庫全文検索で出てくる使用例は全部、水属性だな。

昔とは意味が変わったというのはありそうだ。

2024-05-18

https://anond.hatelabo.jp/20240518025458

 Google 検索は、検索漏れがしばしば発生したので、検索漏れに対しては、「登録しまから、その URL を報告してください」というページが用意されていた。しかし今は、そのページがなくなって、検索漏れの報告の受付をしなくなった。

 

 かわりに、サイトの持主ならば、あらかじめサイト登録しておくことで、検索漏れを報告する特別なページが使える。ただし、あらかじめサイト登録しておくことが必要なので、手軽に報告することはできない。

 また、いちいち(数分間をかけて)検索漏れ検証する必要があるので、多くのページを次々と報告することもできない。

 

 結果的に、検索漏れのページがたくさん発生したまま、報告を受け付けないので、検索漏れのページがたくさん残っている。検索漏れのページは、昔はほとんどなかったのに、今ではたくさん発生するようになった。そのせいで、ブログを書いたあとで、サイト検索をしても、Google では検索漏れが多大に発生するようになった。仕方がないので、ブログ機能全文検索するしかない。これだと、サーバー機能が弱いので、瞬時に結果が出ることはなく、かなり待たされるが、検索漏れがないので、Google よりは信頼できる。しかし、遅いんだよね。

 

 

地方公務員からデジタル庁へのおねがい

厚生労働省は通知関係データベース全文検索できるようにしていて国の役所の中では比較的ましな方なんだけど、

こんなふうに重要通知をスキャンデータ掲載してるだけのケースも山ほどあるんよ。なんとかしてくれよ

https://www.mhlw.go.jp/web/t_doc?dataId=00tc1901&dataType=1&pageNo=1

一応市町村向けの専用ポータルみたいのはあってpdfで取得出来たりはするけど、改正の新旧対照表だけのっけて

改正を反映した溶け込み後の通知や条文がついてないとかザラなんよ。頼むよ。

おまえのパソコン一太郎ファイルをそのまま載せればええんよ。

あと保育関係な。通知の名称検索するとGoogleさんがpdfファイルへの直リンを示してくれるけど、

おおもとのhtmlでのページが見つからないもんだから、そのpdf時系列的に最新なのかわからないのよ。

こども家庭庁への無理な移行で重要通知は引き続き内閣府サーバにあるし検索性最悪だしなんとかしれくれ。

2024-05-07

anond:20230609180256

最近は以前ほど流行らなくなった感もあるが、こういったツールを用いて全てを一箇所に記録、蓄積して知的生産に役立てようというのは自分の中でも大きなテーマになっている。

メモツールの類にドキュメントを片っ端から放り込んで全文検索するのが基本的な使い方だ。

近頃はペンダント等のウェアラブルデバイスで常時録音録画して、音声や画像から文字起こしテキスト抽出し記録して検索対象とするサービスが出てきた。

極端な話、もし出生した時からこうしたデバイスを常時着用し、見聞きしたあらゆる事をデータ化できれば、その人生のすべてが検索可能になるだろう。

今後、脳と機械BMI接続できるようになれば、脳内記憶あるいは思考すら外部にデータとして蓄積可能になるかも知れない。

そうなれば、ある意味自分分身デジタル世界に創り出されるとも言える。生きているうちに自分デジタル化するのが今の願望だ。

2024-04-15

デジタル化が進んだおかげで人権を手に入れられている

デジタル化したせいで余計な作業が増えているという記事を読んだ。

https://blog.tinect.jp/?p=86085

自分80年代まれオッサン記事の著者よりも年配なのだが、これっぽっちも共感できなかった。と言うのも社会デジタル化が進んだ時代でなければ、まともな生活を送れていなかったであろうと断言出来るくらいデジタル技術に助けられているからだ。

子供の頃より発達障害の気があったのか、とにかく紙を使った事務作業的なことができなかった。手書き文字が汚すぎて第三者が読めない、学校で配布されるプリント類はまともに整理できないわ、授業の板書はただの走り書きになって見返しても意味不明になるわと、とにかく書類が扱えなかった。手帳を買ってもまともに記録できなくて予定管理ダメダメだった。

そんなわけで、高校までの授業態度を加味した学校の成績は壊滅的だったが、勉強自体はそこそこできたので大学進学はできた。大学生になると授業のレポート作成PCを使えるようになって生活が一変した。壊滅的だと思っていた事務能力が、PCのおかげで飛躍的に向上したのだ。

まず、まともに資料が作れるようになった。手書きノートと違って、誰でも美しい文字がかけて何度でも修正が効く。メモ帳テキスト形式文章を作っておけば、後から内容を検索して見返すことができる。PCのおかげで高校生まで苦手意識のあった資料作成が得意分野に変わったのだ。

次にデータ管理PC検索機能ソート機能には本当に助けられた。ファイル整理を一切しなくても、全文検索拡張子別に並べて日付ソートすれば目当ての資料が見つかるというのは最高すぎた。紙だとそうはいかないので大変だった。

自分場合

必要書類が見つからなくて棚をひっくり返す

数ヶ月後に別の書類必要になった時、前回の捜索でひっくり返したせいで資料がぐちゃぐちゃになって見つからさらにひっくり返して探しまくる

その次、別の書類必要となった時にはさらに棚が混沌としておりもはや発見困難…

というような悪循環を繰り返していたので、デジタル化によってようやくまともに資料管理ができるようになったのだ。

就職活動ときデジタル化に助けられた。そもそも手帳が使えない人だったので、PCからでも携帯からでも入力できるGoogleカレンダーがなければスケジュール管理不可能だった。履歴書だって手書きで作ると字が汚すぎて門前払い喰らっていたかもしれない。

学生の時点でこうなので、就職してからはなおさらである。紙ベース仕事する職場だったら、入社直後に社会不適合者のレッテルを貼られてしまい、干されてパワハラ受けて鬱で退職していたかもしれない。今の職場で15年以上働き続けて、いつしか管理職になり、今では部下を持ってそこそこ仕事が出来ているのはデジタル化のおかげとしか言いようがない。

仮に自分昭和平成初期に社外人になっていたかと思うとゾッとするので、デジタル化が進んだ時代に生きることができて本当に良かったと思っている。そんなわけで、この手の社会デジタル化の議論をする時は、効率の面だけでなくて発達障害の気のある人の救済になっているという側面についても、もう少し注目されても良いのではないかと思う。

2024-04-02

増田の新あいまい検索挙動が興味深い

増田の新全文検索

ひらがなカタカナ両方引っ掛けてくれたり

漢字をひらがな表記にしても引っ掛けてくれたり して賢いんだけど

同音の別の漢字もひっかける のは不便な時の方が多そうに感じた

それはさておき、これ実現するの結構めんどくない?簡単にできるライブラリとかあるの?

2024-04-01

増田検索改善は残念

エイプリルフールネタビッグ検索はともかく全文検索機能改善については、これはこれで簡単検索できることで対立の場としての扱いが加速されるんだろうな

過去増田を発掘しまくる人も出てくるだろうし昔乱暴に書き捨てた記事とか早いとこ消した方がいいし、空白エントリをアップしてしばらくした後で増田でも表に出しにくいこと書いてネットに放流するといったことも気分的にやりにくくなった

俺にとっては増田Googleドメイン検索検索するくらいの手間がちょうど良かった

2024-03-15

anond:20240315160716

前よりマシになったのは確かだけど

全文検索がCJKのこと考えてなくて4文字以上の単語しかインデックスしないとか、word wrapの問題とか、中華フォントとか

西洋人が思いつかない落とし穴はまだまだいっぱいあるよ

2024-02-03

anond:20240203225636

青空文庫全文検索結果

https://myokoym.net/aozorasearch/search?word=%E8%86%82%E5%8A%9B

「可笑しいことに、子路の誇る武芸や膂力においてさえ孔子の方が上なのである。ただそれを平生用いないだけのことだ」(中島敦弟子」)

などの使用例があるそうです

2024-01-24

脳に負担をかける方法

方言禁止話題になって増田もぜんぜん歴史のこと知らなかったんだけどさ、一瞥して企画意図はわかった、というか、正解かわからないけど増田脳内経験においてそういうことだろうってイメージはわいたよね。

いわゆる英語/カタカナ禁止ゲームみたいなやつの一種だなこれ。って。逆ルー語っつーのかな。

そういう普段の出力に一回変換をかませて言いよどんだりウッカリ変換できなかったりを笑う、人間性を笑うというと言葉が悪いけど、人間ならではの労働の苦しみと創造性を楽しむ笑い。

増田関西人だけど関西弁禁止で話してっていわれても不快感はないしぼろぼろ失敗して笑われて自分でも笑うだろうなって思う。

からなんだ、こんなもんに沖縄だけ特別視すんなよとか(他地方版では好評らしいし?)、実際今を生きる沖縄人の若者がこの企画文脈独自に読み取ってどれだけ憤るかってのはすごーく疑問に思ったりする。

  

まあこんな雑な感想はどうでもいいんだが。

それでまあこういう企画ってやっぱ面白いよねって。何が面白いってさっきも書いたけどユニーク表現もあるけどメインはやっぱり人の焦りとか苦悩とか失敗な部分なわけじゃないですか。それを起こすってのは一言で言って「脳に負荷をかける」。

じゃあほかにどんな脳に負荷かけての回答を楽しむ方法があるのかなーって気になるのよね。

 

第一は今回問題になった方言ルー語といった変換系。変換対象を見つける能力と適切に変換する能力必要で、脳に全文検索を強いるから難しいと思う。

次はー、時間制限王道王道だよね。タイムリミットギリギリでの焦りから珍回答を連発する姿が滑稽で面白いタイムショック(古すぎだ)とかネプリーグとか。

ネプリーグタイムボンバー時間制限もだけど、チーム戦で後半になるほど有効回答が減っていくという使えるものが減っていく点もちょっとだけ似たような構図になるのかな?幽遊白書の使える言葉が減っていくゲームとかもこれで考えて喋らないといけない。

脳を働かせないとでいうと酸欠系はあるだろうか?激しい運動を伴うやつ。フレンドパーク(これも通じないだろうな)のルームランナーで走りながら答えるやつって走る人と答える人別々だったっけ?忘れたけど走りながら答えるなら大変だよね。ほかに具体例は思いつかないけど若手芸人が早いもの勝ちのビーチフラッグみたいに回答権を競うやつはありそう。はあはあ言いながら瞬発力で答えるのは大変で笑いになるはず。

もっとシンプルに「脳を働かせない」なら簡単だ。飲酒。これに勝るものなし。芸能人はぁ、あんまりしなかったりする?ドッキリ・隠し撮り系とか?あまり見ないからわからないけど、テレビ飲酒した素人との会話が笑いになってるといえば月曜から夜更かしだろうか。かなりメイン企画になってたと思う。ネットではもう「飲酒実況」とか古くからの笑えるコンテンツだね。

あー酸欠系に似た感じだと欲求疲労系みたいなものもありそう。たとえばまたネットで言うと「耐久配信」みたいな長時間やったり眠らなかったり。これは増田は見たこと無いんだけど。後半は面白いのだろうか?テレビだと帰れま10?食欲を満たす方向と長時間拘束の疲労がウケてたのだろうか。ガキつかの24時間の寝る前や終了前はかなりぐだぐだになるよね。いや書いてて思うけど喋りは面白くないなこれ。疲労系は単純に出てくる量も質も悪くなってその状態左団扇で見て楽しむもうちょっとハイコンテクストな笑いだわ。

 

こんなもんかな?増田、あまりバラエティは見るほうじゃないから思ったほどでなかったわ。あとはー…危険球でいうと、どんな話題でも「与党がー」みたいにこじつけてくる人は脳死で書いてる~みたいに言われてこれも「脳が働いてない笑い」になるのだろうか?おおあぶないあぶない。

TSや男女入れ代わりは女性文化模倣しきれない男性を楽しむコンテンツスカートで股開いたり?いやーやりすぎると無能低能力を嗤うに繋がりそうでダメだね。あくま一時的にってのが大事だと思う。

2024-01-23

anond:20240123122345

オレはraindrop.ioに移行した

無料でもはてブ上位互換だし

年5000円出せばブクマしたページの全文検索記事保存機能がついてお手軽ウェブアーカイブになる

2023-11-02

X(Twitter)を出会い系にするのは日本法律ではほぼ無理

このまとめを読んで、確かにこのままいくのはマズいと感じたので、思ってることを一応自分もまとめておきたい。

イーロン・マスクがXを「出会い系アプリにする」とか言い出したけどXをやめたい→でも、こんな理由があるのでXをやめるのは簡単ではない

https://togetter.com/li/2250441



■■ イーロンマスクへの提言

X(Twitter) の出会い系化をやめるべき。

さもなければ日本人日本企業は X(Twitter) を利用することが事実上できなくなる。

■■ そもそも日本における出会い系サイト定義

面識のない異性と交際したい人=「異性交希望者」といい、交際したい書き込み=「誘引情報」という。

  1. 誘引情報掲載し、
  2. 誘引情報閲覧でき、
  3. 異性同士で相互に連絡をとれる仕組みがあり、
  4. それをサービスとして提供すること。

という「出会い系サイトの4要件」というのがあり、これに当てはまると出会い系サイトということになる。

■■ じゃあ X(Twitter) はどうか
  1. 誘引情報掲載(=現状できちゃってる)
  2. 誘引情報閲覧(=現状できちゃってる)
  3. 異性同士で相互に連絡をとれる仕組み(=DMがある)
  4. それをサービスとして提供する(=現状はしてない)

→ これにより X(Twitter) は、日本法でもマジで出会い系サイトに該当することになりそうだが

→ 現行の法制では恐らくならない。

→ なぜなら X(Twitter) は異性交際だけでなく同性交際もできる仕組みなので、出会い系サイトではないと言い張れるのである

まとめると、 X(Twitter) は本来ギリギリ出会い系サイト扱いされずに済んでたサービスなのだが、「出会い系サイトにする」と明言されてしまうと、それは出会い系サイトになる可能性が高まるである

インターネット異性紹介事業」の定義に関するガイドライン

https://www.npa.go.jp/policy_area/no_cp/uploads/01.pdf



■■ 万が一 X(Twitter) が出会い系サイトに当てはまるとどうなるか

出会い系サイト規制法(インターネット異性紹介事業を利用して児童誘引する行為規制等に関する法律)の規制がある。

  1. 18 歳未満を相手にする誘引情報掲載してはいけない。すぐ削除&退会しないといけない。
  2. 18 歳未満に誘引情報閲覧させてはいけない。すぐ削除&退会させないといけない。
  3. 18 歳未満と相互に連絡できてはいけない。すぐ削除&退会させないといけない。
  4. 18 歳未満にサービス提供してはいけない。年齢確認しないといけない。

まり 18 歳未満がサービスに絡むことを徹底的に排除監視する義務を負うのである

守らないと違法

JC/JK が X(Twitter) 上で「私 JC だけど新宿でこれから即ホ苺」みたいな書き込み放置した瞬間にアウトになり、警察サービス中止命令ができる。

インターネット異性紹介事業を利用して児童誘引する行為規制等に関する法律等の解釈基準

https://www.npa.go.jp/laws/notification/seian/shounen/shounen230705.pdf

インターネット異性紹介事業者の閲覧防止措置義務(いわゆる削除義務)に関するガイドライン

https://www.npa.go.jp/policy_area/no_cp/uploads/02.pdf

もちろん「成人指定とか18禁とかと同じアダルトサイトという括りになるため、教育現場で X(Twitter) を使用することが出来なくなるであろう。コンプラ意識する法人も 18 禁サイトは非常に使いにくくなる。出会い系サイトを名乗るということは、そういうことなである

■■ 利用者の年齢をどうやって確認するか

年齢確認で使っていい手段はいくつかあるが、

  1. 公的身分証あるいは書類を提出させて年齢を確認
  2. クレジットカード支払いなど18歳未満が利用できない手段を使って、何らかの利用料を支払わせる
  3. 携帯キャリア民間の年齢確認サービスなどと API 連携するなりして年齢を確認

これを乗り越えた人しか X(Twitter) を利用することができなくなってしまう。この時点で相当数の離脱者が出てくる可能性が大。

■■ ・・・今でも充分「出会い系」として機能してるんじゃね?

ほんとにそう。昨今の未成年淫行なんてほとんど X(Twitter) やインスタの DM がキッカケになってると思う。警察も X(Twitter) のタイムラインを熱心にパトロールするようになったが、防ぎきれていない。なので SNS警察が今までやってきた青少年保護育成に対する障壁になっているのである

実は出会い系サイトで「未成年淫行」が問題になることはほぼ無い。出会い系サイト運営側はかなりしつこく未成年排除している。そのためなら全文検索するし AI活用するし目視でも確認する。ところが X(Twitter) にはそれがない。未成年が守られていないサービスはむしろ SNS のほう」であることを認識すべきである

■■ 今後 X(Twitter) が出会い系扱いされないようにするための提言

課金者以外は出会い系機能を使えないようにするなど、徹底したゾーニングを行って欲しい。

あるいは DM 機能を年齢確認必須にするか、課金者専用にするなどが良いのではないだろうか。

2023-09-21

anond:20230921161731

全文検索にはお金がかかるのだ

ロクに広告も見てくれない増田にそんなお金をかける理由はない

2023-08-16

anond:20230816115725

Twitterみたいな大量の投稿検索する機能実装はめちゃくちゃ大変なんだよ

そのTwitterでさえ全期間の全文検索実装できたのは何年も経ってからだった

anond:20230815214831

SNS検索場所として注目され利用され始めて10年以上経つのに、ポストTwitter(X)として新たに立ち上げられたSNSは全部閉鎖的で全文検索できないようになってるって何なんだろね

単に機能つける金がないってだけならいいけど。アメリカ不況から投資してくれなくなってるってこと?

2023-07-24

能を題材にしたマンガを見つけるのは難しそう

よっぽど有名なのならググっただけででるだろうがそれ以外はbooklive等紹介文を全文検索できるとこの力を借りるしかない

それにしたって「能」検索しても「能力」とか「無能」あたりでたくさんヒットするだろうからその中から探すのは難儀だろう

少年院に入った女のマンガ見つけるのも難しそうではある(本当は少女専用の少年院なんてないんだが所詮マンガならこのあたり厳密に考えてないだろう)。

2023-07-07

Evernoteがつぶれて困っている人たちへ

究極のメモを教えてあげよう

それはWordファイル

そう、Microsoft Wordで使っているWordファイル

WordファイルMicrosoft Word以外でも普通に更新できる

もうユーザーインターフェースが〜とかアプリの使い心地が〜とか騒ぐ必要はないぞ、自分で好きなものを選べ

WordファイルOneDriveにおいておけば勝手に同期してくれる

もうマルチデバイスが〜とか同期するデバイスの数が〜とか騒ぐ必要はないぞ、OneDriveがいやなら他のストレージ使って同期しろ

Wordファイルなら大体のものコピペして無理やり突っ込める

全文検索? 使ってるOSファイルマネージャ検索すればヒットするだろ

Wordファイルならあと100年は残ってるんじゃないの?

じゃあな

2023-06-11

PDF + EPUB管理ってみんなどうやっているの?

DRMフリーPDFとかEPUBファイルが500個ぐらいあるんだけど、

全文検索ができて

・できればWindowsiPadで読んだ位置を同期できると嬉しんだけど

かいものありますか?

2023-06-07

AIチャットって絶対検索の代わりにはならないわ

パイの奪い合い」っていうけど、日本人ならパイではなくピザでは? https://anond.hatelabo.jp/20230606141141

これ見て「経済パイっていつから使われてるのだろう」と思ってChatGPTとBingとBardに「いつ、誰が使い始めた?」と質問を投げかけた。英語で。

アダム・スミスです」「ケインズです」「マーシャルです」「マルサスです」って全く一致した回答がでない

それぞれの回答を個別検索してもパイ言及した文章は出てこない

Bardで何度か質問した後で「マーシャルです」しか言わなくなった

そこで「経済パイマーシャル最初?」と聞いたら「いいえ、マルサスです」と答えたから「マルサス最初?」と聞いたら「いいえマーシャルです」だって

その後、自信満々に「マーシャルは「経済原理」という著名な書籍経済パイに例えました。書籍からその部分を引用します」って「国家経済ケーキに例えられる~ホニャララ」って文章が出てきて(いやパイじゃないやん)って思ったけど、ケーキでもいいやってとりあえず検索チェックしてみたけど、一致する文章は出てこない。

古い本だからグーグルブックで全文検索もできるんだけど「cake」と検索しても結果に出てこずデマだった。

AIチャットデマ掴まされるばかりだから検索には絶対に利用できない

ログイン ユーザー登録
ようこそ ゲスト さん