「検索対象」を含む日記 RSS

はてなキーワード: 検索対象とは

2019-10-19

anond:20191019183452

自分機械学習に詳しいかどうかはわかりませんが,わかる範囲で書きます

質問テキストを投げるとそれに一番見合ったFAQページのリンクタイトルを表示してくれるチャットボット的なプログラム

チャットボット」はただの UI であるので

を実現する事が目的だと考えて話を進めましょう.

一般的にこのタスク類似文書検索と呼ばれていますブックマークコメントでは「ElasticSearchを使え」と言われています.ElasticSearch の More Like This Query 機能を使うことで類似文書検索が実現できるようです.あとはパラメータを調整することで思い通りの結果が得られるのではないでしょうか.

より高度なアプローチを取るのであれば,BERT と呼ばれるニューラルネットワークモデル活用した類似文書検索可能です.こちらのブログ (ElasticsearchとBERTを組み合わせて類似文書検索 - Ahogrammer) が参考になるでしょう.

しかしこれだけで終わると悲しいのでもう少し機械学習の話をすることにします.

機械学習的にこの問題に取り組むには順序学習 Learning to Rank という問題を解く必要があります.順序学習google 検索にも使われている機能です.

これは,「入力 x に対して N 個の候補 y_1, y_2, ..., y_N を類似している順に並び替えるようなスコアを出力する関数 f(x, y_i) を学習する」というものです.

More Like This Query 機能よりもこちらのアプローチが優れているのは,前者はどうパラメータチューニングしようと「類似している文書しか得られないのに対して,後者は(先程引用したような)「見合った」を明示的にデータとして与えてランキング学習できる,という点です.

学習データとして「この質問のに対してこの FAQ ページがもっとも見合っている」「この質問に対して A と B ふたつの FAQ ページがあるが,B より A の方が見合っている」「この質問に対して見合った順に全ての FAQ ページを並び替えたもの」といったデータを大量に準備することで,「見合った」を学習することが可能です.

しかこちらも ElasticSearch の機能に搭載されているようです.ありがとう ElasticSearch.お疲れ様でした.

もしあなたが ElasticSearch を使うのではなく, Python を使って再実装したいと考えているのであれば,目印として必要ライブラリ概念を書いておきます

2019-01-14

Pubmed検索とか犬猫アレルギーとか

Pubmed検索のやり方について

PubMedパブメド)とは、MEDLINEなどを対象とした検索エンジンである

MEDLINE(メドライン)とは、医学を中心とする生命科学分野の文献のデータを集めたオンラインデータベースである

かい話はググれ。

https://www.ncbi.nlm.nih.gov/pubmed

とりあえず医学論文を調べるだけなら、公式サイトのページ上部の検索窓に適当単語をいくつか放り込むだけで良い。オートサジェスト機能もあるよ。

基本的英語論文対象としているので、日本語検索しても何も引っかからない。また、大文字文字区別しない。

半角スペースで区切った単語基本的にAND検索となるが、大文字のANDで区切って明示的にAND検索することもできる。他にもORやNOTや()も使える。

検索語句複数単語からなるフレーズである認識された場合はそういうものとして検索される。ダブルクォーテーションで囲むことで明示的にフレーズ解釈するようにもできる。例えばdog allergyなら5000件ほどヒットするが、"dog allergy"なら50件である

検索対象となるデータは著者名・文献のタイトルキーワード雑誌名・その他となる。検索する単語の後ろに[タグ]とつけることで、単語検索する場所指定できる。例えば[ta]なら雑誌名だ。例えばdog allergy [ta]で検索すると"Allergyという雑誌の犬に関する文献"が189件ほど出てくることになる。

著者名で検索する場合ちょっと変わっていて、ラストネームをフルで記載してファーストネームとミドルネームイニシャルを後ろに付ける。山田太郎ならyamada tだし、ルルーシュ・ヴィ・ブリタニアならBritannia lvだ。多分な。

検索窓の下のAdvancedからさらに高度な検索のあれこれ(例えば小規模な症例報告に絞るとか)ができるんだけど、きりがないので興味があればググれ。Pubmed 検索とかでググって出てくるのを3つくらい読んだら大体分かる。

ちなみに検索結果のところにFree PMC Articleって書いてあったらその文献はタダで全文読めるぞやったな。

PATM検索してみる

まずはPATMを"自分自身が皮膚から放散する化学物質によって,周囲の他人に対してくしゃみ,鼻水,咳,目の痒みや充血などのアレルギー反応を引き起こさせる体質"と定義しておこう。ちなみにこの定義引用元は例の皮膚ガス測定の論文だ。

とりあえず、PubmedPATM検索したら91件ヒットする。これはphosphorylated ataxia-telangiectasia mutated(pATM)という全然関係ないものが引っかかるからだ。これがPATM Allergyだと3件になるんだけど、全て全然関係ない論文なので要するにこのアプローチは駄目だ。

そもそも普通医学論文は実際に発症している患者サイドに視点を置いて書かれているものと期待できる。報告があるとしたら"ヒト由来の抗原によってアレルギー発症した症例"についてのものになるだろう。PATM定義からその病態は1型アレルギー、具体的にはアレルギー性鼻炎か蕁麻疹、ひょっとしたら気管支喘息に近い症状を呈すると予想される。じゃあそっちの報告でヒト由来の抗原で、もしくは抗原をくっつけた他者との接触が原因で発症したパターンを探せばいいんじゃないの?

そこまで決めたらタイトルか抄録に使われてそうな単語を思いつくままに入れて検索ボタンを押し、検索結果を上から順番に見て回る。それっぽいことが書かれたものを見つけたら、その抄録画面の右側を見てみよう。その文献に関連している他の文献へのリンクが張ってあるぞやったな。本文を読める文献なら末尾に参考文献のリストがあるはずだ。そこもチェックして関係ありそうなら読んでいこう。あとは芋づる式に当たりを探すだけだ。どう考えても関係なさそうな文献はタイトルだけでスルーしてかまわんぞ。

で、結論から言うと私が探した限りでは人体由来の抗原が他者アレルギーを起こしたという報告は、母乳アレルギーで児がやられたとかしか見当たらない。これがPATMの正体ということはないだろう。

一方で"直接動物を飼っていない人が他者媒介されて動物アレルギーを引き起こす"という話がある。これとか↓

https://www.ncbi.nlm.nih.gov/pubmed/26934742

https://www.ncbi.nlm.nih.gov/pubmed/29434523

個人的には微量の皮膚ガスよりも余程こっちの方がありそうに思うが、如何に。

日本人における何らかのアレルギー疾患を持っている頻度は30%を越えているが、逆に言えばどんなに最凶のアレルゲンを持ってきてもその辺の10人中3人くらいしかアレルギーの症状は起こさないだろう。PATMを訴える人がそれを超える頻度でアレルギー症状を振りまくのであればそれは大層画期的なことだ。

知り合いにPATMを主張する人が1人居るが、その人は風邪を引いている私の前に来てまず自分が臭くないかと聞き、それが否定されると次にPATMを訴え始めた。私はその人は典型的自己臭症だろうと思う。そして私のはただの風邪だ。

Pubmedで調べた結果はないが、PATMの人の腸内細菌叢の変化を調べるという研究がある。

https://clinicaltrials.gov/ct2/show/NCT03582826

あとはまだ読んでないけどこのへんとかはどうなんすかね↓

https://www.biorxiv.org/content/early/2017/05/19/139014

とりあえずPATMについては以上です。

ところで話は変わるんだが

他人アレルギー症状を起こさせる疾患「PATMパトム)」は実在するか? - NATROMブログ

http://natrom.hatenablog.com/entry/20180928/p1

もちろん、論文がないからといってPATMという病気がないことにはならない。また、PATMとされている患者さんの苦痛は気のせいなどではなく実在しているものであるしかしながら、病気の真の原因について正しく認識できなければ、かえって患者さんの不利益になる。私はそれを危惧する。

これを読んで、

ニセ科学に陥るNATROM氏へ (ブコメ返信あり)

https://anond.hatelabo.jp/20190105145539

Pubmedにない」のは当然であり、これを理由にこのような症状がない、とは言い切れません。

症例報告がなされていないもの実在しない(きわめてまれ)という事はありません。

つかそれ以前に↑に書いたようにPubmedに載ってない事が症状が無い理由とは言えないんだけどね。

こうなるとさすがにこいつは何を言ってるんだ???と言わざるをえない。

「AはBである」論なので論拠が必要ですが、論拠を求めるとNATROM氏は"データなどあるわけない"と逆ギレし、一向に論拠を示してくれませんね。

ほーん、どこかでなとろむ先生に論拠を要求したことがあるのかね。

まあ私はこの増田がなとろむ先生記事コメント欄いちゃもんを付け続けてアクセス遮断された誰かであったとしても知ったことではないが。

他人アレルギー症状を起こさせる疾患「PATMパトム)」は実在するか? - NATROMブログ

http://natrom.hatenablog.com/entry/20180928/p1

PATMで苦しんでいる患者さんは、代替医療を行っているクリニックで今現在調子がよいならいいが、もし良くならないようなら、自己臭症を診る精神科医相談してみるという選択肢も考えてみてはいかがだろうか。PATMを疑っている段階では、自費診療のクリニックよりも先に、精神科受診することを強く勧める。

これを読んで、

というか勝手NATROMが「Pubmedに無かった」ことを論拠に「PATMの症状は幻だ」って言ってるわけで(誰もPubmedで調べろとは言っていない)、

こうなるのはどう考えても論理的おかしい。

誰も幻だなんて言ってない……もしかして幻覚を見ているのでは?

普通は"無いことを証明せよ"とか言い出した時点でまともな議論は諦めて放置されるところなのだが。こんなのを長時間見てると科学アプローチ概念崩壊しそうだ。

あとがきによせて

私がこの増田を見た時に最初に気になったのは、この"調べ方"に対するこの異常なこだわりだった。

"調べたけど見当たりません"に対する最も簡単反論は"こっちで調べたらありました"だ。そこに検索ワードが何であったかは全く何の意味もない。というかヒットしない検索ワードを聞くことの意義とは一体。

例えばこれがSTAP細胞製造手法に関する質疑なら分かる。何故ならSTAP細胞は"ある"という主張だった。それならば間違ったやり方で検証しても意味がないし、検証にかかるコストも大きい。

しかしこれは単なる検索だ。思いついた単語ぽちぽち打ち込むだけだぞ? 検索ワードを知ることのどこに科学アプローチが?

何故か頑なに自分で調べようとしないこの増田が、執拗になとろむ先生が使った検索ワードを知りたがる理由とは何だろうか。普通はなとろむ先生もいちいち覚えてないと思うけど。

私は当初"最大限好意的に見て"、能力的な問題検索のやり方が分からないのではないかと考えていた。しかしどうやら違う。この増田別になとろむ先生が見つけられなかったものを見つけたいというわけではないと言う。

ブコメに対する返答を見るにつけ、どうやらこの増田はなとろむ先生が間違っている"ということにしたい"だけなのでは、と思えてくる。そう考えると色々と腑に落ちる。例えばなとろむ先生記述や、他人コメントを無理矢理自分に都合の良いように解釈しようとすることとか、やたらと他人属性を気にして連呼することとか。

つまるところお前、単にマウントとりたいだけちゃうんかと。

さて、馬鹿クソリプするからもう一度俺の意見をまとめとく。

長々書いたが以下の2点だ。

①「PATMは無い」と医者が主張するなら科学アプローチで主張すべき

個人的にはPATMあるかないか現時点ではわからない

②はどうでも良い。問題は①だ。

そんな主張をしているなとろむ先生存在しない。幻覚を見ているのでは?

ただ、なとろむ先生と私はPubmed検索してもPATMっぽい症例の報告を見つけられなかったから、そこで颯爽と1例見つけ出したらマウントくらいとれるんじゃねーの?知らんけど。

無駄に声がでかい人、間違いを認めようとしない人に指摘するのは大変です。全く。

せめて最低限の科学アプローチはできるようになって欲しい。本当に。

最後犬猫アレルギーの間違いの話な

"可能性のある原因物質" なんて精液アレルギーの原因タンパク質も犬アレルギーの原因の大部分も、まだぜんぜん特定されてねーよ。

これでも読め↓

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3519933/

ちなみに精液アレルギー分子量で大体の絞り込みができてたはずだよ。

で、

でもまぁ以前ネット投稿で「ある人が近づいたら咳が出る」とか投稿されてたのはあったと思う(ソースは待ってくれ)。

我々はいつまで待てばいいんですかね??

追伸

"犬に対する人アレルギー"みたいな意味不明な言葉には突っ込まないでおいてあげる。直すなら早めにこっそりな。

2018-11-18

同僚に教えたい 検索がはかどるChromeショートカット

仕事ネットでの調べ物が多くGoogleを多用するのだが、同僚をみているとどうも要領が悪い。気になったキーワードくらいさっと調べられるようになりたいものである

ただ自分が口出しをすると「うっせーおっさんだな」と言われるのがオチなのでここに書きとめることにする。ブラウザChromeを例にするが他のブラウザでも同様の操作はできるはずである

コピー

そもそも画面に検索対象が出ているのに、検索窓に自分入力する人がいる。「そっちの方が早いから」が理由だが、絶対そんなことはないのでせめてコピペくらい覚えてほしい。

コピペにしても右クリックで「コピー」「ペースト」ってやる人がいる。「そっちの方が早い」と言い張るのだから諦めているが、ショートカット「Ctrl-C」「Ctrl-V」(Macの人はCtrlをCommandに置き換えてほしい)の方が早いと思う。あと、マウスクリックドラッグしてずるずるとテキストを引っ張る人がいるが、最近はある程度の日本語形態素解釈するので、ダブルクリックからドラッグした方が単語単位選択できてよい。

検索

URL欄でGoogle検索できるようにしておく(これがChromeデフォルトのはず)。なぜかBingとかYahooを頑なに使っている人がいるけど素直にGoogleでいい。

「Ctrl-L」を押すと検索窓にフォーカスが移ってURLが全選択になる。なので、本文中に検索したいキーワードがあったら選択して、「Ctrl-C/Ctrl-L/Ctrl-V/Enter」のコンボで一発で検索ができる

別タブで検索したい場合

今閲覧しているページはそのままにしたいこともあるだろう。そういう時は新規タブを開く「Ctrl-T」を使う。新規タブは検索窓に最初からフォーカスがあるので、「Ctrl-C/Ctrl-T/Ctrl-V/Enter」のコンボ新規タブでの検索ができる。同様のことをする拡張機能などもあるのだが、他人環境だと使えなかったりするからここでは紹介しない。

タブを活用するなら、タブ移動コマンドや「うっかり閉じてしまったタブを復元(Ctrl-Shift-T)」なども覚えておくと便利であるが、あまり大量のショートカットを一度に覚えるとかえって効率が落ちてしまうのでここでは深追いしない。

英文を読む

単語を1つずつ調べている人がいるが、わからない単語が多すぎるなら素直に「右クリック+T」で全文翻訳してしまった方が早い。ざっくり文意をつかんだら原文に戻す。そうすれば検索しなくてもだいたい読めるはず。

翻訳機能を使うのが恥ずかしい、あるいは、ほとんど辞書なしで読めるがわからない単語が稀にある程度なら

https://chrome.google.com/webstore/detail/mouse-dictionary/dnclbikcihnpjohihfcmmldgkjnebgnj

この拡張機能が便利なはずだ。マウスオーバーするだけで辞書が引けるスグレモノである。なぜ「はずだ」と書いたかというと、いちいちON/OFFをしなければいけないし、たまに調べるくらいなら前述のショートカットで十分間に合うので、インストールしたのはいものほとんど使っていないかである

検索ワードもある程度コツがあるのだが別に紹介したい。「ググれカス」というのは簡単だが、文章にして説明すると案外面倒なものである

2018-11-12

anond:20181112104939

http://www.atmarkit.co.jp/news/200105/02/google.html

Googleは、ペタバイト級のストレージ1台にWebページ13億分のインデックスを持つ。「インデックスペタバイト必要としているからではない。1インデックスにつき数百のコピーを持つからだ」とGoogleマネージャMarc Felton氏は語る。

(中略)

大規模なWebサイトが、データ保存ストレージシステムとしてRAIDシステムSANを用いているが、Googleでは典型的ディスク型のストレージシステムを用いている。その理由を「その方が速いから」とFelton氏は言う。

Googleストレージデバイスの多くはMaxtorの80GBハードディスクドライブだ。Maxtor製品は、ハードディスクドライブ1台につきコントローラを1台、PC1台につきハードディスクドライブ2台を持つ。

https://internet.watch.impress.co.jp/cda/event/2004/11/16/5430.html

Googleでは検索対象ページをこれまでの約40数億ページから、約2倍となる約80億ページに拡充したばかり。容量は1ページあたり平均10KB、合計で10TBにも達するという。

https://japan.cnet.com/article/20081099/

Googleは、比較低価格マシンを大量に購入することで、通常なら数千万ドルもかかるようなコンピュータインフラを、わずか数百万ドルで構築してしまった。

2018-09-21

マイナーものが好きな者の生き方

作品自体人口膾炙している場合でも、

その登場人物一人一人を見てみれば、

作者の造形の気合いや、世間での知名度や、フアンの人気には、当然大きな差がある(登場人物が多ければなおさらのことである)。

私のような、マイナー人物フアンはしばしば同志に飢えている。

なぜマイナー人物にそこまで熱狂できるのか、それは自分にもよくわからない。

いわゆるフィーリングの一致なのであろうか。

もしくは想像解釈がその広がりをもとめて要請する、作品における描写の少なさ、かきこみの粗さがあるからだろうか。

ただまあ、それは今は措くとして、

とにかく影の薄い人物ファンもつきにくいので輪をかけてマイナーのままになる。

況んや美形でなく悪い描かれ方がされている者をや。

熱弁を奮わずとも、私の好きなものとしてその人物をともに好いてくれる友達は、いる。

そのようや友達はいうまでもなく大切な存在ではあるが、

しかし、その好感には、明らかに私が介在したことによる補正がかかっている。

私は私の必死さに絆されたわけではない見ず知らずの人がその人物を好いていてくれるのを欲しているのである

しかいくら世界的名作とはいえ

マイナーな奴はマイナーなのである

リアルでの出会いには明らかに限界があるので、

私はやや妥協してネット世界に繰り出すが、

検索対象世界にまで拡張したところで、そう簡単には同志は見つからない。

しかし、

しかである

時として、同志は、私の目の前にその姿を、あるいはその愛好の痕跡を現すのである

そういうとき、私は、一気に歓喜ピナクルに達し、

その身に積もるあらゆるマイナスのこと、

満員電車の疲れとか、両足の靴擦れの痛みとか、まだ火曜の夜であることとかを忘れて、脳内でドバドバと噴出している何かを喩へではなくして如実に感じとる。

往々にして、奇跡のその人自身とは、言葉を交わしたりすることは不可能なことが多いが、

それでも私はお宝を大切に握りしめて、

少なくとも一週間はピーからの緩やかな滑空を楽しみながら生きていくことができる。

さながらその場にへたりこんで、

ありがとうございます

ありがとうございます

といったところである

朝に死すとも可なり、などとは、

今の私にはとても曰えない。

私が、奇跡に面するたびに思うのは、

(これはややこの話の流れでは唐突だが、)発信することは大切ということと、

もう少し生きさせてください。

ということなである

2018-08-09

いただけるでしょうか

依頼の文面で「〜(して)いただけるでしょうか」を使う同僚がいて、見るたびに違和感を覚えていた。

書類を頂けるでしょうか」

「教えていただけるでしょうか」

「返却いただけるでしょうか」

などが用例。この人は会話でもこう言う。最後の例は「ご返却」としてほしい。

「いただけるでしょうか」ググってみたらそれなりに使われている。例えば「ご理解いただけるでしょうか」とか。これはなぜか違和感があまりない。しかしよくよく検索結果を見ると、依頼ではなく質問ばかりだ。あるいは、質問の体だけど答えは求めていない投げかけが多い。やはり依頼の「〜(して)いただけるでしょうか」は珍しいのではないか

動詞終止形に「でしょうか」が付いているから変なのかと思ったらそうでもない。

「まだ使えるでしょうか」

「雨は降るでしょうか」

これらには違和感がない。どちらも質問だけど。

自分は「〜(して)いただけますでしょうか」を使う。経験的に、他の人もよくこれを使っていると感じている。念のためこちらもググってみたら、誤用として複数ビジネスマナー指南サイトで紹介されているようだ。「ます」「です」が二重敬語なのだと。なるほど。

はいえ、検索上位にくるのは薄っぺらなページばかりで、これなんて特に酷い。

https://www.rirekisyodo.com/study/doublehonorific-point.html

日本語論理も内容もおかしい。こんな記事にとやかく言われたくない。

このページも酷い。

https://careerpark.jp/53907

「いただけますでしょうか」は二重敬語から NG と言いながら、「よろしかったでしょうか」は相手への配慮から OK とか。実際に NGOK かは別としても、この論理でよく記事にできたなと思う。

そしてこの「専門家」とは誰なのか。その専門家に「いただけますでしょうか」について聞くことはできなかったのか。まあ、そこだけ何かを読んで適当にぼかして引用したのだろうけど。

ここで感じたのは、「〜(して)いただけるでしょうか」は、こういったゴミみたいなビジネスマナー指南に従って「〜(して)いただけますでしょうか」を避けた結果として使われているんじゃないか、という疑問だ。

以下について知りたいけれども、検索だけでは答えが出そうにない。

1. 依頼の「〜(して)いただけるでしょうか」は昔から使われていて、これがむしろ自然だという人がいるのか。

2. 依頼の「〜(して)いただけるでしょうか」は「〜(して)いただけますでしょうか」を避けた結果という仮説は正しいか

3. 「〜(して)いただけますでしょうか」は、専門的にはどういう扱いなのか。

皆様のご意見、ご感想をお寄せいただけるでしょうか。

追記

そういえば便利な日本語コーパスがあったのを思い出した。

KOTONOHA 現代日本書き言葉均衡コーパス

少納言

http://www.kotonoha.gr.jp/shonagon/

まず「ますでしょうか」で調べてみた。「いただけ」は二重敬語の指摘に関係ないので。検索対象からヤフー国会会議録は除く。かなり例が出てくる。有名な執筆者ソースを幾つかピックアップしよう。

山本周五郎「人は負けながら勝つのがいい」1998

山﨑豊子「沈まぬ太陽」1999※

安部公房「方舟さくら丸」1984

京極夏彦本朝妖怪盛衰録」2003※

赤川次郎人形たちの椅子」1992

村上春樹東京奇譚集」2005

宮部みゆき「誰か」2003

曽根綾子「この悲しみの世に」1986

ここには、依頼でなく質問の「ますでしょうか」の例も含まれる(※印)。でも二重敬語が駄目なら依頼・質問区別関係ないだろう。

さて、「いただけるでしょうか」を検索たかったが、検索文字列10 字までということなので「けるでしょうか」で検索した。例はかなり少なく、依頼の用例はさらに少ない。とはいってもゼロではないこちらも有名どころを挙げておこう。

瀬戸内寂聴「女人源氏物語」1999

陳舜臣陳舜臣全集 第1巻」1986

というわけで、ここまでの個人的結論としてはこうだ。

1. 「いただけますでしょうか」は、文法的な是非はともかく、今後も自信を持って使っていいといえる十分な用例がある。

2. 「いただけるでしょうか」はそれなりに古い用例が存在するので、とやかく言うほどではなさそうだ。

2018-05-22

最近はてなブックマークはじめたのですが

ちょっと良くわからないところがあるので教えてください。

右上の検索ボックス入力して検索を押しても全くヒットしない語句がたびたびあるのです。

検索対象をタグや本文に変更しても出てこないですし・・・

いろんなSNSを使ってきましたがこんなの初めてです。

何か根本的な誤解をしているのでしょうか?

2018-01-13

派遣客先常駐なんだけど、派遣先業務システムがとにかくクソ遅かった

回線がクソなのかシステム設計がクソなのか知らんが、とにかくレスポンスが遅い

とある業務システム過去案件検索ボタン押してから表示されるまで10分くらいかかる

しか検索結果が1件だろうが1,000件だろうがかかる時間はほぼ同じ

そして仕事上、1日に平均10回くらい検索する必要がある

(新規登録なら比較的短時間で2、3分登録済みデータの変更だと5分以上かかるが、こっちは1週間に1、2回程度の頻度なので我慢は出来る)

クソ時間がかかるので、一度に何件も同時に検索必要場合は、「すみません、○○検索するんでPC空いてる人いますか?」と周囲に声を掛けなきゃならない

周囲の人達もこのシステムのクソさを嫌というほど知ってるので俺に対して協力的なのが唯一の救いだ

このシステムクライアントAccessなんだが、あるときデータベース認証情報ハードコーディングされている事に気付いた

そこで俺は一計を案じた

検索対象テーブルを丸ごと俺のPCCSV形式で吐き出させるスクリプト毎日深夜に自動実行するよう設定しておいた

検索する際はこのCSVファイルを使うようにすることで、検索の所要時間は1/10以下になった

それから数ヶ月後、データベースが吹っ飛んだ

原因は俺ではなく、情シス新人操作ミステーブル飛ばししまったようだった

社内は大混乱に陥った

バックアップは俺が派遣される前にファイルサーバー故障してそれっきり放置されていたため、存在しないも同然だった

仕方がないので情シス中の人に「俺こんなファイル持ってるんだけど」と申し出て、それを丸ごと流し込む事でその日のうちにテーブルは99.9%復旧し、社員はいつもより少し長く残業する程度で済んだ

もちろん上司監査から呼びだしをくらった

「お前何勝手毎日のように本番DBから社外秘データ全部抜いとんねん!万が一お前のPCまれたら新聞沙汰どころちゃうぞ!社長のクビ飛んどるぞ!」と、まあそりゃそうだ

俺はヘラヘラ笑いながら「いや~すんませんっした~」と言うしかなかったが、株価ストップ安レベルの重大事故を水際で新人始末書一枚に抑え込んだ事も考慮され口頭注意で手打ちとなった

それから数日後、情シスからスクリプトの提出を求められ、それが夜間のバックアップジョブ2世に生まれ変わった

情シス部長から検索するならこの共有フォルダCSVファイル使え」とこっそり耳打ちされた

2017-01-29

Twitter名前欄に一言コメ書くやつ

あんたらのせいでTwitter検索がまともに機能しないんだ。

好きな作品名? 好きなキャラ名? 好きな有名人

あんたらの「好き」で、こっちの「好き」が探しにくくってならないんだよ。

同じもの情熱注ぐ仲間だろうよ。邪魔しないでくれよ。

はやくTwitter名前欄を検索対象から外してくれよ。頼むよ。

2015-09-01

http://anond.hatelabo.jp/20150901214152

ちゃんとヒットしたけど。

サイドメニューの「検索対象」のところが「本文」になってないか?

2014-11-28

日本未来ネットワークとやらについて

選挙での「白票」を「社会を変える力がある」とミスリードする謎の集団日本未来ネットワーク」のサイトが突如出現

http://buzzap.jp/news/20141127-mirai-senkyo/

http://mirai-senkyo.com/

ソースコードにあったJavaScript関数名「FirstEntryCookieManageOnUnLoad」はかなり特徴的。

HTMLソースJavaScript検索対象としたサーチエンジン検索すると、

https://meanpath.com/f/lr5WLM

https://search.nerdydata.com/code/?and_code[]=FirstEntryCookieManageOnUnLoad


GMO制作したオンラインゲームサイトしかヒットしない。

Whoisの結果も、ドメイン登録業者GMO

https://twitter.com/magonote/status/537618636492390401

偶然にしてはちょっと被りすぎっぽい。


どっちにしても例の小4よりはガードが硬い。

小4サイトでは発火点となった、.com以外のプライバシープロテクションが効かないドメインの同時取得などもしていない。


ページ内で使っている画像もクセの残らない素材画像ばかり。

http://www.apimages.com/metadata/MSIndex/-/62762947/4/0

http://www.shutterstock.com/ja/s/%E9%80%81%E5%88%A5/search.html?page=1

技術的な側面からは裏で指示している組織まではたどれなさそう。


自分の予想では製作者は幸福の科学。でも万が一自民が作ってたら「有権者は寝ていてくれれば」の再来。個人の発言以上に言い訳が効かないはず。

マスコミは追ってみる価値は十分にあると思うよ。

現時点で唯一たどれそうなGMOルートソーシャルハッキングするとか、いろいろと工夫してくださいね


あとはサーバIPから同居しているサイトがどんなのかを洗い出してみようかと思っている。


なんかあれば追記しますが、できればもう少しいろんな側面から調べたいので何か思いついた人は協力お願いします。

こんな有権者を完全になめくさった真似をほっとけるかって話です。

---

追記

IPを使用しているサイト

http://tobira.sakura.ne.jp/doukyo/203.189.109.62

専鯖ではないみたい。たぶんあまりヒントはないなあ。


---

追記(14/11/29 AM11)

https://twitter.com/kensonmusic/status/538473167673491457

https://twitter.com/kensonmusic/status/538473574755868673

「昨日のどこかの時点で微妙に書き変えられている」とのこと。与党支持への誘導部分が消えてます

慌てて馬脚を引っ込めた感じ。


トラバから。使用フォントデザイン上のクセから分析

http://lunar0t.tumblr.com/post/103827308786

2014-05-21

vector.co.jp向けのはてなブックマークビューアー

ベクター向けのはてなブックマークビューアー

>>> 実装

コンセプト

ローカルで動くビューアーであること

コメントするとローカル領域に保存。アカウント不要(登録不要パスワード不要表記する)。

ホッテントリビューアー

ホッテントリを見るものなのでこれはただのニュースフィードリーダーはてブカテゴリートップに表示される記事しか見れない。でもタグ検索して独自のカテゴリーを用意してもいい。タグhatenaカテゴリーとか。「凍てつく波動カテゴリーとか。「うーむ」カテゴリーとか。非公式カテゴリー公式カテゴリーと混ぜて一覧化。(ふーむはタグではないので抽出しづらい。実現するなら別のアプリになる)

カテゴリーの紹介文も適当に付ける。ベクターではこういう点が大事

タグは表示から省く。その代わり発見したタグ自動的に集計。カテゴリー候補としてmyカテゴリー作成のそばに淡色で表示。クリックで見る、またクリックするとカテゴリー化。ダブルクリックでも右クリックからコンテキストメニューからカテゴリー化可能。機能としては「ピン留め」だけど、体裁はタブのほうが良さそう。

自分検索した言葉もタブ化するか?→必要ない。そこで見つけたタグのほうをタブ化したほうがはてなブックマークに馴染める。

ブコメは敷き詰める。あるブコメが終わった同じ行の、次の文字から次のブコメを続けて表示。全ブコメをまとめてインライン表示。ブコメの集まりがlistではなく一つの自由律散文詩に見えるように。タグは含めない。

両脇に発言者アイコン。誰がどの部分を書いたか意識すればわかるように、アイコンブコメの該当個所を同じ色の枠で飾ったり、関係線で結んだりしておく。ブコメに付けたローカルスターはてなユーザーと関連付ける。ブコメではなく人にスターを。集計を見たユーザーはてなユーザー個人を意識するように。

無言ブクマは「…」。無言の多さも見て取れるように。

日記を書いて、それにあう記事を探すという使い方も

1. 日記を書いたらストック

2. 日記に合うブコメ探しは普通に

3. 相応しい日記記事にストックを貼り付け

まりストック機能だけ。

このアプリ日記とした方がいい?wDiaryが参考になる。

コレクションコメントをするのが日記。それを日記のように見せるのならあり。

まずはWebから離れること

ベクターで受けているのは自前のPCにすべてを保存するアーキテクチャーだ。

次にビューアーであること。ダウンロードインストールまでした上に登録などベクターユーザの誰がするものか。よってアカウント不要の閲覧に機能を絞ることになる。

かゆいところに手が届く

ベクターでは良質ソフトウェアを評価するときによく「かゆいところに手が届く」という表現が使われる。ユーザのやりたい操作ができること(ユーザーの発想を広げないエクスペリエンス)と、技術的制約……ユーザから見て理由のよく見えない妙な制約が無いことの2点のこと。

見せ方

コメントをどう見せるかが鍵。世間の声?世論ユーザーを指定してミュートできるとコメントできない不自由さを解消できるかも。



情報を見せる順序

1. 人気コメント

2. 記事タイトル

3. 記事

4. コメント全てとツイート

気を引く順。情報量が少ないもの順にもなっている。

記事タイトルならどこのニュースサイトでもやっているので、人気コメントを先に。

人気コメントは表示するけど、はてなスターは表示しなくていい。星が見えないのではてな村の星祭り意味不明に見える。

スターは支持。演説の後援者のような立ち位置

ブックマークエントリータイトルではなく最人気コメント

最初に見せるのはブックマークエントリータイトル(記事タイトル)の一覧ではなく、それに付いたコメントのうち最上位の人気コメント発言者アイコン付きで。エントリータイトルはその下に小さく表示。

リツイートを除外したTwitterのようなUXになる。

メインコンテンツはてなユーザー

このアプリコメント機能は「はてなユーザーやそのブコメコメントする機能」。お気に入りはてなユーザーを強調表示したり、非表示ミュート)にしたり。

Web上の記事も読めるけど、中心になるコンテンツはてなユーザーブクマエントリーページを見ながらメタブを付けるのをローカルでやるようなものがこのアプリエクスポート機能によっていつかははてなブログへ移行。

強調表示は太字や色の変化や大承認の「キラ承認」のように。

非表示は二段階。網かけか淡色化で見えにくくするか、完全に非表示(collapse)にするか。検索など他のビューでも有効

はてなユーザーに付けたコメントはそのユーザーIDが表示される場面全てでIDに併記される。ラベルレッテル)貼り機能。ラベル背景色も変えたい。ラベル内でも強調語やユーザーIDを消す機能有効にしたい。

コメントには絵文字も使いたい。

お気に入りユーザー

特定はてなユーザーTwitterユーザーお気に入りに。ローカル保存。見つけたら強調表示。ユーザーの表示から容易に検索ビューへ進めること。

強調表示される語はユーザーIDに限らない。任意文字列。登録と削除のビュー有り。

ユーザーコレクション

ユーザーアイコンお気に入り登録してコレクション

コレクションビューで一覧化。その人の最近コメントが読める。

UI

UIWindowsデスクトップのもの。表を多用する。WindowsXP対応。はへらったーが参考になる。



記事の人気をグラフで表示

数字よりも塗りの面積で見せる。

上限ははてブユーザー感覚に合わせたいけどとりあえず1000usersで。それを超えることはあっていい。

機能

履歴

シングルウィンドウシングルドキュメントなぶん履歴を活用して利便性を補う。

検索

検索ローカル領域を。ユーザーが見てもいない情報検索対象外。お気に入りユーザーログは含めてもいいかも知れない。それでも一人分の全ブクマダウンロードしてから検索

気になる話題についてどんなコメントが寄せられているか調べるには?→ 検索必要。新着/人気の両方を切り替えられないと話題は見つけられない。

印刷

印刷機能重要PDF化もここからなので。.docxにできればなおいい。

暗号

コメントを保存する機能があるなら、暗号化すると受ける。履歴があるなら参照時にパスワードを設定するといい。あなたの心のセキュリティ

そしてネットへ…

「完全版」としてb.hatena.ne.jp宣伝する

「ご利用には利用登録が必要です」 「このソフトウェアと開発経緯について」ダイアログだけでいい。無意味に切り抜いた矩形でないダイアログで。スプラッシュスクリーン無意味に切り抜くとちょっとすごい感を演出できそう。影付けて立体的なペーパークラフト感を出して。

日記自分コメントを書く

日記の日付は設定にある「日付の変わる時刻」を反映したものに。デフォルト28:00(4:00AM)。12:00から36:59まで指定可能。「かゆい所に手が届く」機能

はてブを読んではてなブログを書くために使う利用法も。(ブクマではなく)ブコメに星を付けるとコレクション。日別の日記記事になる。記事内は付けた星の色ごとにまとめ。ブコメ引用して自分日記を書く。星の色はウィンドウロゴの4色と黒。黒は非表示ミュート)のスイッチ

Webに移行

はじめはローカルで始めたユーザーWebに移行できるように。移行したところでIDコール有効になる。

インポートエクスポート

自動エクスポート/インポートできればDropboxでも共有できる。インターネット越しにインポートしたい。

おまけ

システムリソースモニター

添付ツールとして、ステータスバーにCPU利用率とメモリー使用量・空きメモリーパーセンテージ)とメモリー最適化機能

アラーム

3クリックで相対時間や時刻をお手軽設定できるアラーム(指定時刻に指定メッセージを通知領域に表示するもの)などを付属。(アラームアプリ起動中のみ有効なので、アプリ終了時にまとめて発動。なおかつ再起動したときに引き継ぐ)普段から何かしらのアラームを使っている人なら、このアプリアラーム機能を使う意味は無い。

しおり機能

はてブエントリーページをローカル領域ブックマークするという機能インターネットショートカット(.url)にして保存。WindowsエクスプローラーIEと共有。

フィードバックツール

フィードバックツール重要ウィンドウサムネイルから選択(エラーダイアログも選択可能・エラーダイアログにもフィードバックツールを開くボタンを載せる)、メッセージを添えて「非公開で開発者だけに送信」というボタンで送信できるようにする。送信内容のプレビュー付き。UI上ではフィードバックではなく「要望クレーム)送信」というラベル

クリップ機能

保存して検索できて呼び出せればいい。

そのほか

  • 特に速くなくていい。記事表示時などのナビゲーション開始から終了までをトランジション効果で隠すだけで「キビキビとした動作で快適」と評価されるので。








CC0

ログイン ユーザー登録
ようこそ ゲスト さん