「クローラ」を含む日記 RSS

はてなキーワード: クローラとは

2023-12-10

白いピンポン玉を求めて:純粋な娯楽への回帰

僕は弱者男性プログラマーだ。コードを書いて金をもらっている。

そんな僕が、社会学政治に興味を持つ人が多いこのような場で物申すというのはちょっと変だと思うかもしれない。

実際、社会学なんて僕の専門じゃない。

僕はコンテンツ収集するクローラを書いたり、それを検索できるようにインデクシングしたり、あるいはコンテンツクリック履歴に基づいておすすめを表示させたりするプログラムを書いている。

このようなプログラムにも、社会的側面というのは存在する。利用者が何らかの目的によってその検索ツールを利用し、調べたいものにたどり着く。コンテンツプロバイダー、ユーザーシステムという3つのアクター社会形成されている。

社会学者がコンピュータについて語ることがあるぐらいだからプログラマー社会について語ってもいいだろう。

僕が常々思うのは、人々の目的だ。

まり「この検索ツールを使う人は、一体なにがしたいんだ」「コンテンツ提供する側は何が目的なのか」ってこと。

もっと状況を限定するために、「ブログ検索」というツールについて考えてみよう。君がクエリを投げてブログを調べようと思うのは一体どういうときなのか。あるいはブログを書こうと思う人たちの動機は?

動機基本的needとwantによって分類されると考えて良い。need場合、例えば確定申告書の書き方について調べていて、適切な情報を知りたいと言ったケースがそうだ。

wantというのは社会的本能に結びついている場合もあるし、退屈しのぎということもある。承認欲求基本的社会的欲求だし、ハッカー自分の知見を公開するのはちょっとした挑戦だろう。

リーナス法則というのを聞いたことがあるだろうか。マズロー欲求解創設と似たようなもので、「生存」「社会」「娯楽」という3つが人の行動原理だとリーナス・トーバルズは言っている。

ブログを書くのが「生存目的という人はどういう人だろうか。きっとそれ以外に職がなく、必死アフィリエイトで稼ぎを得ている人だろう。

ブログを書くのが「社会的目的」という人は、すごいことをして認められようとか、専門家とつながりたいと考えているかもしれない。

しかし「娯楽目的」というのはもっと崇高なものに思えてくる。ブログ文章を書くのが単純に「楽しい」といった人たちのことだ。

生存社会、娯楽という3つの階段によって、コンテンツの質というもの判断できるのではないかと、僕はそういう仮設を持っている。

アフィリエイト生存目的の発信をしている人たちのコンテンツは、お世辞にも良いとは言えない。クリックベイトであったり、感情を煽ったり、SEOクラックしたり、初心者的だったりする。

社会的目的の人たちはもう少しマシで、認められようとして努力をする姿勢がある。でも、「たくさんの人と繋がりたい」という目的場合ちょっと注意が要る。結局、そういう人は手当たりしだいにアクセスを増やそうとするからコンテンツの質は下がってしまう。

文章を書くのが楽しいけど、人に評価されることはどうでもいい」という人たちのコンテンツを探すことは難しいが、こういう人たちのコンテンツは奥深いことが多く、表面をなぞったようなアフィカスブログとは一線を画している。

しかしこれはコンテンツ提供する人の観点である。これらのコンテンツクロールし、検索できるように整備している「システム」の観点から見ると、どうしても「広告利益」のようなもの重要視されやすい。

Googleであれば、Google広告利益に貢献するようなコンテンツ検索結果で優先表示するかもしれない。そしてそれはまさに生存欲求のためのアフィカスを優先しているのと同じことなのだ。

インターネットがつまらなくなったと言う人たちがいる。僕は次の喩えでこれを説明しようと思う。

昔のインターネットというのは、水の上に白いピンポン玉が浮いていた。この白いピンポン玉は良いもので、楽しいものだ。

ところが徐々に黒いピンポン玉を投下する人たちが増えてくる。黒いピンポン玉は悪いものだ。手を使って沈めようとしないと、白いピンポン玉が見つからない。

そして今のインターネットは黒いピンポン玉が一番上に浮かんでいて、白いピンポン玉はその下で見えなくなっている。

白いピンポン玉は純粋な娯楽精神を持ったコンテンツのことで、黒いピンポン玉は「アクセス数を増やしたい」がために鬱陶しいことをしているコンテンツのこと。

まりインターネットでは年々白いピンポン玉を見つけるためにエネルギーを使う必要が出てきてしまっていて、疲れているとき必然的に黒いピンポン玉を見るしかなくなっているということだ。

リーナスは「文明は、生存社会、娯楽という段階に進んでいく」と言っていたが、インターネットは「娯楽、社会生存」という逆の階段を降りている形になっているように思える。

現段階では、アテンションの総和が一定であるために、ネット人口が飽和し、広告企業利益は落ち込んでいる。純粋な娯楽ではなく、企業の生き残りをかけた戦争突入してしまっているのだ。

僕は今のインターネット社会では、意識的面白いコンテンツを見つけるためにエネルギーをかけることがかなり重要だと思っている。ダラダラとやっていたらアフィカスとバズ目的しか目につかない。

例えば人間が一日に読める文章量なんて限られているから、本当に面白い人を見つけたらRSS購読しておいたほうがいいと思う。

うるさいハエがクソに群がっている。「クソを美味しくないと思うなら、お前がつまらない奴だからだ」と左翼思想家が指摘するかもしれない。

僕はクソよりもステーキが好きだ。あなたのようなハエではなく、人間からだ。

2023-07-11

TATSUROの罪は何か、「正しい」以外は失敗になる社会について

つらつらと今のネット社会について思ったことがあるので、前者を話の出汁にして及第点を許さない・許すことが出来ないネット社会構造について書き散らしたいと思う。なお、筆者は別にTATSUROのファンではないしCD等も持っていない。また本件の松尾氏に対する言及については主題と外れるので取り上げない。

TATSUROのラジオでの発言について

まだ内容を知らないなら、radikoタイムフリー(一週間以内)で聞いてくるかニュースサイトの書き起こしを見て欲しい:

さて、その上で次の質問を投げかけたい。果たしてTATSUROは「ジャニー喜多川の性加害」を擁護しているのか。それともしていないのか。しばし、お考え願いたい。

答えが「している」の方はハズレ。そして「していない」の方もハズレ。正解は「本当なら問題だと考えるが、自分が把握していないのでコメントできない」。つまりノーコメントだ。

自分が考えるに、これおそらく次のような建付けで説明できると思う。

1. TATSURO本人はその噂は聞いたことがあったが、真実であるかを判断するほど情報を持っていない

2. ジャニーズ事務所も今に至るまで創業者による性加害を「あった」と認定していない( https://www.johnny-associates.co.jp/news/info-700/

3. よって会社代表するアーティストとしては「あった」ことを前提としたコメント出来ない。

これに対して、過去裁判で加害の事実が認められているではないか! 卑怯である! という反論が予想されるし、個人的にはTATSUROの発表には最高裁での判決を知った上でのコメントが足りていなかったと考える。ただ、今がトレンドジャニー喜多川の性加害問題について多くのメディアでも盛んに取り上げられているが、ならば現在、彼や事務所取引があった組織がどれだけ氏の所業について声明を出しているだろうか?

念の為だが、だからTATSUROの対応も許されるということではない。吉田豪氏が ヤフコメ で指摘していた通り、薄っすらと業界全体が共犯関係にあり、うかつに声を上げられないところが問題なのだろう。さらには現ジャニーズだけではなく、独立した元SMAP新しい地図)や元TOKIOなどにも延焼しかねないし、事務所を辞めたジュニアの人にすら風評被害が出てしまうかもしれない。松尾氏が口火を切って声を挙げたことは偉大ではあるが、個人ではなく会社組織となるとそう簡単には動けないのだ。当然、松尾氏もそれは想定した上で、声を上げようと呼びかけているのではあるが……

自分としては、だからジャニーズ事務所本体が早急に創業者による加害を認め、外部委員会や透明性のある組織改革看板の付替えなどで心機一転し、責任を持って業界全体を巻き込んで芸能界清浄化に取り組むのが筋であるとは考えている。)

次は、ならばTATSUROはその加害について言及する必要があったのか検討したい。

TATSUROとしての説明責任。ただのヒラ作曲家なのか音楽業界の重鎮なのか。

私見ではあるが、ジャニー喜多川の性加害について説明責任が発生するのは現段階ではジャニーズ事務所および加害に関与した者のみであり、それに関与せず単に所属タレント活動関係していた作曲家振付師などには発生しないと考える。

そこで、もう一度番組での発言に立ち戻りたい。もし時間が許すならば彼の発言をもう二回「イチ音楽家」および「長年に渡り音楽業界を引っ張ってきた重鎮」の言葉として読み直して欲しい。

いかがだっただろうか。思うに、前半と後半の論調の違いに違和感を覚えたのではないだろうか。そう、このコメントは、前半はスマイルカンパニー代表として会社代理、そして後半は一介の音楽家としてジャニー喜多川およびジャニーズへの想いの吐露という構成になっている。そう、TATSUROという唯の音楽家としての、だ。松尾氏の契約解除にジャニーズへの忖度が疑われているなか、なんでそんなことするんじゃいと頭を抱える行為だが、音楽家としての彼はジャニー喜多川の功の部分について語らざるを得ないのだろう。

ここで重要なのはあくまでのTATSUROはあくまでも音楽家として「私」を語っているつもりであるということだ。そして不幸なのは週刊誌などの好奇心の徒が興味を持っていたのがジャニー喜多川音楽を通じて縁があったことに対する反省・釈明であったことだ。なぜあんなにも大量の性被害を生み出したジャニー喜多川の肩を、今やシティポップで海外にも名が轟くTATSUROが持つのかと。

そう、求められていたのは、TATSUROという音楽界を生き抜いてきた重鎮が、責任感を持って性加害問題言及することであり、それによって歩みが鈍いジャニーズ問題に進展が見られることだった。筆者も正直その方向性声明を期待していたところがあるので肩透かしであったし、前述したように最高裁による裁判結果という事実は参照するべきであったと考える。

さらにここからラジオ聴き個人としての意見だが、自分にとって先日のサンソンはTATSUROの生き方をそのまま出力したようなものに感じた。週刊誌等の俗事な話題を厭い、一身上の理由のみ告げる。なので、全く持って現状の炎上状態対応するには未熟で不適切であると同時に、(氏の中で)一貫して筋は通っているな、と感じた。特にファンではない自分がそう感じる程なのだから、曲を聞き続け、ライブにも通っていた氏のファンのアンビバレンスは想像に難くない。

期待された正しい振る舞いが得られなかった場合に、高度情報社会ではその反応が画一化してしまうことについての懸念

ここからが本駄文の本題。

ここまでにグダグダと書いてきたように、長々6分も使ってラジオで述べたTATSUROの対応は、ジャニーズ事務所のゴタゴタに端を発する松尾氏のスマイルカンパニー契約解除事件のものとしては上手いものではなかった。そして連日のように彼のどこがマズイか諸々記事が生み出され、はてぶでを騒がせている。首肯するしかない理性的な論説もあれば、偏見に基づいた単なるアンチが皮を被っただけのゴミもある。しかし、一貫しているのは彼は失敗したという前提だ。つまり、何が大衆の心を逆なでし、何が更なる炎上を招くのか。これはネット社会では数多くの物事炎上してきた結果、その都度に識者がなぜ炎上したのか解説記事を書き広めてきたことの成果だ。

これによりネット民炎上リテラシが向上し、やれ謝罪文テキストではなく画像だ、検索クローラ拒否している、被害者に対する謝罪が条件付き謝罪だ、などなど「正しくない」炎上の型が言語化がされてきた。これ自体社会全体の知識の向上であり当然ではあるのだが、最近は「正しくない型」にハマっているとそれ自体が罪とされているような感覚がある。本来はそれらは当事者の間で決着を付けることで十分なのに、ネット民が「型」を定規のように振り回し、それがいかに正しくないかおもちゃにして遊ぶような。

そしてこれは謝罪文だけに限らず、どんな事柄に対してもSNSで尤もらしい解説批判が一斉に広まって、そしてフォロワーがそれを縮小再生産して再びばら撒く。これが正しい知識である場合問題ないし、歓迎することでもあるとは思うのだが、ただそれなりに長くネットをやっていて感じるのは、結局はそれは知識として深く根付くことはなく、単なる善悪物差しとしての判断基準になっているのではないか専門家専門家足るのは状況に応じて適切な対応が取れるからなんだが、単なるSNSユーザである我々にそれ程のものがあるのか。

そう考えると、松尾氏とTATSUROのこの問題は、突き詰めるまでもなく当事者間の契約問題の話であり、外野がそれを酒の肴にして相応しい相応しくないと論じるのはなんだかなあと感じている。

個人的には週刊誌ゴシップ記事情報源が曖昧ものが多くあまり好まないのだが、最近はてぶでは多く見かける気がしている。文春による調査報道週刊誌記事エントリーすることが多くなったからだろうか?)

2023-05-29

乳輪35

フォローフォロワーが0のTwitterアカウントで、頭に浮かんだ言葉ツイートし続けている。そうしないと気が狂うし、これをやってると気が狂うともいえる。知らん。

閲覧数は常に1か2だ。Twitter社の検閲用のボットとか、公式クローラとかが1を踏んでるのかな。で、偶然日本語圏の誰かの検索に引っかかって2。日本にそれまで存在してない言葉の組み合わせをTweetしてるからね。

で「乳輪」という単語が含まれ場合だけ閲覧数が35増える。わざわさわ新料金体系のAPIで乳輪サーチしてるやつが35法人いるってこと?

インターネットなんか消え失せちまえばいいんだ。サメになって海底ケーブル踊り食いだぜ。

2023-01-01

2023は社会影響を防御してコンテンツ消費すんぞ

自己防衛投資、あと海外移住日本脱出だよね。

いやただの俺の個人的目標なんだけどね。

なんつーか、何が楽しいとか嫌いとか、そういうのを社会の色んな情報に左右されすぎちゃったなってね。

反省点ではあるんだが「トップガン流行ってます!」って情報があって、それで映画を見たとして、流行っていなかったとしても楽しいと思えたんかなって。

それで新年最初目標は、ネット上の情報に何らかの「数」が付与されている場合は、それを隠すようなfirefoxプラグイン自分用に作ろうかなと。

フォロワー数、イイネ数、反応数、ビュー数、レビュー数、などなど、ノイズしかならない「数」情報

極めつけは経済情報を俺が収集し始めたことに関係してるんだよね。

まず人を騙そうとしている嘘が多いし、嘘に限って何らかの「数」が多い。

仮に嘘ではなくとも、俺の人生目標あいつらの人生目標全然うから必要とする経済情報が違う。

からね、とりあえず自分目的自体はっきりさせて、それに対して役立つ情報を「数」とか関係なく収集しようと思うんだよね、話はそれからってもんよ。

あと、Googleも極力使わない。DuckDuckGoへ変更する。Google Drive、GmailなどはProtonへ移行。

最悪、DuckDuckGo自体が信用できないってなら、自分専用に情報収集するクローラローカルサーバーで起動させる。それぐらいしなきゃやっぱダメよ。まあもっと簡単にやるならRSSリーダーかな。

本当のことを言うと、支配者層がコンテンツ市場支配しているのが気に入らん。あいつらの性癖で高評価されたコンテンツを俺が好むとでも?笑止千万である

2022-10-20

AIイラストが並んでようが並んでまいがどうでもいいが

改修でクローラがぶっ壊れそうなことが心配だよ

方面迷惑かけやがってエンジニアゴミクズ

2022-08-01

いかがでしたか?」問題に「欲しい情報が出ない」問題… Google検索第一人者が語る、検索で不満が募る“意外な理由”とは | 文春オンライン

https://bunshun.jp/articles/-/56122

辻氏の記事に対するコメントにこんなものがあった。

blanqui 2022/08/01 12:51

Google検索第一人者って何ぞって思って読んだら、クローラ作成者とか自然言語解析やアルゴリズム研究者とかではなく、SEO業者だった。

https://b.hatena.ne.jp/entry/4723202290562822882/comment/blanqui

WEB屋というか技術屋が多かったはずのはてなにおいて、「SEO業者」の一言唾棄するコメントスターが集まってるのを見て悲しくなったわ。まぁ「Google検索第一人者」という言葉が適切かどうかはともかく。

なんではてなって意地でも何かにイチャモンを付けたがる偏屈ジジイ巣窟なっちゃったんだろうな。何も知らんくせに偉そうなことをいう奴だらけ。ヤフコメレベルネットスラムになってしまって俺は悲しいよ。

2022-03-06

anond:20220306023518

あーゴメン。例が悪かった。

じゃあキミ自身運営するサイト(できれば独自ドメイン)でテストしてみてくれ。

以前なら公開した瞬間にクローラがやってきて全てのページがインデックスされていた。

今ではクローラもなかなかやってこないし、やってきても全てがインデックスされるとは限らない。

かなり力を入れて書いたコンテンツでもなぜかインデックスすらされないこともあって、基準が謎すぎる。

2022-02-21

anond:20220221191730

単にドメインだけじゃなくて、サイト名前や内容(本文)もインデックスされて検索結果に表示されてんのよ。

Apacheログ見てもクローラが来た形跡がないのに、どうやって???って話。

Googleクローラしか来たログないのよ。

Google検索は死んで…いないのでは?

Google検索死んでる→からの、まとも検索というオルタナギャグブクマ集めている。

「Google検索は死んでいる」がバズったので「まとも検索」を作った。:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ

で、思ったんだけど、YahooJも裏側はGoogleから無視するとして、他にGoogleの代わりにできそうなエンジンってBingとかDuckDuckGoあたりだよね。

この二つって、本当に独自クローラーで集めてるのかな? 実は裏側はGoogle検索結果を使ってるような気がしないでもない。

というのも、最近、俺が作った某サイト独自ドメイン)があるんだけども、これはまだどこからリンクされてない。つまり自分以外は誰も知らない状態

で、Googleのサーチコソールにだけは登録した。数日後にGoogleクローラが来た。そんでインデックスされた。

ここまでは想定通り。

この段階では検索エンジンが異なるBingDuckDuckGo等で検索しても当然結果には出てこない…と思ったのだが、試しにサイト名で検索してみたらなぜか結果に出る。

なんで??????

アクセスログを見てみても、自分アクセスGoogleクローラアクセスしか記録されてない。BingボットDuckDuckGoクローラは来ていない。

自分が使っているブラウザChrome)にはDuckDuckGoなどの拡張機能も入れていない。

まりBingDuckDuckGoには「俺が作ったばかりの某サイト独自ドメイン)」の情報はまだ一切ないはずなのに、検索したら表示されるという状態

これって、Google検索結果を利用しないと不可能な芸当だと思うのだが…?

なんでこんな現象が起こってるんだろう?

詳しい人いたら教えて。

2021-11-25

ある1ページだけAccept-Encodingにbr指定しないと応答が空になるのは何故だ

クローラ避けなら1ページだけやったって意味ないだろ

何のバグ

2021-07-09

anond:20210709214950

ヒエッ、本職きたよ。ヌボボ

ちなみに医学部にいった友人の何人がむしろテック系に流れてきているという事情がある。

そこんとこ詳しく。メタップスとか?

東大卒だったら、言葉を正しく使え!

Waf なんて書くな! WAF とかけ!

Pub/Sub とか

うっせーな。クラウドベンダー独自 API なんか使いたくねーんだよ。オラクルじゃあるまいし。

DCL、DMLDDLといった用語を知っていることをひけらかしたかったのかもしれない

まぁ、それは認める。でもさ、select や create とかのDML/DDLCRUD と同じだけと、DCL なんて権限を発行できるりょういきにトーシロを突っ込むわけにいかないだろ。何も考えずに GRANT TO なんてプロダクション環境で発行されて日には、権限消失されたら永遠にデータアクセスできなくなるかもよ?

現場に放り込まれても10年ぐらいかかる。というより、フロントからバックからレイヤからモバイルまでやることはもはや現実的ではない。

そりゃそうだけど、フロントエンドは移り変わりが激しいじゃないですか。ほんの数年前までは Flash と DoJa のアプリを作ることがフロントエンド開発者でしたよ?一方データベースや OS の方は、ここ三十年ぐらい UnixRDB鉄板だった書ないすか。低レイヤだっていうけど、IoT なんかで C言語開発者バリバリっすよ。例えば、クラウドフレアなんか CDN の再発明をしてますけど、サーバーラックを見る限りだと差がついているのは低レイヤ根本技術改善であって、私はそこにプロフェッショナル性を見出しますがね。

C言語ができないのに「おそらく QUIC か MQTT 」とか分かってない英単語文字を羅列するのは厨ニ病すぎます

わかっていないのはテメーの方だ。今日オーバーフロー問題を抱えている C/C++サーバーの開発をしようとするのが危険なのは承知しろよ。パフォーマンス必要とするなら Rust、または GC があるけど Go言語を使って実装すべきだろ。高学歴なのは結構だけどは、現実は見えてないのか?いい加減にしろ

片手間でできません。インフラエンジニアに触らせます

そうだね~。卓越したインフラエンジニアがすぐに手に入るなら、問題ないだろうけどさ、ベンチャーや硬直化した雇用形態我が国で有能なインフラエンジニアをすぐに採用できるかよ。何年前の知識で戦っているの?時代は DevOps なんですよ。必要とあらば、すぐ学んで、応用して、デプロイできるのに「インフラエンジニア採用から始める」なんて、ヨーロッパが衰退する理由もよくわかるよ。プププ。

NextSSRまで踏み込む結構

誰が NextSSR なんてするか!あれは SEO必要場合に限る。そもそも SSR なんて危険からまともなエンジニアだったらしないだろ。問題になってないだけで、本当のブラウザクローラが見える内容が違うなんてスパム認定されてもおかしくないんだ。クローラインデックスされるページで SPA をやろうとするやつはセンスないで。

MyISAMInnoDBに切り替えるなんてことしているところは無い。万にひとつあったとしても、大事で、それだけで数ヶ月のものなので、この付け焼き刃の知識の人が触る機会はない。

すいませんでした。本当にすいません。

Kafkaを触ったとかいているが、Kafkaはサーバで使ったのかな?どういう利用シーンかというと膨大なログ収集等で使うのだが(ただのNoSQLではない)、Zookkeeperで調停させて、topic数とか調整するんだけど、わかってます

ん? AWS SQS だとパフォーマンス問題があることしたいから Kafka を使いたいのよ。確かに Zookeeper のことは詳しくないよ。だけど、AWS MSK 使うんで。PaaS というもんがあるので、だめなん?ログ収集は GKE みたいに ログに出したら Fluentd収集してくれる時代になんでグチグチ言われないといけないの?

Redisちゃんと使えてる?pub/subとか分かってないと思う(普通に理解する必要あんまない)

ハア?インメモリデータベースに信頼するほどヤワじゃないから。Redis なんて飛んでなんぼ。だから Kafka のようなストレージに保存されるメッセージキューを利用したいの。

code deploy

これないと、CI の責務が大きくなるじゃん。ほんでもって、ArgoCD なんて Kubernetes で展開したら運用までしないといけないじゃん。メンドクサ。

アメリカ事情は知らないはずなので知らないことは書かないようにしましょう。

いや、J1ビザをとってアメリカ留学したことあるよ。あと、「世界もっとも強力な9のアルゴリズム」「CleanCoder」「戦うプログラマー」 の本に書いてあるじゃん馬鹿にしてるのか?

 なぜ、ヨーロッパ人が避けるかといと「やる気がないから」です。以上

SAPアマデウスITとか強いじゃん。うそつき

2021-04-24

政府情報発信不足って何?

情報ウェブでも公開してるのに発信不足って言われないようにどうすれば良いの?

情報記載したページを検索クローラブロック対象外にしている

省庁のトップページから3クリック以内で情報アクセス出来るようになっている

公式twitterアカウント情報追加、更新した際にtweetする

主管省庁のマスコミ向け定例記者会見で大まかな内容を発表する

あと何すれば良いのかな

検索汚染」に憤る情弱もの気持ちがわからない

あのさあ。

どうしておまえらは二つ以上の単語検索するということをしないんだ?

戦艦名前画像検索するとゲームの絵がー」「競走馬名前アニメの絵がー」って騒ぐけど

金剛 戦艦」「スペシャルウィーク 競走馬」で検索すりゃいいだけだろ。

簡単な話じゃねえか。

なんでそんなこともできないんだ?

たとえば誰かからいきなり「ディープインパクト!」とだけ言われて

競走馬のことなのか映画のことなのか探査機のことなのか楽曲のことなのかお笑いコンビのことなのかプロレス技のことなのか

おまえらには分かるのか?

おまえらに分からないことがどうしてGoogleに分かると思うんだ?

「何も言わなくてもGoogle様は私の調べたいものエスパーしてくれる」というナイーヴな考えは捨てろ。

競走馬のことを調べたいなら馬名に「競走馬」を加えろ。

映画のことを調べたいなら作品名に「映画」を加えろ。

ディープインパクトといえば競走馬に決まってるじゃん!」なんて甘えはGoogle様には通用しないんだよ。

そもそも勘違いしてる奴が多いがGoogle長所は「検索精度」じゃない。

一時期「Google検索精度は高い」と言われていたのは他の(クソザコ)ロボットサーチエンジンとの比較にすぎない。

本当に「価値の高い」ウェブサイトだけを見たいならディレクトリサーチエンジンYahooでよかった。

Googleが素晴らしいのは「検索範囲の広さ」と「充実した検索オプション」なんだよ。

Googleクローラゴミみたいな個人サイト情報まできっちり拾ってくれる。

それを検索オプションを駆使してフィルタリングすることで欲しい情報を見つけ出せる。

もとより口を開けて待ってるだけで欲しいものが降ってくるサービスじゃない。

欲しいものを根気よく探せる人のためのサービスなんだ。

いかおまえらは「検索汚染に苛まれる哀れな被害者」じゃない。

ゴミの山に自分から突っ込んでいってる馬鹿」なんだ。

ネットを汚すなーとか言って他人様に殴りかかるのはやめろ。

エコテロリストかよ。

不快ものを見たくないなら自分で工夫しろ

どうしてもGoogleを使いこなせないなら人力検索はてなでも使ってろカスども。


最近Google検索ワード勝手に消すじゃん。

さなとき検索結果が非常に少ないからだろ。

それでも消さないでくれというなら「完全一致」を選択すればいいだけ。

その程度の手間さえかけられない雑魚から情報弱者なんだよおまえは。

金剛と言えば艦これ金剛のことだと思う人が多数派だとgoogleに示されるのが、母屋を乗っ取られた感じがして、心情的に受け入れ難いのでは?

そういう心情が異常だって言ってんだよこっちは。

異常者であることを自覚して悔い改めろ情弱

これのことなら、好きな馬の名前検索欄に入力したら「嫌い」がサジェストされてショック受けたって話だから検索結果関係ないよね。

関係ない話を持ち出してドヤ顔皮肉を言ってる人だ(笑)

何でその話だと思ったの? ねえねえ?

まあたかだか「嫌い」と出てきただけでショックを受けてしまう繊細ヤクザネットに向いてないってのも事実だけどな。

神はサイコロを振らない」って誰の言葉だっけ?と思ってググっとちょっと面食らった。「誰」まで付けて半々か。

神はサイコロを振らない 誰の言葉」でググれよカス

「誰」って誰だよ。

バンドメンバーが「誰」かもしれんし、ドラマ出演者が「誰」かもしれんだろ。

ここで「いや誰といえばアインシュタインが出てくるべきでしょ」というのはおまえの中でしか通用しないルールであって、そんな思い込みは捨てるんだよ。

自分の知らないバンドドラマ情報まで拾ってくれるGoogleクローラの優秀さに感謝してその幸せを噛み締めろ情弱

2021-04-13

anond:20210413134214

戦車もそうだけど、クローラキャタピラと言った方が分かりやすいけど)はちょいちょい外れるからな。

戦車クローラが外れる様子

https://www.youtube.com/watch?v=4CzOonUdW1E

車椅子みたいな、なるべく利用者負担が少なくてメンテフリーな乗りものとなると、タイヤしかむりだろ。

2021-04-05

anond:20210405085916

最近は一周回ってスマホでの見栄えしか理解されなくなってしまった

Webページクローラにどういうテキスト情報で回収されるかの知見は2010年あたりで滅んでしまった

悲しいことだと思う

2021-03-07

これは一種思考実験だが、下半身クローラキャタピラ)に換装すればたいがいの問題解決する。鬱だとか生理用品が買えないだとか弱者男性がどうだとか。逆に言えばお前らはクローラ作業アーム、バケットまで備えたユンボバックホー)の足許にも及ばない価値しかない人間だということになるだろう。

2021-02-09

anond:20210209104601

専門家として当然の配慮ができてないときは叩くぞ

1秒に1回クローラが来ただけで止まる図書館システム作ったところとか

https://b.hatena.ne.jp/entry/librahack.jp/

2021-01-24

anond:20210124103122

からクローラがやってくると

時間で、CPUバースト権利燃え尽きて自動的に閉鎖してしまうっていう脆弱設計だろ?そのまま自動普及はしないから、管理者が手動で再起動

その後、手動でいくつかのスクリプトを実行して、ようやくWeb再開

脆弱だろ 自動普及しないなんて

平均して2時間CPU利用率が100%に張り付くとサイトが落ちるなんて、脆弱だろ

2021-01-23

[]2021年1月22日金曜日増田

時間記事文字数文字数平均文字数中央値
009412517133.255.5
01406558164.046
02245433226.450
03163380211.371.5
04194733249.192
05183620201.183.5
06232832123.1100
07477200153.297
081161045590.149.5
09134931069.537.5
1012314147115.043
1113214834112.463.5
121941340769.142
131271210795.345
141611463890.937
151681331179.248
161801761497.953
1718424893135.339
183032766691.338
191921658586.437
202201342461.030.5
211451251286.342
2212922202172.142
2316817574104.648
1日2957300952101.843

本日の急増単語 ()内の数字単語が含まれ記事

信用経済(10), 石原伸晃(5), クローラー(10), しほ(8), 18cm(3), 虫ケラ(6), クローラ(3), きらー(5), ディスガイア(3), クロール(10), 氷河(3), 五輪(18), ワクチン(42), 麻生(13), 因果関係(7), 瞑想(8), 楽器(8), ムーブ(10), 嘘つき(10), 女装(7), 不審(6), 身長(15), JK(11), チケット(11), 洗脳(11), 絡ま(8), コロナ禍(17), 不動産(10), 信者(19), プログラマー(17), 搾取(19), 無意味(17), 騙さ(16), オリンピック(17), 反(14), 入院(12)

頻出トラックバック先 ()内の数字は被トラックバック件数

西野サロン炎上した、さいとうしほを救いたい /20210121201121(33), ■背の高い人間安易に「身長センチ?」と質問しないほうがいい /20210121202723(31), ■「オッサン趣味JKに置き換えた漫画」の逆バージョン /20210120200820(19), ■Switchなんだけど、なんでまだ気づかないの? /20210122105924(16), ■パパが毎日ご飯作ってくれたらいいのに /20210122202211(14), ■大学時代好きだった女の子がプペランカー化していた /20210122101329(14), ■泡姫に聞いたチンコサイズとか痛い客の話とか /20210122011250(11), (タイトル不明) /20210122163259(11), ■詐欺被害にあった /20210122175123(9), ■超時空世紀オーガスの設定むっちゃ面白いのに /20210122004550(9), ■ /20210122142508(8), ■ヤフコメに頓珍漢が湧いている /20210122181003(8), ■『もう中学生』が最近めっちゃ覚醒してる話 /20210121232528(7), ■「コロナ茶番」派の人間を観察してわかったこと /20210121020612(7), ■不味いもの /20210122123323(6), ■東大生安易東大ネタを振るやつ全員死んでくれ /20210122153137(6), ■ニート問題画期的解決法を思いついた! /20210122122013(6), ■自殺する奴ってなんで自殺すんの? /20210122161642(6), ■子供名前は /20210121230141(6), ■性的写真を撮れないスマホの意義 /20210122212435(5), ■掃除機洗濯機エンジンは稼働させることを「かける」っていうけどテレビオーディオは「かける」とはいわないね /20210121120618(5), ■袋麺の不都合な真実 /20210121190628(5), ■夏頃コロナにかかっておけばよかったと思ってる /20210121190833(5), ■マスクしてれば100%絶対感染しないわけ?? /20210122000745(5), ■女装コスプレイヤー価値はないの?どう努力すれば誰からも好かれる人気者になれるの? /20210122000949(5), ■さいとうしほを救いたいがキモい /20210122093306(5), ■今後の西野がやりそうなことを予想する /20210122143450(5), ■袋麺にも具をいれてほしい /20210122165801(5), ■大学一年生です。若いから分かる現状があります。力を貸してください。 /20210122172406(5), ■ネットじゃなくて本にしかない情報が多いというけど /20210122173812(5), ■自分のことを嫌いな人を好きにさせる方法はないのか /20210122175112(5), ■ある地方公務員獣医師の呟き /20210122175129(5), ■新型コロナ医療機関が逼迫しているなら /20210122180417(5), ■ここに馴染めない /20210120182029(5)

2021-01-22

anond:20210122183921

いわゆる、有名サイトリンクされて潰されるのは過去経験があって、そりゃしょうがねぇとは思ったが

オリジンクローラはもはや、やろうと思ってやったとしか思えねぇ

oriinサーバクローラとかおもしれぇことをするなぁとおもいつつ

めんどくせぇ

それにしても、個人サイトから情報を全部ぶっこ抜こうなんていうのは、久しぶりだな。

あるいみ、トイレの個室でカラオケを歌っていいとか、試供品を全部持っていって転売しても良いとか

驚愕の発想なんだが

どっちがいいかだよな

static pressでs3対応もできるが、こうやって、クローラが来るとサイトが潰れるほうが

すぐに攻撃が来たと気が付きやすいといえば、気が付きやす

2020-11-16

https://togetter.com/li/1623916

検索避けなんて迷惑なことをするなと思うし、避けたいなら認証必要にするとか robots.txtクローラ拒否するなりすべき

2020-09-28

UI改悪の件でpixivがやたら上げられてるけどなんかあったのけ

クローラは正常動作してるから気づかんかった

API直叩き万歳

ログイン ユーザー登録
ようこそ ゲスト さん