「クローラー」を含む日記 RSS

はてなキーワード: クローラーとは

2022-05-08

anond:20220508231934

そもそも検索避け成功しちゃったら

SEOとしてもSNSとしても失敗だから

クローラークロールされないようにするなら

サービス立ち上げるしかないのでは?(1億回目)

2022-02-21

Google検索は死んで…いないのでは?

Google検索死んでる→からの、まとも検索というオルタナギャグブクマ集めている。

「Google検索は死んでいる」がバズったので「まとも検索」を作った。:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ

で、思ったんだけど、YahooJも裏側はGoogleから無視するとして、他にGoogleの代わりにできそうなエンジンってBingとかDuckDuckGoあたりだよね。

この二つって、本当に独自クローラーで集めてるのかな? 実は裏側はGoogle検索結果を使ってるような気がしないでもない。

というのも、最近、俺が作った某サイト独自ドメイン)があるんだけども、これはまだどこからリンクされてない。つまり自分以外は誰も知らない状態

で、Googleのサーチコソールにだけは登録した。数日後にGoogleクローラが来た。そんでインデックスされた。

ここまでは想定通り。

この段階では検索エンジンが異なるBingDuckDuckGo等で検索しても当然結果には出てこない…と思ったのだが、試しにサイト名で検索してみたらなぜか結果に出る。

なんで??????

アクセスログを見てみても、自分アクセスGoogleクローラアクセスしか記録されてない。BingボットDuckDuckGoクローラは来ていない。

自分が使っているブラウザChrome)にはDuckDuckGoなどの拡張機能も入れていない。

まりBingDuckDuckGoには「俺が作ったばかりの某サイト独自ドメイン)」の情報はまだ一切ないはずなのに、検索したら表示されるという状態

これって、Google検索結果を利用しないと不可能な芸当だと思うのだが…?

なんでこんな現象が起こってるんだろう?

詳しい人いたら教えて。

2021-05-28

あなたが、不動産紹介屋だとして

IT系技術者に、どんなお部屋が人気かを聞けるとしま

いくら払いますか?

 

あなたはどうして、お客さんに感想無料で聞こうとするのですか?

IT系エンジニアがどんな部屋を好むのかという

有料の情報を客だからという理由無料で聞くのはなぜですか?

 

3 よりよいお部屋を、提示するために

ネットに全て公開しておいてくれればこっちで検索しま

必要ならPythonクローラーを書いて、クロールして自前DBに入れます

 

4 不動産屋に情報ネットに上げる以外の役目ってあるの?

ない場合あなたはクビになります

 

5 あなた情報クローズする場合、高給取りのITエンジニア

高い部屋を、クロールさせてくれる業者から部屋を借ります

2021-04-26

AirTagへの見解畏敬の念bingキャッシュ版)

以下は、2021/04/24 時点 (クローラー最後アクセスした時点) で表示されていた Web ページのスナップショットです。これは、検索結果のランク付けのために使用されたページのバージョンです。実際のページは、最後キャッシュされた状態から変更されている可能性があります。変更後のページ (強調表示なし) を表示するには、最新のページにアクセスしてください。

どうも。Appleが新しく発表したAirTag、すでにお買い求めになった方も多いのではないでしょうか?

私はそのAirTagと目下同じ領域製品となるMAMORIOという紛失防止タグを開発・販売する日本スタートアップをしています

AirTagが発表され、様々なことがわかってきましたので現在のところの見解をまとめておきたいと思っております。今後変わる可能性はありますが。

現時点のAirTagへの見解は?

Appleにとっても相当危険な賭けだろうなという認識です。ニッチ領域としてスタートアップがやるのと、世界一企業がやるのとではユーザーから求められる水準や期待値がかなり違うはずです。現在の紛失防止タグという製品が抱えるそういった課題点をどれくらいクリアできているのか、あるいは今後向き合うつもりなのかが問われていると思います

現在の多くの紛失防止タグが抱える課題点は大きく分けて3つあります

探知精度、プライバシー利用者情報リテラシーです。それぞれについて解説します。

1.探知精度の問題

電波距離数十メートルBluetoothを用いて追跡を行う場合BT範囲外においては第三者スマートフォン端末の位置情報活用してトラッキングを行う仕組み(弊社ではクラウドトラッキングと呼んでいる)があります

MAMORIOではMAMORIOアプリDLして登録しているiPhoneAndroidユーザーネットワークを通じてトラッキングを行っています。AirTagではこれをOSレベル実装世界中の全iOS端末で匿名トラッキング実施する仕組みだと説明されていますAppleではこれを何億人のユーザーが探してくれると表現していますが 、では果たしてこれは具体的に何%の確率で見つかるのでしょうか? 今現在アクティブな端末数は?見つかっている数は?  ユーザーにとってはそれが真っ先に知りたいはずです。しかし、AppleはAirTagを探す手伝いをしたデバイスが誰のものか、Appleですらも知ることはできないと言っています。つまり見つかるかどうかはわからないし統計も取れないということです。あくまで探してくれる「かも」、見つかる「かも」、という仕組みの話を言っているだけになります。 Apple製品であれば利用者も圧倒的に多いはずですが、それでも仕組み上 、人が訪れないエリア電波遮断された状況などでは見つけることは不可能です。つまるところAppleのいう「探す」ネットワーク果たして本当にどれくらい有効機能しているのかは誰にもわかりません。あなた想像の中にだけあります

 MAMORIOでは日々ユーザー間のすれ違いの数をアプリで誰にでも見れるように公開し改善をおこなっています。また端末間のすれ違いだけではなく、より確実に忘れ物や落とし物が見つかるよう全国鉄会社700路線の遺失物センターに専用の受信機を設置し、設置場所ウェブサイト上に公開、地点名での位置情報登録し落とし物が届けられたら見つかる仕組み構築しています。当然、AirTagの仕組みに比べたら遥かにユーザー数は少ないですし、100%落とし物忘れ物が見つかるわけではありません。だからこそ可能な限り真摯事実を伝えることが大事だと思ってやっています

 Appleのやり方はこうした製品の前提となる説明飛ばし、非常に作為的で不誠実な伝え方ではないかと思います

 また、位置情報の誤差の問題もあります。「探す」アプリ自分iPhoneの端末の位置情報を見てもらえばわかると思いますが、自ら通信するiPhoneですら誤差が生じていてずれているのがわかると思います。屋内ではGPSの精度はかなり落ちるのです。ましてやAirTagは第三者とのすれ違いを活用する以上どうしても誤差が発生するはずです。また拾った人がAirTagの電池を抜いてしまった以降は当然追跡はできません。最後にあったはずの場所をここだと思って探していたら、とっくに持ち去られてしまっていて見つからない、という可能性は大いにあります

また、GPSを組み合わせて位置情報特定する以上、数メートル〜数十メートルの誤差は発生します。住宅密度の高い場所であれば実際の場所とは異なる隣りの家やビルを指し示す可能性はかなりあります。AirTagが入った自分の盗まれた財布がここにあると思い怒鳴り込んで入っていったら実は違っていてトラブルになった、ということが起こりうる可能性は非常に高いです。日本ではすいませんでした!の笑い話ですむかもしれませんが、海外であればそのまま不法侵入で射殺されてもおかしくありません。このようなリスクについてAppleはきちんと利用者説明を行っているのでしょうか?

この問題MAMORIOももちろんついてまわりますが、事前に仕組みや機能についてある程度理解をしていただいた上で購入する層を対象としているMAMORIOと違い、AppleブランドであるAirTagではユーザー層も多岐に渡るはずです。 当然利用者が多くなればなるほど、見つからなかった、そんなことは知らなかったという声や事例も多いはずです。その際のネガティブな声でAppleブランド毀損してしま可能性はあります。そういったリスクを背負ってなおAirTagを出したという判断に対してただただ感服です。

また同じ問題UWBを用いたトラッキング機能もついてまわりますUWBの特徴は数センチ単位での位置特定可能指向性ではありますが、電波である以上遮蔽物や環境の影響は大きく受けます。どれくらいの近さだと見つかるのか、遮蔽物の影響はどれくらいか、利用する環境によって異なるため、実際にユーザー期待値を下回る可能性も高いです。

 それでも世界最高の企業であるApple社が手掛ける以上、既存の紛失防止タグよりも素晴らしいユーザー体験であることは間違いありません。見違えるような体験になるはずです。しかし大多数のユーザーにとって紛失防止タグというのは未だ未知の存在であることも事実で、はたしてAirTagを初めて触ったユーザーがそのユーザー体験を許容するか、紛失防止タグのものへのネガティブ評価になりかねないか非常に懸念しています

2.プライバシー問題

2つ目はプライバシー問題です。物の場所を探せるということは、当然ストーキング行為などに使われるというリスクがあります。紛失防止タグ以外のGPSラッカーにもこの問題はありましたが、GPSラッカーがそこそこの大きさ(スマホサイズ)、短い電池寿命(3日程度)、通信回線契約の有無(通信キャリアへの契約必要)といった形で、利用条件が限定されるのに対し、紛失防止タグは極小(小銭サイズ)、長寿命(1年程度)、通信契約不要匿名利用可)といった特徴があります

 しかしながら、前述の通り紛失防止タグBluetoothを用いている仕組みゆえ、第三者スマートフォンとのすれ違いによってしか位置情報特定することしかできません。そのためストーキングのために悪用するには対象が偶然タイミングよく他のユーザーの近くを通らなければ位置情報特定はできません。今までの紛失防止タグは精度とプライバシー絶妙バランスがこうした問題の発生を防いでいたとも言えます

しかし、Airtagは違いますiPhoneの普及率を考えると通信精度はGPSラッカーを上回り、屋内でもかなりの精度がでる可能性が高く、小さく、長寿命で、匿名性の高い追跡デバイスとして猛威を振るう可能性があります。(またその普及度と知名度ゆえにそういった悪意を誘発してしま可能性もあります

もちろん、Appleはこの問題に対して様々な対処を行っていると述べています

 例えば、近くに第三者のAirTagがあれば手元のスマートフォンに通知を行う、また近くのAirTagを鳴らして探せるというものです。ストーカー目的第三者のAirTagが近くにあれば、スマホがお知らせてしてくれる、探せるから安心といえば聞こえはいいですが、あくまでこれはiPhoneを持っているユーザーに限っての話しです。Androidユーザーは当然この恩恵には預かれません。つまるところAndroidユーザーは誰でもAirTagによって追跡されてしま可能性があるということです。Apple企業としてプライバシーを大切にする姿勢は称賛に値します。が、だからといってそれはiPhone製品を使っていなければ誰でも位置情報を追跡されるリスクを背負わされるということにはならないはずです。

まりAppleのやっていることはこうです。

Androidをお使いのあなたはAirTagでストーキングされても気が付かない可能性があります。でもストーキングされてもすぐにわかから安心そう、iPhoneならね」。

このようなやり方には非常に狡猾な悪意を感じます

 またApple第三者のAirTagが近くにあるとき以外にも、登録者のスマートフォンからAirTagが一定期間(3日程度)離れた場合、音が鳴って周囲に存在を伝えると言っていますAndroidであっても、NFCをかざせば音の止め方や詳細がわかるといいます。これでAndroidユーザーなら安心、、、となるのでしょうか?

 今この時点でAirTagを知っているような情報感度の高い熱心なAppleファンにとってはAirTagやその仕様常識かもしれませんが、Androidユーザーや多くの人にとってAirTagはまだまだ未知のプロダクトです。ましてやシニア層が多い日本ならなおさら。どこからもなくタグから音がなったときにそれに対して誰しもが第三者のAirTagと気づいて適切に対処することはできるのでしょうか? またそういったことへの啓蒙Appleは行うのでしょうか? またAppleは「探す」ネットワークサードパーティーに向けて開放しており、今後様々な形状や特徴を持ったデバイスが登場する可能性があります。AirTagであれば象徴的なデザインなので、すぐにそれと認識することができるかもしれませんが、それ以外のサードパーティーデバイスを逐一見分けることは一般ユーザーには不可能です。なんだか見たことのないデバイスから音が鳴ってなにかの故障電池切れかなと思っていたら、実はトラッキングされていた、という可能性が誰にでも起こりうる可能性があります。そのリスクAndroidユーザーさらされているのです。

また鳴るタイミングが周囲の人間にはコントロールできない以上様々な状況で鳴ることがありえます大事センター試験中になり始めたら? 車の運転中にAirtagがいきなりなり始めたら? 静粛なコンサート中になり始めたら?

また、深夜の暗い家や屋外であればなり始めても見つけられないことも想定されます。深夜にゴキブリの影を見つけてそのまま見つけられなかったことを考えて見てください。ぞっとしますよね。

女性ならストーカーに使われる可能性もあるAirtagの音が自分の部屋で鳴るだけでそれを見つけるまでは恐怖でいっぱいになるはずです。あるいは誰かが嫌がらせでその音を鳴らすだけで相手を追い込むことも可能です。

そういった状況でも落ち着いて誰しもが適切に対応ができるようApple信者以外の全ユーザーにも啓蒙をご丁寧に行ってくれるのでしょうか? 本当にありがたい話ですね。

さらAppleは「探す」ネットワークについては、匿名化を行いAppleでさえも一切のデータを持ち得ないとしています

電気通信事業法では、公共電波通信を扱う事業者責任として利用者通信の秘密の保護は厳重に定められておりますが、一方で裁判官の令状による通信履歴等の 取得・提供児童ポルノの閲覧に対するブロッキングなどの緊急避難通信の秘密の侵害に当たらず状況に応じて適切な対応を行うことが求められます

Appleはこういった犯罪悪用リスク可能性についても、仕組み上自分たちはデータを一切保有しておらずわからいか責任はないといっているのです。各種電気通信事業法を遵守し事業を展開している通信キャリアが構築した通信インフラ網やそれを利用する人々のスマートフォンネットワークフリーライドし、悪用にもされうる可能性のある新たな通信サービスを構築・提供しその責任放棄しています。これは非常に危険なことだと思います

 もちろん当然、MAMORIOでも同じ問題は発生しえます。そのためMAMORIOでは製品の利用にあたっては各種法令を参照して運営するとともにサービス登録にあたっては利用規約プライバシーポリシーを明示し、データも厳重かつ適切に管理を行い取り扱っています。今後も必要認証制度を適切に取得していくつもりです。また関係当局より打診があった際はそれが規約合致する適切なものである限り、事業運営者として対応真摯におこなっていくつもりです(現在のところそういった事例はおきていませんが)

 こうした事業運営責任所在を明らかにせず、匿名化し、運営者自らがそれを知りえないからといってその責任は許されるものではないのではないでしょうか? 

文字数制限のためhttps://anond.hatelabo.jp/20210426022649に続きます

2021-04-05

anond:20210405132900

ロボット系の研究とかで色々あると思うけど、なかなか難しいと思うんだよなあ

車椅子だけでなく、いわゆるロボット人間基準設計された世界に合わせて動かすとなると、

フレーム問題云々までいかなくても、ドアの開け閉めのモーションだけで永遠に悩めそうというか

ドアのノブ、取っ手の種類はいくつもあるし、その寸法も多種多様なわけだけど、

人間常識でそれをなんとなく理解して、なんとなくで使えてしまうんだけど、

ロボットはそれが無理なんで、AIだのMLだの最近時代になっても、

DARPAチャレンジとかで延々とドアの前で計測して、シミュレーションして、学習して、

みたいなのを棒立ちになって繰り返して、ようやく動き出して、それなのに転倒するとかw

映画とかでもそうだけど、作り手視点でなくて単に消費者視点しか見れないと、

最先端ロボットって馬鹿なの?と思われてしまうわけだけど、そうも簡単に行かないというか、

もっとアドホックというか乱暴で良ければ楽だったりもするんだけど、

要はドアをぶち破るまで行かなくても、そこそこ傷つけてもいいとかだったらいいんだけど、

一応課題工場の部屋に入ってバルブを締めるとかだと、金属に傷つけると引火したりもあるわけで、

なんだかんだ人間だったら、消防員が初めて見る扉だったとしても、丁寧な開閉が問題なくできるわけで、

話が脱線しまくったけど、車椅子特殊タイヤとか、

クローラーみたいな運搬用の機械自販機の中身を人間が駅の階段で運んでたりするけど、

飲料缶は最悪下までずり落ちても破損で済むけど、人間は死んでしまうんで、

どんな階段にでも対応できて健常者並みに安全というのを実現するのは難しいんでないかと思ったり

ちなみに、自宅の最寄り駅から近い駅にバリアフリーをかなり徹底した駅があるのだけど、

スロープやエレベーターが充実しているので、普通の駅より障害者を見かける頻度が違う気がする

やっぱり、誰の手助けも借りずに行動したいという気持ち身体障害者だってあるだろうし、

複雑な技術解決するより、単純な技術最後は勝つとも思っているので、

まずは健常者が基準世界に手を入れることと、

それに連携して車椅子側にも手を入れて、現実的解決策に落とし込む方が実現が早いわけで、

2021-04-04

anond:20210404192714

技術的な質問はしたけど、どういうサービスを作ってるかは巧妙に隠せていた(と思う)

FANZAアクセスする必要があって、それを隠したかたかクローラーの部分については特に自分で調べる必要があったんだw

コロナ失職したアラフォーおっさん自作WEBサービスを公開するまで

(2021/4/5 15:00 追々記)


https://twitter.com/pakeura

各所でいただいたコメントの返信手段に困り途方に暮れたので、Twitterアカウント作成しました。コメントはすべて目を通しています。励みになります

直近の開発予定や、アクセス状況とアフィリエイト収入などの数値についてつぶやく予定なので、よければフォローいただけると。

ただしベースが筆不精なためまったく更新しない可能性も大いにあります。何卒ご了承のほど。


(2021/4/5 2:00 追記


ブコメも含め、反響があって嬉しい。拙文を読んでいただきサービスも使っていただいてありがとうございますコメントはすべて目を通し、より実用的なサービスにしていきます

取り急ぎ気になったコメントへの返信を。

パッケージ引用について】
著作権知的財産権を含む権利関係FANZA担当部門確認し、アフィリエイトのためのPR目的であれば使用問題ないことを確認済みです。


ーーー 以下もとの本文


当方独身アラフォー、去年の秋口までは貿易関連の零細企業に勤める、しがないサラリーマンおっさんだった。

当時世間的にもなかなか話題になったが、コロナウィルス蔓延の影響の一環で海運用コンテナ価格が暴騰した。そのアオリを受けた私の会社でも流れる仕事の量が激減し、私個人も暇を言い渡される運びとなった。話の本筋から逸れるので詳しくは触れないが、最終的に雀の涙程度の退職金と引き換えに、40を目前に控えて職を失うことになった。

これまで趣味らしい趣味も持たず給料の大半を貯金に回して生きてきた。そのため一生を生き抜くにはとても足りないが、向こう数年間は食べていくのに困らない程度の貯金が手元にあった。それにあわせて、無限とも言えるような暇な時間を得たのだった。


何をするにも自粛自粛で気が滅入る日々だったが、しばらく心身を休めたことで若干の活力が湧き、貿易実務に関連する資格勉強なんかを始めてみた。

しかしこれがどうにもピンとこない。退職した企業に勤めていたのも、もともと新卒時代就職活動の失敗に端を発することであったし、仕事内容に魅力を感じていたわけでもなかった。


そんなときにふと、前々から「こんなサービスがあったら絶対使うのに」と温めていたアイデアがあったことを思い出し、WEBサービス開発というものに手を出してみようと思い立った。

が、しかしそのために必要知識はまったくと言っていいほど持ち合わせていなかった。数年前にちょっとしたホームページを作ろうと、 HTML/CSS/Javascript/PHP やらの、本当にさわりを学んだ程度だ。

HTMLCSSについてはなんとかかんとか「書いたものを画面に出せる」程度まではいけたが、JavascriptPHPについては当時その存在意義も含め、トンと理解できなかった記憶がある。


そんなこんなで自分の作りたいものについて調べるうち、どうやらクローラーやらWebスクレイピングやらについて学ぶ必要があり、それにはPythonという言語についてある程度詳しくある必要があるらしかった。

サラリーマン時代エクセルで本当に簡易なマクロを書いていたが、当時からPythonマクロ上位互換というイメージを抱いており、いつかは勉強してみたいと思っていたので、これは幸いだった。

入門書を数冊購入し、Udemyというオンラインスクールで入門講座を受講した。かなり漠然とではあるものの、なんとか最低限の知識を身につけることはできたようだった。たぶん。

サービスの開発を志してからここまで一ヶ月ほどだっただろうか。平日休日を問わず毎日PCには触れるようにし、風呂場やトイレで「Qiita Python tips」とかググって出てきた記事に目を通していた。

(余談だがこのころに受講した https://www.udemy.com/course/python-beginner/ というコースは、PC環境を整えるところからまり制御構文やファイル操作など、自分が欲する知識について体系的に学ぶことができ、コストパフォーマンスが非常に良かった。特に回し者ではない)

さらに余談だが、最初ネット上の記事適当にあさって環境構築してしまったため、いまだにPyenvだのAnacondaだのPipだの、Pythonが動く仕組みについて全然理解できないまま今に至っている)


閑話休題

さてクローラーとはWEBサービス提供するうえで主役ではなく、そのために必要データを集めるツールにすぎない。主役にあたるアプリケーション開発については(ここまで読んでいただいたうえで大変申し訳ないが)私にはシステムエンジニアとしてフリーランスバリバリに働いている姪っ子がおり、強力なサポートを受けることができた。

姪っ子いわく「いまは基本的Javascriptがわかっていればサービス提供できる。さらに言うとJavascriptクローラーWebスクレイピングを行うことも可能」らしく、結果的Python学習時間をかけたことは不要であったらしかった。

それどころかPythonJavascriptメソッド名前微妙に違っていることなどで詰まることが度々あり(特に配列へのappendとpush)、害悪と言っても過言ではなかったように思う。


その後は結局姪っ子に促されるがままにGoogle提供するFirebaseというサービスと、Node.jsという言語について同じく入門書Udemyの講座で学習し、なんとか自分が望む機能を持ったサービスを動かすことができた。姪っ子のサポートを受け始めてから4ヶ月ほど経過していた。


本題となるそのサービスこちら。

その名を パケ裏.com (https://pakeura.com) という、アダルトビデオパッケージ裏面を延々と眺めていられる、人類の夢がパンパンに詰まった代物であるスマートフォンでの閲覧を想定して作った。


「結局エロかよ」と思った諸君ブラウザバックは早計だ。人類技術進歩を支えてきたのはいだって戦争エロなのだ。まずは開発の動機について語らせてほしい。

自分物心らしきものがつき、色を知りはじめたこから常々思っていたのだが、AVパッケージというのはオモテ面と比べ、ウラ面のほうが遥かにエロいと思わないだろうか?

なんらかのオトナの事情があるのかもしれないが、オモテ面には美少女が斜に構えて微笑んでいる写真や、クソデカフォント商品タイトルがババーンと大部分を占めているものが大半である


それに比べてウラ面には、そのAVのなかでも特にエロいシーンの切り抜きが多々あったり、性欲を煽ってやまない官能的な文句がこれでもかと並んでいる。パケ裏にはエロさという概念が所狭しと集っているのである。そんなパケ裏を延々と眺めることができたら…これは私にとって長年の悲願であった。


物理店舗AVを購入することのない私にとって、FANZAでいちいち商品ごとにパッケージ画像クリックし、裏面を覗いていくのはなかなかに面倒な作業である

その点 パケ裏.com を使えば、条件にマッチしたジャンルのパケ裏を無限にしゃぶりつくすことができる。作りたいサービス要件が私の中でかなり明確だったこともあり、思った以上に短い期間で理想的サービスを形にすることができた。


少し大仰な物言いではあるものの、こうして自分にとっての積年の夢を叶えることができた。

趣味というか、金銭の発生しない範囲プログラミングに触れることはとても楽しく、少しずつサービスが形になっていくなかで自分の成長も日々感じることができた。システムエンジニアとして生きていくことは今後もないとは思うが、コロナ禍のおかげで人生でもなかなか得難い、貴重な時間を過ごすことができたように思う。人間万事塞翁が馬とはよく言ったものだ。


最後にくどいようだが、この パケ裏.com(https://pakeura.com)、主観だがかなり実用的なサービスとなっていると思う。ぜひ使っていただき感想をいただけるとありがたい。

また事前に断っておくと、FANZA商品ページへのリンクアフィリエイトになっている。このサービスを通じてパケ裏の偉大さに気づく人が増え、さらに私の懐にちょっとした小遣いが入ってくれば、望外の喜びである

2021-03-17

anond:20210317173713

ほいじゃこれだね

無意味である理由じゃなくてあくまお題目可能にする手段が知りたいんだよ!!!なら

それこそAIディープラーニングのお時間じゃないですか?

趣味実益を兼ねられて良かったね。まずは論文を読むところからだな

Webクローラー作るのはそのあとでいいよ

 

ちなみにワイは過去1万冊以上マンガ持っていて、今も自炊電子書籍で数千タイトルは所有してるけど

マンガヲタクはとても名乗る気にはなれないし、名作と言われているタイトルでも読んでないのいっぱいあるよ

2021-03-16

"無意味" で終わる。可能にする手段が知りたいんだよ!!!なら それこそAIディープラーニングのお時間じゃないですか?

これ同じ内容の投稿が何回もされているけど "無意味" で終わるんだよな

 

マンガに限らず世界中元増田に刺さる・心揺さぶコンテンツは星の数ほど存在している

けれど神じゃないからそれらすべてを認知することは不可能

仮に引っ張って来れても増田が生き物である限り時間的に全てに目を通すのは無理だぞ

タイミングに任せろよ。自分に刺さるコンテンツ存在に気づかず、

完結してた・閲覧不可能になってた時の悔しさは理解するが

本気で望めば・金積めば意外となんとかなるモンだ

 

無意味である理由じゃなくてあくまお題目可能にする手段が知りたいんだよ!!!なら

それこそAIディープラーニングのお時間じゃないですか?

趣味実益を兼ねられて良かったね。まずは論文を読むところからだな

Webクローラー作るのはそのあとでいいよ

 

そこまで手間掛けたくないなら何度も言われているように

マンガアプリ複数入れる、マンガ雑誌・アプリを買う これしかいね

 

anond:20210317171544 anond:20210316171909

2021-02-03

CloudFrontと相性が悪いため

しばらく

こっちをかしてくれ

 

やはり年単位で調整を繰り返しているが

ブログコメント欄

相性が悪いな

コメントスパムもあるから

PHP直撃にすると、こんどはクローラーに潰される

急激な1日だけの大手サイトリンク対応するとCDNになって、コメント対応できない

 

調整がめんどくさいことこの上ない

バランスが難しいね

どうしてもコメントを開けようとすると

ロードバランサー入れてPHPマルチにしないと負荷に耐えられないが

わずか1年で1日未満のあめに、のこりをずっとあげておけはたしかに無謀

Lambda pressでリミッター入れる以外の方法にたどり着けない

2021-01-31

情報の授業が小学校から始まっている関係で、クローラー学生が書く可能性があり、学校サーバからクローラーを回した場合、人数が増えると結構な異常負荷がサーバにかかるおそれあり

誰が悪いと言っても

回線代が無料未成年に、わかるわけない話もあるため

サイト運営社が、未成年未成年犯罪にまきこまないようご注意ください

2021-01-26

デススターが落ちてくるから☆よけてー

ガキが書いたBotを受け流しきれず、安全破壊サイトが落ちて知らせる(2度)というのはいいが、どうしてガキが破壊たか?というとき

万が一オリジンを見つけたとき

CDN側はオリジンからはわからいから、CDNからクロールできなかったといわれると、そりゃそうかもな。

もっとレア記事なんてPASSTHRUにしてあって、

大量に持っていくと安全破壊で、サイトが落ちる。抜かれたくはないからな。

とはいえ絵描きサイトでもないのに、画像動画がS3になっていないのは、こちらの落ち度。

とはいえ いくつかのケースでは破壊が早すぎるというのと、オリジンと気がついてもオリジンからCDNに飛ぶのが難しいといわれると、そりゃそうだろうな。気をつける

回避手段提供していないのに避けろはナンセンス

そうかもな、合意する。

絵かきのサイト場合は、絵は見るのが目的クロール対象外からクローラーは避けろはrobots.txtに書いてくれ そりゃそうかもな

あの、ダース・ベイダー父へ、避け方提供して☆息子

                       ↑ やることは手紙だすだけだけど、映画の中でわりと重要ポジション

CloudFrontCDN配信されているオリジンクロールする目的って無いよなぁ

本当はクロールすんな、読め。お前にデータ無料提供しているわけじゃない。

読むという行為と引き換えに情報がもらえる。取引なんだよ。

それを機械で使って読まないし、利益提供もない。

そういう人でもCDNから機械学習はおめこぼしするが

まったく同じ内容にオリジンクローラーをかけて、情報を吸おうとするとなると

これは合理性を認めがたい

 

robotsCDNはこっちって書けたんだっけ たぶんそれだろうな

オリジンなんてふつうからないが、万が一わかったばあいに 

robotsはいいけどクロールするならCDNにいけというのはrobotsCDNかいとけか勉強になった

2021-01-25

変なクローラー2回めっぽいね。またサーバが落ちてた

だれだかしらないけどURLがほしいならもうあげようか、それともURLかえりゃいいのか、めんどくさい、Blogをやって良いこともあったけど

不幸のけっこうはBlogをやってたことがりゆう

アクセスなんて1日6Hit 蓄えた知恵を無料で上げるだけの ご奉仕も なんか

本当に嫌なことが多い

S3 press をつかわずに wordpressec2で上げてるからクローラーが来ると重すぎて、動かなくなるから

安全破壊で、すぐこわれて、データ流出をとめてくれるし

気が付きやすいから、ハッキング対策には良い。

どう考えても、クローラー広告読まないどころか、広告消して、おいしい記事だけ利用するから

でも、お金がなければs3

おもしろかったは、おもしろかった。

負荷分散とか、いろいろ12年近く勉強になった。いろんなことがあった。

でも1円にもならなかったなぁ。1円ぐらいにはなってるかwww

2021-01-23

[]2021年1月22日金曜日増田

時間記事文字数文字数平均文字数中央値
009412517133.255.5
01406558164.046
02245433226.450
03163380211.371.5
04194733249.192
05183620201.183.5
06232832123.1100
07477200153.297
081161045590.149.5
09134931069.537.5
1012314147115.043
1113214834112.463.5
121941340769.142
131271210795.345
141611463890.937
151681331179.248
161801761497.953
1718424893135.339
183032766691.338
191921658586.437
202201342461.030.5
211451251286.342
2212922202172.142
2316817574104.648
1日2957300952101.843

本日の急増単語 ()内の数字単語が含まれ記事

信用経済(10), 石原伸晃(5), クローラー(10), しほ(8), 18cm(3), 虫ケラ(6), クローラ(3), きらー(5), ディスガイア(3), クロール(10), 氷河(3), 五輪(18), ワクチン(42), 麻生(13), 因果関係(7), 瞑想(8), 楽器(8), ムーブ(10), 嘘つき(10), 女装(7), 不審(6), 身長(15), JK(11), チケット(11), 洗脳(11), 絡ま(8), コロナ禍(17), 不動産(10), 信者(19), プログラマー(17), 搾取(19), 無意味(17), 騙さ(16), オリンピック(17), 反(14), 入院(12)

頻出トラックバック先 ()内の数字は被トラックバック件数

西野サロン炎上した、さいとうしほを救いたい /20210121201121(33), ■背の高い人間安易に「身長センチ?」と質問しないほうがいい /20210121202723(31), ■「オッサン趣味JKに置き換えた漫画」の逆バージョン /20210120200820(19), ■Switchなんだけど、なんでまだ気づかないの? /20210122105924(16), ■パパが毎日ご飯作ってくれたらいいのに /20210122202211(14), ■大学時代好きだった女の子がプペランカー化していた /20210122101329(14), ■泡姫に聞いたチンコサイズとか痛い客の話とか /20210122011250(11), (タイトル不明) /20210122163259(11), ■詐欺被害にあった /20210122175123(9), ■超時空世紀オーガスの設定むっちゃ面白いのに /20210122004550(9), ■ /20210122142508(8), ■ヤフコメに頓珍漢が湧いている /20210122181003(8), ■『もう中学生』が最近めっちゃ覚醒してる話 /20210121232528(7), ■「コロナ茶番」派の人間を観察してわかったこと /20210121020612(7), ■不味いもの /20210122123323(6), ■東大生安易東大ネタを振るやつ全員死んでくれ /20210122153137(6), ■ニート問題画期的解決法を思いついた! /20210122122013(6), ■自殺する奴ってなんで自殺すんの? /20210122161642(6), ■子供名前は /20210121230141(6), ■性的写真を撮れないスマホの意義 /20210122212435(5), ■掃除機洗濯機エンジンは稼働させることを「かける」っていうけどテレビオーディオは「かける」とはいわないね /20210121120618(5), ■袋麺の不都合な真実 /20210121190628(5), ■夏頃コロナにかかっておけばよかったと思ってる /20210121190833(5), ■マスクしてれば100%絶対感染しないわけ?? /20210122000745(5), ■女装コスプレイヤー価値はないの?どう努力すれば誰からも好かれる人気者になれるの? /20210122000949(5), ■さいとうしほを救いたいがキモい /20210122093306(5), ■今後の西野がやりそうなことを予想する /20210122143450(5), ■袋麺にも具をいれてほしい /20210122165801(5), ■大学一年生です。若いから分かる現状があります。力を貸してください。 /20210122172406(5), ■ネットじゃなくて本にしかない情報が多いというけど /20210122173812(5), ■自分のことを嫌いな人を好きにさせる方法はないのか /20210122175112(5), ■ある地方公務員獣医師の呟き /20210122175129(5), ■新型コロナ医療機関が逼迫しているなら /20210122180417(5), ■ここに馴染めない /20210120182029(5)

2021-01-22

anond:20210122190511

なぜプログラマーが、Static配信を嫌がるかというと、こうやって、ハッキングクロールがおきたときにより、わかりやすいために、わざわざ動的に配信している

みごと数時間ぶっとまったからな。悪質なクローラーハッキングされたことを俺に教えてくれた

anond:20210122185903

それは容易いがクローラー対策でstatic pressしたとして なんかピンとこない 技術的にも容易いが なんかピンとこない

そもそも論として情報無料じゃない。それをクロールするというのが納得行かない いまのほうがクロールしたらサイトがぶっとまって、クロールさせない分まし

s3のstatic pressだとクロールされたときにこうやって、サイトがぶっ止まるという現象を引き起こさないから気が付きにくい

ハッカーにこのぐらいやっていいと思わせて、逆に犯罪知財の盗用)を助長しかねない。

方向性は見えてきた

画像はS3で配信するとして、Apacheを通さな

Wordpressをどうするかだが、画像がないApacheなら少しは軽くなる

あとはコメント欄 どうせ使われてもいない 機能にたいしてクラックくらった場合にどうするか?なんだろうなぁ めんどくせぇ

そりゃ多数のサイトが閉鎖するわ

lambda pressにすると 逆にクローラー食らうと金がかかりすぎそう

オリジンクローラー!って、弁当屋が業績悪化で取り壊される話か、と

ログイン ユーザー登録
ようこそ ゲスト さん