2024-06-11

anond:20240611134656

recaptchaどうやって突破してんの?

ブラウザ以外のアクセスって簡単拒否れるけどどうやって突破してんの?

  • フロントエンドはphpが主だが、クローラは全面的にpythonを使ってる

    • じゃあPythonでクローラー書いてるってコト? どのサービスがなんのフレームワークでやってんの?

      • クローラにフレームワークなんて使っていない

        • クローラにフレームワークなんて使っていない 笑 いやマイクロサービスだろ? RESTかなんかでやりとりするだろ? 普通Djangoとか使うでしょ笑 全部書いたの?

          • 悪いがクローラはRESTでなんてやり取りしないな データを蓄積して、ストレージにアップロードするだけ Djangoなんて使わん

            • recaptchaどうやって突破してんの? ブラウザ以外のアクセスって簡単に拒否れるけどどうやって突破してんの?

              • ブラウザを使ってクロールしてるんだよ headlessモードって知ってる?pyppeteerを基本は使ってる といっても、相手サイトは予めこちらのクロールを許可しているので、UAに特定の文字列を...

                • それフレームワークじゃん・・・

                  • ああ、これをフレームワークと呼ぶならそうなんだろうな まあそれは単なる要素技術なので「どんなフレームワークを使ってますか」なんて質問がナンセンスの塊だね

                    • まぁ用語はどうでも良くてchromeがバックエンドしてるっていう認識が無いのは知識不足なんだよな

                      • chromeがバックエンドしてるっていう認識が無いのは知識不足 性格悪いがガチでニヤニヤしている笑

                      • バックエンドしてる?なにいってんだこいつ pyppeteerにchromeが使われているという話なら「バックエンドしてる」なんて言い方しないぞ

                      • バックエンドしてる またパワーワード出たな…

                • マイクロサービスがまさかのChromeのHeadless😆

              • 素のpythonで認証系突破してるなら割とhowは気になるな

            • 笑 ストレージにファイルアップしてデータやりとりするマイクロサービスってちょっと想像を超えてきた

              • リアルタイムでRESTでやり取りする必要なんてないだろ、クローラなんて

                • いやそういう問題でなくて マイクロサービスでDBシェアしちゃって意味ないってよくあるパターンだが まさかそもそもファイルとは

                  • クロールってのは標準のフォーマットがあって、WARCファイルというのがある このWARCファイルを一旦保存しておいて、毎日S3にアップロードしてる S3を操作するコンテナが別途あって、ア...

                    • いやだからそういう問題じゃなくてね? マイクロサービスってちょっとそうじゃないんよ それをちゃんと動かすのが第一歩だし多くが脱落するけどね

                      • マイクロサービスに対する俺の認識は「何らかの処理やIOを行うまとまりが、コンテナによって分けられたもの」というもの。 だからクロールという機能を分離してコンテナ化していれ...

            • なんにもサービスしてなくね?

        • フレームワークというキーワードを何故使った

          • なにいってんだこいつ こいつがフレームワークにこだわるからだろ↓ どのサービスがなんのフレームワークでやってんの?

            • 横だけど普通仕事では使うので その人が「なぜ」というのは君なぜわからないのに使った(そして火に飛び込んだ?)?という意味

              • なにいってんだこいつ 日本語でおk

              • よくわからんけど、とりあえずフレームワークの意味がわからないと思ったのはなんでなのか説明してみて

                • いや君がフレームワークの意味がわかってないとは言っていない 誰も言っていない ただ、面接などで俺はできるやってきたと言うやつは山ほどいるので じゃあフレームワークは?等の...

                  • マジかよフレームワーク最低だな

                    • 言語も最低だし なんならアルゴリズムとデータストラクチャなんかクソやで

                  • 馬鹿の発想だね クローラをフルスクラッチで書くぐらいよくあること まあbs4ぐらいは使うかもしれないが仰々しく「フレームワーク」とは言わんし、要素技術でマウント取るような界隈...

                    • Chromeのheadlessをマイクロサービスのバックエンドといったやつがよくまあ笑 給料いくらもらってんの?

                      • pyppeteerでクロール専用に特化したコンテナを運用することのどこがおかしいんだ? お前、実運用でクローラ書いたことある?

                    • 面接でパイソンできますか?ララベルできますか? みたいな質問しかされません><

                      • 普通、面接では要素技術じゃなくてアルゴリズムの問題とか出すよね

                    • クローラをフルスクラッチ そろそろ俺の腹筋が持たない笑

                      • ちょっと笑いのツボがどうなってるのかわからないので もっと詳しく説明していただけますか

                      • なにもおかしいことはないと思うが

                    • フルスクラッチ いちいち選択する言葉がエンジニア離れしてるんだよなあ

                      • フルスクラッチという言葉のどこがエンジニア離れなの? 文脈的に、特殊なフレームワーク等を使わないということでしょう?

    • phpがフロントエンド・・・???SSRじゃなくてフロントエンド???

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん