「robots.txt」を含む日記 RSS

はてなキーワード: robots.txtとは

2021-01-04

無許可スクレイピングはやめておきなさい。

ここ最近プログラミングスクールが乱立してる流れと関係あるのかわからないけど、やけにPython使ったスクレイピング記事が目につく。

Qiitaスクレイピング記事を探すと本当にたくさん出てくるけどグレーなことやってる人多くて驚く。

robots.txtがAllowならOKとか数秒あけたらOKとかサイト運営側からしたら迷惑まりないと思うよ。

Librahack事件とか知らない世代なんだろうけどスクレイピングやりたいならまず許可取りましょうね。

それか大人しく公開されてるAPI叩きましょう。

2020-11-16

https://togetter.com/li/1623916

検索避けなんて迷惑なことをするなと思うし、避けたいなら認証必要にするとか robots.txtクローラ拒否するなりすべき

2020-10-01

魚拓サイト

ウェブ魚拓とarchiveisをおもにつかってるけど、

前者はすぐとれるときは早いけど、robots.txtがあるととれないのが玉にキズ

後者robots制限ないけど、魚拓とるのに待ち時間があって時間かるときがあるのが玉にキズ

2019-10-02

ウェブマスター オフィスアワー 2019 年 10 月 02 日

ウェブマスター オフィスアワー 2019 年 10 月 02 日 メモ(※所々抜け漏れあり)

https://www.youtube.com/watch?v=bBurTQBqhS0

11/25 Webmaster Conference Tokyo:今週か来週の早い段階で情報を公開する予定

コアアップデート順位が下がった場合

金谷さんコメント

コアアップデートスパム対策としてのアップデートではなく、

最新情報への対応や常に変動するランキング対応させるためのもの

「何かまずいところがないだろうか?」という視点サイトに着手するのは不要

サイトコンテンツを見直すきっかけ程度にしてくれれば

客観的にいいのか悪いのかを知るために定期的なユーザーテスト実施とか、

お互いにレビューし合う習慣を付けるとか

品質評価ガイドラインとかE-A-Tとかは個人的には見なくても良いと思うが、

ユーザーの思う良し悪しの定義に迷った際の参考としてくれればと思う

そもそもE-A-Tが存在する領域かどうかの判断必要

順位回復については日々の細かなマイナーアップデートによって回復する可能性もある



Q.RankBrainにおける更新性や更新の有無による効果はあるのか?

A.オフィスアワーでランキング要素の可能性について言及するのは難しい。言えることはコンテンツの内容を改善してくださいということだけ。もし、更新性が影響すると言ってしまうとみんながそっちに走ってしまうので。

Q.被リンクではページランクドメインランクのどちらを重要視していますか?

A.ショートアンサーとしてはどちらでもありません。

仮にドメインランク重要ですと言ったら何が起こるでしょうか?オールドドメインの買い占めが発生してしまうでしょう。

例えばコンテンツの質を見るに、Wikipediaに関連リンクを貼られるとかそのくらいの影響力があるのかなどを見てみると良いでしょう。

ちなみに被リンク流行っているんですか?

筆者注:

【図解】グーグルリンク評価20原則2019年版】(前編#1~#10) | Moz - SEOインバウンドマーケティング実践情報 | Web担当者Forum

https://webtan.impress.co.jp/e/2019/09/30/34042

初心者必見!SEO対策の基本を5分で完全解説2019年最新版

https://emma.tools/magazine/seo-basics/

↑これら記事とか?


Q.評価や手動対策評価点を知る方法はないか

A.Googleアルゴリズム完璧ではないので、アップデートで再評価される可能性はある。

メインのクエリユーザー自身サービスが頭に浮かぶような存在になれるかどうか。

Q.robots.txtブロックしていないURLなのに、カバレッジrobots.txtブロックされていますというエラーが出る

A.色々確認中ではありますが、私が調べた範疇では問題ありません。Search Consoleフィードバックも送ってください。その際、スクリーンショットだけではなく、テキスト問題点も添えてください。

Q.サイト画像サムネイルとして表示したい。Googleが推奨する方法がありませんか?

A.特にそのやり方については公開はしておりません。Googleが良いと思った画像だけを採用します。

強いて対策を言えば、画像ヘルプを参考に画像情報Googleに伝えるようにしてください。

Q.サイトマップを送信したものカバレッジに反映されない

A.確認しましたが、Search Consoleに表示されています

タイムラグがあるかもしれませんがDisallowされていませんか?確認してみてください。

Q.HTTPSのSearch Consoleは追加した方が良い?重複コンテンツになりますか??

A.追加した方が良いです。

重複コンテンツによって、起こるのはどちらかのコンテンツ上位表示される可能性があるということ。

共倒れになるということはありません。

そのクエリで頭に浮かぶくらいの存在になっているかどうかです。

Q.セパレートURLにおいてMFI後のcanonicalURLの設定について

A.やはり動的orレスポンシブをおすすめします。

正規化とは同等のページ内容のURL複数あるからこそ行うもの

canonicalよりも、リダイレクトでやってみてはどうでしょうか?

Q.検索パフォーマンスデータ収集開始タイミングはいから??

A.基本的には登録前のデータも取れるはずですが、違うケースもあればフィードバックで教えて下さい。

Q.Search Consoleプロパティへの表示について、所有者として確認されてから日経ってもプロパティに表示されていません

A.何らかの判断時間がかかったのだと思います。通常は数日ですが、遅れたのは新規サイトであることが要因である可能性があることです。なにか不具合ありましたらSearch Consoleフィードバックをぜひお願いします。

Q.サイト個人情報を削除してほしい

A.かなり困っているご様子ですので取り上げましたが、当フォーラムでは対象外話題ですのでウェブ検索フォーラム送信願います

Q.max-image-preview robots meta の値を確認するには?

A.まだ反映されていないのでもうちょっと待てば反映されます

Q.Search ConsoleタイムゾーンについてPTからPSTPDTに切り替わりますか?

A.切り替わります!!

Q.ドメインを変えずにサイト名だけを変えると検索順位はどう変わる?

A.サイト名ほど大きな要素を変えてしまうのは影響すると思います

どういうサイト名に変えるのかも重要ユーザーにとってわかりやすくなるとかであれば、長期的には有効になるかもしれません。

Q.max-image-preview でlargeを設定するとDiscoverに表示されやすいと聞きましたがAMP対応しているだけでDiscoverに表示されやすくなりますか?

A.AMPでもmax-image-previewでlargeでもどっちでも対応可能です。

Q.自演対策に関する手動対策リクエスト

A.スパム対策担当者に送って適切な対応を行う予定です。

Q.クロールエラー特定できない件について、1月のオフィスアワーにてホスティング会社相談してみては?との回答で、のち、6月に検証中とのことでしたがあれからいかがでしょうか?

A.あまり気にされなくても良いです。ただ、間違ったエラーが表示されないようにするためにエンジニアも調整中ではあります

こういうエラーに気づかれましたらSearch Consoleフィードバックをぜひお願いします。

次回は10月後半か11月前半の予定です

2019-08-20

anond:20190820042855

robots.txtでも書くのかと思ったら、スラッシュ区切りとかの事か。確かに男性オタクにはあまり見ない習性だな。

恐らく、女性の方が「世間に見つかりたくない」「ひっそり生きたい」という性向が強いんじゃないかな。

2019-06-04

カネカはページを消していない

http://kaneka.stg.pentagon.jp/csr/employees/05/

ちゃんと残ってる(stg環境だけど)

しかGoogleIndexされてる(stg環境だけど)

robots.txtで弾いてないしnoindexもされてないので安心してほしい(stg環境だけど)

http://kaneka.stg.pentagon.jp/test/

ちなみにApacheは2.2.15のようだ

2019-03-18

30代エンジニアの将来設計図

先日30代になりました。

前々から悩んでいたんだけどエンジニアってやっぱり若手が有利。

日々新しいこと出てくるし少しでもブランク作るとえっ何その技術みたいな感じになったりする。

そんな中で30代になって、これからどうすればいいのかわからなくなりつつある。

プログラミング大好きだよ、日々出てくる新しい情報アプリサービス、全てにまだ胸は高鳴る。

家に帰って得た新しい知識で新しいものをつくる、夜が更けても平気だ。大好きだから

けれどもいつまでそれを続けていける?

どんどん増える情報量についていけない日が来る。企業だって若手を取りたがる。

だって持たなくなってきた。消灯時間はどんどん短くなり知識を吸収する時間が減る。

焦りはあるけれど体あってのエンジニア、休息を取らないわけにはいかない。

まだまだ勝負はできる。

勢いのある企業で朝から夜までプログラミングに浸り(設計とか他もあるけど)、

刺激的な日々でちょっと不安定な将来を描く。

同時に選択もできる。それは中小企業大企業保守的ポジションについて、

日々新しいこともないけれど浮き沈みすることもなく、「将来」を安定された席に着く。

新しい技術は家でだって追える。「趣味」として続ければいい。

どっちが正しいんだろう?どっちが幸せなんだろう?

みんな30代になってどうやって未来を取捨選択してるの?

こんな時肝心なGoogleは答えてくれないか増田に投げてみる

(きっと本当に大事なことについてはrobots.txtに何か書かれていてクロールしてくれないんだ)。

2018-08-25

インターネット企業大衆から取り戻す方法を考える

https://mizchi.hatenablog.com/entry/2018/08/24/060111

これを読んでの妄想

昔のディレクトリ型検索エンジンのようなサイトを一つ作る

ここにはrobots.txt既存検索エンジンからクロール拒否しnoindexを設定した上で、さら特定文字列をページに埋め込まないと掲載できないようにする

ユーザー検索したとき登録順に表示するかランダムに表示するかが選べるのみで、サイト側にSEO考慮させない

こんな感じで、インターネット上にインターネットを作る

これをOHTTP(OverHTTP)プロジェクトと呼ぶことにする

ここまで書いたけどこれTorで良いんじゃね

2017-05-26

はてな民って腐女子無断リンク禁止とか検索避けとかを嘲笑して

インターネット空間ではリンク言及自由なんだよ嫌なら自分で鯖立ててrobots.txt入れろや」って言ってわざわざリンク張ってたよね?

2016-11-03

ブックマークコメントへの返信

id:sakuragaoka99 さんへ。どうやら私のブックマークコメント ( http://b.hatena.ne.jp/lispmemo/20161103#bookmark-306500639 ) に対するコメントのようなので、ここで私の見解説明しておきます

id:sakuragaoka99 さんが、http://b.hatena.ne.jp/entry/306500639/comment/sakuragaoka99説明しているとおり、

神学論争になりがちだけど、ブログだし現状レベルはありなんじゃないの?

という意見はそのとおりです。私もそう思います自分が考えた結果や同意できる意見や反対意見などは、すべてその人の判断に基づくものなので、最終的にその人の責任になりますが、自由意見を表明するべきだと思います

ただ、私には、らくからちゃ( id:lacucaracha )さんのブログ会計に関する記事はかなりあらが目立ち、正直言って初学者には全くお勧めできません。私以外の何人かの(会計を知っているような方だと想像しますが)の人も同様に思ったようで、 らくからちゃ( id:lacucaracha )さんの『原価計算の基礎と基本について全力でまとめてみる』 http://www.yutorism.jp/entry/costing への指摘が、 http://anond.hatelabo.jp/20160517150742 から続く、結果として長大エントリの羅列になったのでした。

これを会計を知らない方にむけて喩えて言うならば、料理プロを自認する人が、コショウを手に持って、

これは塩です。これを振りかけると料理が甘くなります

と知らない人に向けて説明しているようなものです。どうもらくからちゃ( id:lacucaracha )さんの会計記事は、「コショウ」と「塩」と「砂糖」を、ひどいレベル混同していると見受けられるようなレベルなのです。いずれの調味料料理に使うものではありますが、だからといって、その説明が正確だとは言えません。

以上のように、らくからちゃ( id:lacucaracha )さんの会計記事は、私にとっては見過ごせないくらい大きな間違いが含まれていると感じているのですが、他の人はそうは思わずに、信用することもあるでしょう。(ただ、私が言いたいのは、単に「すごい大きな間違いがあるよ」というだけで、それを「読むな」などとは言っていません。「読むと混乱するでしょう」と言っているだけなので、その点ご注意願いたいところ。)

ちなみに、私が http://anond.hatelabo.jp/20160520110650 にて指摘した、

らくからちゃさんのおっしゃる『ある生産要素の投入と生成物との関連性』というのは、具体的に何を意味していますか? 現時点でググったけれど、ちょっとわかりません。(ウェブ魚拓を取ろうとしましたが、robots.txtがあるという理由で取得できませんでした。それゆえ結果が固定できませんが、その点が問題にはならないと思います)

などという点について、らくからちゃ( id:lacucaracha )さんからの回答が現在も無いということを、この場を借りて再度言及しておくことにいたします。

2016-05-20

http://anond.hatelabo.jp/20160519220812 への返信です。

http://anond.hatelabo.jp/20160519220812 への返信です。

これは、らくからちゃさんが書いた http://anond.hatelabo.jp/20160519220812 への返信です。(いままで「らくかちゃ」さんだと思っていましたが、「らくからちゃ」さんですね。お名前を間違ってしまってすみませんでした。このエントリの時点で気がついたので、過去のものログの保管の観点から修正してません。そちらについてはご寛恕を請う次第)

総合原価計算個別原価計算選択について

http://anond.hatelabo.jp/20160519220812 にて、らくからちゃさんは

と、いう話を書こうと思ったのですが、もしかして消されちゃいました?(更新ボタン押したら原文が見えなくなっちゃったのですが)

と反応されていますが、この話は、 http://anond.hatelabo.jp/20160518115232 で私と、もともとは、http://anond.hatelabo.jp/20160517150742 で私では無い方が指摘した点に対する返信ですね。(らくからちゃさんは勘違いで消えてしまったと思ったようだけど、消してません。ずっとそのままの状態で在ります)

http://anond.hatelabo.jp/20160518011455 で、らくからちゃさんは、

それぞれの生産形態管理方法に合わせた計算方法選択すべきである。では、総合原価計算個別原価計算をどのように選択するべきであるのか

という点を踏まえつつ、

こういった生産体系にて『ある生産要素の投入と生成物との関連性』が明確である場合個別原価計算法は原価管理観点から有益情報を得ることが出来る。

一方、個別原価計算が不向きなのは『ある生産要素の投入と成果物との関連性』が不明である場合、例えば中間品にストックポイントが置かれる場合だ。

(略)

という説明をしてますが、らくからちゃさんのおっしゃる『ある生産要素の投入と生成物との関連性』というのは、具体的に何を意味していますか? 現時点でググったけれど、ちょっとわかりません。(ウェブ魚拓を取ろうとしましたが、robots.txtがあるという理由で取得できませんでした。それゆえ結果が固定できませんが、その点が問題にはならないと思います)

自分は『ある生産要素の投入と生成物との関連性』とは「『製品との関連における分類』を意味する」と読んで、「直接費/間接費の違いに応じて、個別/総合原価計算を分けるのか?、そんなことないでしょ・・・」、と理解した結果、

受注生産品でも間接費の配賦はあるよね

と、前提知識の確認しました。で、この点については私とらくからちゃさんの間で誤解が生じていないようです。

その説明の後で、 http://anond.hatelabo.jp/20160519220812 で、らくからちゃさんは、

ここで『総合』『個別』というのは、明示的な基準があるというよりも、あくまで程度の問題と考えることが出来ます工程単位を限りなく小さくすれば個別原価計算に近づきますし、逆に指図の単位を限りなく大きくすれば総合原価計算に近づきます

説明していますが、個別/総合原価計算は、工程単位の程度問題(?)ではなくて、製品生産するときに、

とするべきものあるはずですよね? つまり製造単位が1か、それ以外か。(私としては、工程製造単位が1に近づいたとしても、2単位であれば、それは総合原価計算だよね、という点を確認したい。それゆえ、工程に応じて前の工程では総合原価計算計算していたが、次工程では個別原価計算計算する、といったようなことがあると思いますが、その区別は、各工程において製造する仕掛品(第一工程仕掛品であれば、第二工程に振り替えられたときにはそれが前工程費となりますが)を「一単位としてみるか/(そうではなく)2以上の単位とみて、製造しているか」で分けるということです)

個別/総合原価計算説明はそういった「製品製造単位が1か、そうでないか」という点から説明でするべきではないのかな。

この点については、http://anond.hatelabo.jp/20160517150742 で、(←は自分ではない方が書いた増田です)

実は、個別原価計算は、通常、個別に把握しやすい『個別的製品』の原価管理に使うんです。よく出てくる例えは受注生産建物船舶ね。

一方で総合原価計算は、単一製品を『大量』に『反復継続して製造』する場合有効な原価管理で、例えはまぁカレーでオッケイもっとイメージやすくいうと製鉄工場とか石油プラントね。

説明していますが、これもおそらく私と同じ理解だと思います

私と http://anond.hatelabo.jp/20160517150742 (←は自分ではない方が書いた増田です) の指摘をまとめると、

とでもなるかと思います

原価計算の手順

これは、私が http://anond.hatelabo.jp/20160519113148 で指摘した部分です。これはらくからちゃさんが誤解されたようなので、ここで再び説明させてください。

http://anond.hatelabo.jp/20160519113148 で私が指摘したかったのは、 http://www.yutorism.jp/entry/costing の、 http://cdn-ak.f.st-hatena.com/images/fotolife/l/lacucaracha/20160515/20160515165334.png という画像が間違いであるという点です。

現時点では、↑の画像は、

        ┌─────────────┐
 費目別計算  │材料費  労務費  経費 │
        └─┬────┬────┬─┘
    賦課(直課)│    │    │  
          │  ┌─┼────↓─┐
 部門別計算    │  │ │ 補助部門費│
          │  │ ↓   ↓   │
          │  │ 製造部門費  │
          │  └───┬────┘
          ↓      ↓ 配賦  
 製品計算 ┌──────────────┐
       │ 総合原価計算個別原価計算│
       │ 標準原価計算/実際原価計算│
       │ 全部原価計算/直接原価計算│
       └──────────────┘

という関係図になっていますが、製品原価計算の分類は、本来は、以下のように、

        ┌─────────────┐
 費目別計算  │材料費  労務費  経費 │
        └─┬────┬────┬─┘
    賦課(直課)│    │    │  
          │  ┌─┼────↓─┐
 部門別計算    │  │ │ 補助部門費│
          │  │ ↓   ↓   │
          │  │ 製造部門費  │
          │  └───┬────┘
          ↓      ↓ 配賦  
 製品計算 ┌──────────────┐
       │ 単純総合原価計算     │
       │ 等級総合原価計算    │
       │ 組別総合原価計算     │
       │ 個別原価計算       │
       └──────────────┘

製品計算区分においては、生産形態の種類別によって分けるべきではないか?という点の指摘でした。

実際に原価計算基準上でもそのように分類しています。(原価計算基準区分は 『原価の製品計算、原価単位計算形態原価計算基準19、20】|会計知識、簿記3級・2級・1級を短期間でマスター【朝4時起き活動のススメ】』 http://ameblo.jp/studyja/entry-11483327103.html などで確認してください)

元の画像整合するように書くとすれば、

  ┌───────────────┐
  │ 総合原価計算個別原価計算 │
┌─┤ 標準原価計算/実際原価計算 ├──────┐
│ │ 全部原価計算/直接原価計算 │      │
│ └───────────────┘      │
│                        │
│         ┌─────────────┐│
│  費目別計算  │材料費  労務費  経費 ││
│         └─┬────┬────┬─┘│
│     賦課(直課)│    │    │  │
│           │  ┌─┼────↓─┐│
│  部門別計算    │  │ │ 補助部門費││
│           │  │ ↓   ↓   ││
│           │  │ 製造部門費  ││
│           │  └───┬────┘│
│           ↓      ↓ 配賦  │
│  製品計算 ┌──────────────┐│
│        │ 単純総合原価計算     ││
│        │ 等級総合原価計算    ││
│        │ 組別総合原価計算     ││
│        │ 個別原価計算       ││
│        └──────────────┘│
└────────────────────────┘

がより適切でしょう。(外枠に各種原価計算を移動させました)

これは例えていうならば、人間を何かに着目して分類したとします。仮に以下のように、

┌─────────人間────────┐
│                   │
│ 国籍   日本アメリカ/他もろもろ│
│                   │
│                   │
│ 肌の色  白/黄褐色/  他もろもろ│
│                   │
│                   │
│ 話す言葉 日本語英語/ 他もろもろ│
└───────────────────┘

国籍、肌の色、話す言葉で分類したとして、話す言葉の分類の中が、以下のような分けかただと変でしょ?という指摘です。(話す言葉の右側の枠が、話す言葉の分類だとします)

┌─────────人間──────────┐
│                     │
│ 国籍   日本アメリカ/  他もろもろ│
│                     │
│                     │
│ 肌の色  白/黄褐色/    他もろもろ│
│                     │
│                     │
│ 話す言葉 ┌─────────────┐│
│      │性別 男/女/他     ││
│      │身長 170cm以上/未満││
│      │視力 1.0以上/未満  ││
│      └─────────────┘│
└─────────────────────┘

話す言葉区分の中で、性別区分身長区分があると、話す言葉として「性別」という言語や、「身長」といった言語があることになりますが、そんなことはないですよね。

らくからちゃさんが http://anond.hatelabo.jp/20160519220812使用した言葉を使って、最も正確に表現するとすれば、

  ┌───────────────────┐
  │ 総合原価計算制度個別原価計算制度 │※←の枠の中は、必ずそれぞれどちらか一方を選択する
┌─┤ 標準原価計算制度/実際原価計算制度 ├──┐
│ │ 全部原価計算制度/直接原価計算制度 │  │
│ └───────────────────┘  │
│                        │
│         ┌─────────────┐│
│  費目別計算  │材料費  労務費  経費 ││
│         └─┬────┬────┬─┘│
│     賦課(直課)│    │    │  │
│           │  ┌─┼────↓─┐│
│  部門別計算    │  │ │ 補助部門費││
│           │  │ ↓   ↓   ││
│           │  │ 製造部門費  ││
│           │  └───┬────┘│
│           ↓      ↓ 配賦  │
│  製品計算 ┌──────────────┐│
│        │ 単純総合原価計算     ││
│        │ 等級総合原価計算    ││
│        │ 組別総合原価計算     ││※←製品計算の枠の中は、
│        │ 個別原価計算       ││  ↑の総合/個別整合するものとする
│        └──────────────┘│(あるいは、↑の総合/個別を消して、こちらでそれらを選択するだけの方がわかりやすいか)
└────────────────────────┘

というように、一番上の枠の中の各原価計算の末尾に「制度」と付け加えて、適切な補足を加えるのが最も良いでしょうね。

(ちなみに、今回の例だと問題にならないかもしれませんが、この図だけを見ると、材料費、労務費、経費の矢印がそれぞれ、製品計算製造部門費、補助部門費にそれぞれ移動しているだけのように思われるような気もします。 今回のカレーシチューなどの例であれば、工程別ではなく、組別であっても良い気もします。)

さらに指摘しますが、http://www.yutorism.jp/entry/costing最後の方にある勘定連絡図は、工程部門別勘定が全く存在しないですね。その勘定連絡図の下で、青の太字で「『部門』の名前を明記しておくこ」ととあるので、勘定連絡図の中にそれらが無いのは、デカミスに思えます

http://www.yutorism.jp/entry/costing を眺めていて思ったのですが、いらすとやさんの画像最初使用する程度に留めて、それ以降は勘定連絡図や、標準原価計算の例ならばシュラッター図や差異分析のためのボックスを直接書いたほうが、遥かにわかやすくなると思います

らくからちゃさんは、 http://anond.hatelabo.jp/20160518011455 で、

想定読者

一通り工業簿記について学習し、問題は解けるようになったが体系的な理解ができていない者

教科書的な内容については理解したが、実際の現場での処理や実務上の取り扱い、意味合い理解出来ていない者

対象としたものであって、『工業簿記学者』を対象とした、『ゼロから学ぶ』ではない。

という想定を置いたのだということでしたよね? だとすれば、わざわざ曖昧イメージ図を最初から最後まで使用する必要性は、皆無でしょう。イメージ図がむしろ理解の妨げになっている点もあると思いますよ。そのレベルの読者を想定したとき想定読者理解の最低レベルは、「簿記二級の範囲工業簿記計算面」を理解したレベルですよね。ならば、一通り理解できているはずなので、イメージ図はさほど要らないと思います

例えば個別原価計算総合原価計算説明として、蛇口バケツ説明していますが、上の想定読者イメージから何かが新たに「わかる」ようになるのでしょうか? ここでは、主に仕掛品勘定を中心にすえて、

などといった点を踏まえて説明しなおすべきではないでしょうか。

連産品

これは、私が http://anond.hatelabo.jp/20160519113148 で指摘した部分です。この点については特に返信したいことはありません。(「原価計算基準は、今もファイリングしてデスクの上においております。」ということなので、読んでないのかなあ、と思ったくらいです)


修正履歴

2015-01-21

現在ホッテントリにあるこれ。

岡田斗司夫騒動と闇堕ちヤリチンの正体 -

http://chiwawasenpai.hatenablog.com/entry/2015/01/20/160032

記事が削除されてるね。

キャッシュではまだ見れます

魚拓ろうかと思ったけど、

robots.txtによってキャッシュが禁止されており取得できません。

とのことで無理でした。

2014-12-31

1年の締めとして一人ハッカソンした

去年の今頃は「今年こそはすごいWebサービス作るぞ!!!!!!!!!!!」って意気込んでたのに

なんかもう今日が最終日。

ということでこの12月から何か作ろうと考えていて、丁度年末からということで作った。


Amazon購入金額分析

前にAmazonの購入金額合計を出すブックマークレット流行ったけど、それとほぼ同じ。

Amazonの今までの合計金額と、書籍とかPCとかカテゴリごとの合計金額出してグラフにする。

適当Twitter投稿して終わり。


年末だしTwitterで「2014年Kindle購入金額内訳は...でした」とか投稿すれば

みんなつられてアクセスするはず!宣伝しなくても勝手に大ブーム間違いなし!!!!!!!!

最終日に目標達成大勝利!!!!!!!!!


って思ってたけど

投稿してもだれもアクセスしてくれない。待っても待ってもアクセス0。

e?嘘でしょ???って思ったら

EC2セキュリティグループの設定変更忘れてた。

よーし今度こそアクセス過多間違いなし!!!!!


のはずだったけど今度はrobots.txt見に来るクソbotしかアクセスしてくれない。

虚しさ半端ない

というかTwitterURLつぶやくと即効でどこぞやのクローラー巡回してくるんですね。


構成自体クライアントサーバサイド共にjsEC2上でnode.js

D3.jsグラフ画像svgからどうにかしてpngにしないとTwitter投稿出来ないのが微妙に面倒だった

投稿時にクライアント側でbase64canvaspngにしても良かったけど

結局サーバサイドのphantomjsやらせた。

商品カテゴリ取得するためにはProduct Advertising API使うしかなくて

コレが毎秒1商品しか取得できない厳しい制限付き。

重複なしで600商品購入してたらなら10分かかる。

redis上にキャッシュしておいたりwebsocket適当に進捗伝えたりした。


今回得た経験値としては


あたり。


今年は残念ながら目標不達成だったけど、いい最終日の過ごし方になったと思う。

お疲れ様でした。

2014-10-12

http://anond.hatelabo.jp/20141010162035

このすばらしい情報をなぜか女子医大は知られたくなかったらしく、検索エンジンを全力で拒否しています

robots.txtを見れば一目瞭然なんだけど、別に検索エンジン拒否してなかったよ。

そもそも、DocumentRootに置かれてないから、これ効かないよね。

デマ

2013-08-22

最近魚拓ホント使えないので、代わりのサービスを教えてあげよう

ttp://archive.is/

↑ここ。

ここを使えば、

例えばこういうブコメhttp://b.hatena.ne.jp/entry/www.akitashoten.co.jp/news/201)で、

kyo_ju 出版

労働

で?弁護士は誰がついてんの?/ちなみに魚拓を取ろうとしたらrobots.txtによりキャッシュが禁止されている、だそうです。2013/08/21

こんな恥ずかしいコメント(と、それに星つける恥ずかしい人達)に対して、

rgfx

魚拓禁止ですかそうですか http://archive.is/fgwwT 2013/08/22

こういうカウンターができます

ここ、テストに出ますよ。

魚拓取るやつ時代遅れ、ナウでヤングアーカイブis」

はい、覚えましたね。字余り感あって覚えやすいでしょ。

2012-09-26

【2012超まとめ】確実にWEBサービスを作りたい人へ【後編】

前編はこちら

http://anond.hatelabo.jp/20120926165407

中編はこちら

http://anond.hatelabo.jp/20120926165533

ステップ11:残りの開発(50時間)

基本的な機能デザインが出来てきたら、細かな機能や説明ページなどの静的コンテンツも作っていきます

8割程度出来たと思ったら、一度サーバーアップロードして動作チェックしてみます

たいていは上手く動作するはずですが、途中で一度チェックしておいた方が出来上がってから不具合を修正するよりは効率的です。

僕ははじめCORESERVERを使っていましたが、メールが送信できない不具合に遭遇して時間を取られました。

結局はCORESERVERgmailの相性が悪いせい、という事で最後さくら移転しました。

あと、何となく動いているのが確認できたら、

このタイミングGoogle AdsenseAmazonアソシエイト、A8やバリューコマースアフィリエイトサイトに申し込みましょう。

特にアドセンスは申請してから使えるようになるまで1週間とかかかります

2012年現在アドセンスを含むアフィリエイトは期待するほど儲かりません。

でも、色んなWebサイトで見かけるこれらの広告の表示方法を学ぶことで、Webサービスに対する理解も深まりますし、

あと、全然からなくてもサイトにこれらの広告を表示しておくと、社会と繋がっている雰囲気が出て活況感が高まったり

自分サイトちょっと立派に見えてテンションが上ったりします。

それぞれのプログラムの使用方法検索すると出てきますが、敢えて本でおすすめはこの2冊。どちらも基礎です。

増補改訂版 グーグルアドセンスの歩き方

http://www.amazon.co.jp/%E5%A2%97%E8%A3%9C%E6%94%B9%E8%A8%82%E7%89%88-%E3%82%B0%E3%83%BC%E3%82%B0%E3%83%AB%E3%83%BB%E3%82%A2%E3%83%89%E3%82%BB%E3%83%B3%E3%82%B9%E3%81%AE%E6%AD%A9%E3%81%8D%E6%96%B9-%E3%82%B0%E3%83%BC%E3%82%B0%E3%83%AB%E3%83%BB%E3%82%A2%E3%83%89%E3%82%BB%E3%83%B3%E3%82%B9%E7%A0%94%E7%A9%B6%E4%BC%9A-%E7%B7%A8/dp/4478041555/ref=sr_1_cc_1?s=aps&ie=UTF8&qid=1348500894&sr=1-1-catcorr

アフィリエイトで<得する>コレだけ!技 BEST100

http://www.amazon.co.jp/%E3%82%A2%E3%83%95%E3%82%A3%E3%83%AA%E3%82%A8%E3%82%A4%E3%83%88%E3%81%A7%253c%E5%BE%97%E3%81%99%E3%82%8B%253e%E3%82%B3%E3%83%AC%E3%81%A0%E3%81%91-%E6%8A%80-BEST100-%E3%83%AA%E3%83%B3%E3%82%AF%E3%82%A2%E3%83%83%E3%83%97/dp/4774138487/ref=sr_1_2?s=books&ie=UTF8&qid=1348500937&sr=1-2

ステップ12:リリース(10時間)

サイトがだいたい仕上がったら、リリースしましょう。

サーバーに最新のファイル一式をアップロードして、入念に動作チェックをします。

CakePHPセキュリティレベルは下げたか

セキュリティソルトは推測が難しい値になっているか

core.phpのsession idデフォルトの状態から違うものに変更したか

全てのコントローラーデバッグツールキットはOFFになっているか

CakePHP本体は公開フォルダと別の階層アップロードしているか

htaccessの設定は間違っていないか

データベースに余分な情報は溜まっていないか

などを確認します。

あと、ここからもう一歩、公開用に細かな設定をしていきます

URLwww付きとwwwなしはどちらかにリダイレクトさせて1つに統一できているか

存在しないURLアクセスされた時のエラーページに余分な情報が表示されていないか

検索エンジン用のrobots.txtを用意、

ファビコンを設定する、

アクセス解析を設定する、Google Analyticsに登録しコードサイトに埋め込む。

http://www.google.com/intl/ja/analytics/

Google先生挨拶する。Google ウェブマスターツールに登録し、必要情報入力、Analyticsと紐付ける。

https://accounts.google.com/ServiceLogin?service=sitemaps

facebookのいいねボタンオープングラフ

http://developers.facebook.com/docs/reference/plugins/like/

Twitterツイートボタン

https://twitter.com/about/resources/buttons

その他、mixiGoogle+などのボタン類も必要ならつけましょう。

全部出来たら、完成です。

ステップ13:PRとこれから(10時間)

Webサイトは作っただけでは(本当に)誰もアクセスしてくれません。

出来上がったサイトはPRしましょう。

エイトビットさんのこの記事が参考になります

Webサービスを作ったそのあとに、「自分でもできる低コストWeb PR方法

http://blog.8bit.co.jp/?p=1944

こちらもチェック。

作ったwebサービスPRできる!webサービスリンク集サイトまとめ

http://smkn.xsrv.jp/blog/2011/11/web-service-linksite/

リリースした直後はGoogleインデックス数も少なく、検索エンジンからアクセスは期待できません。

検索エンジンからの流入は1ヶ月とか、時間が経つにつれ少しづつ増えてくるので気長に待ちます

サイト情報のチェックはSEOチェキ!とコメポンが便利。(作者のロプロスさん様様)

SEOチェキ

http://seocheki.net/

Komepon!

http://komepon.net/

それからステップ11で紹介した本にも出ててますフェレットも便利。

Ferret

http://ferret-plus.com/

作ったサイト継続して手を入れていきましょう。

自分の作ったサイト改善点や評価が気になったら、

500円で客観的に評価してもらえるこちらも活用すると良いでしょう。

2012年9月26日現在、このサイトは僕はまだ利用していませんが気になっています

ホームページ評価.com

http://www.hphyoka.com/

最後

ここまでやってみると、Web開発の一連の流れが分かった気がしてきます

初めて作ったサイトはしょぼくても、ひと通りやってみる事で

Webサービス開発者としての入り口には立ったな、位には思えるはずです。

今回は勉強をしながら300時間かけて作りましたが、

同程度の物を次に作るなら100時間からないでしょう。

継続することで、それがあなたの強みになっていくと思います

ここまでの知識をベースに、

VPS借りてサーバー勉強をするもよし、

SEOをがんばるもよし、

jQueryやHTML5でデザインにこだわるもよし、

ベリサインジオトラストサイト証明入れてみるもよし、

会員サイトログインさせたり決済に対応するもよし、

アドセンスやA8などのアフィリエイトで稼ぐしくみ作りをするもよし、です。

この記事を読んでアクションしたら、僕と同じようにアウトプットして、

そのリザルトシェアしてトゥギャザーするオポテュニティをテラユビキタス

1つ気をつけたいのは、

開発したサイトサーバーの種類とか、CakePHPで作ってるとか、そのバージョンは1.3だとか、

そのサイトの詳細仕様は安易にこういう記事に書かないようにしましょう。

悪意のあるハッカーに攻撃の糸口をプレゼントする事になってしまます

この本も参考になります(まだやるか)

体系的に学ぶ 安全Webアプリケーションの作り方

http://www.amazon.co.jp/%E4%BD%93%E7%B3%BB%E7%9A%84%E3%81%AB%E5%AD%A6%E3%81%B6-%E5%AE%89%E5%85%A8%E3%81%AAWeb%E3%82%A2%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%81%AE%E4%BD%9C%E3%82%8A%E6%96%B9-%E8%84%86%E5%BC%B1%E6%80%A7%E3%81%8C%E7%94%9F%E3%81%BE%E3%82%8C%E3%82%8B%E5%8E%9F%E7%90%86%E3%81%A8%E5%AF%BE%E7%AD%96%E3%81%AE%E5%AE%9F%E8%B7%B5-%E5%BE%B3%E4%B8%B8-%E6%B5%A9/dp/4797361190/ref=sr_1_1?s=books&ie=UTF8&qid=1348641593&sr=1-1

最後最後に、役立つ本を書いて下さった著者さん、

有益情報ネット上に提供して下さっているWeb業界の皆さん、

それにいち早く辿り着けるはてなブックマーク

皆さん、に感謝

ツイッターはじめました

http://twitter.com/masayaseto

2011-11-16

Google Location ServerからWi-Fi情報削除とかのまとめ

Google が公表したオプトアウトの方式は「アクセスポイントの所有者に対して、名称 (SSID) を末尾が " _nomap " で終わるように変更することを求める」もの。たとえば SSID が " Jitaku_AP " だった場合無線LAN機器の設定から " Jitaku_AP_nomap " に変更することになります

ブコメには「Google勝手に盗んだのにこっちがオプトアウトしなきゃいかんとは何事だ」というものが多いが、それらは問題を根本的に誤解している。

(もしかすると総務省、ストリートビュー車の無線LAN傍受でGoogleに指導。再発防止策と日本語で周知を要求 -- Engadget Japaneseの件と混同している人がいるのかもしれない。これはビーコン信号ではなく通信内容そのものを傍受していたという話で、基本的には別件である――但し、法解釈によっては同じ問題ともなり得るし、根底に共通している部分はある。これは論点がズレるので、ここでは完全に別件として扱う)

Googleだけの問題ではない

そもそもの問題は、Wi-Fi仕様において、Wi-Fi機器MACアドレスが強制タレ流しになっていることにある。これは例えばSSIDステルスの設定でも止めることはできない。

まり、あくまでGoogleは垂れ流されている情報を集めたに過ぎないということである。垂れ流されているものなら勝手に集めてもいいのかという論点はあり得るが、その点についてはGoogleだけを責めても全く意味がない。誰であれ収集は可能だからだ。「しかし、他の誰がそんなことをするのか?」との反駁には「はいPlaceEngineがしています」が答えになる。仕組みは全く同じだ。PlaceEngineは、Googleのような巨大企業でなくてもこの技術を商用レベルにまで持って行けるということを既に証明している。

まり、この問題は「GoogleDBから削除してもらう」だけでは全く解決しない。

(追記: どうもこの節の表現は誤解を招いたようだ。「できるからやってもいい、Googleは悪くない」という意味ではない。その議論があること、今後も必要なことは承知の上で、そもそも「できる」こと自体が根本的な問題であり、しかも各国の現行法において確実に違法行為ではないということが重要だ。何度でも言うが、Googleを憎んでも問題は全く解決しない。あくまでここでは問題の本質を理解することと、現実的で効果的な解決方法について考えたい――もちろん、GoogleAppleMSなどを相手取って世界中訴訟を起こす、というのも一つの手だろう。今のところ強制力を持ちたいなら勝訴の判例を作るしかないし、勝訴すれば抑止力を備えた最強の解決手段になる。どうぞ。)

考え得る対応

ひろみちゅ先生のご意見(2007年版)より。

(a) 「申し出のあったMACアドレスは削除し、今後も登録しないようにする」という対応

技術的にはすぐにでも対応可能。ただし、本人以外の手によって無差別に大量のアクセスポイントを削除するという妨害行為を防止できないかもしれない。

PlaceEngineを利用していない人(PlaceEngine存在さえ知らない人を含む)に対して、そのような手段が用意されていることを周知しなくては問題は解決したといえず、十分な周知は困難と思われる。

新たなアクセスポイントを購入するごとに削除手続きをする必要があることについて納得しない者が、「私のものは登録するな」という主張で争ってきたら対応できない。


(b) 「SSIDステルス設定にしているアクセスポイントは、登録拒否の意思があるとみなして、登録しない仕組みとし、また、既に登録されているものは次回検出時に自動的に削除されるようにする」という対応

技術的には容易に可能。しかし、そのような仕様であることを周知しなくてはならない。PlaceEngineを利用していない人(PlaceEngine存在さえ知らない人を含む)に対して周知しなくては問題は解決したといえない。

このようなルールが万人に受け入れられるものかどうか不明。


(c) 「暗号化設定されているアクセスポイントは登録せず、他は削除する」という対応

暗号化していないアクセスポイントは特定の相手方に対してのものではないとみなすことで、電波法59条の問題をクリアできるかもしれない。

しかし、これを採用すると登録アクセスポイント数が減ってしまい、位置の測定制度が低下する。


(d) 所有者の同意を得たアクセスポイントしか登録せず、他は削除する」という対応

法的には最も安全対応技術的にも、MACアドレスリストを提出してもらうことで対応可能。

実質的には公衆無線LANだけしか登録できなくなり、登録数はごくわずかとなってしまう。

まず、ブコメで要求されているような「オプトイン」の仕組みは(d)だが、これは実現性に乏しいと考えられる。どうやってオプトインするんだという問題もあるわけだが、そもそも「誰でも収集できる」のだから、個別にオプトインなど根本的に不可能であるし、無意味でもある。例えGoogleが独自にオプトイン方法を用意したとしても本質的な問題は全く解決しないばかりか、ユーザに「Googleオプトインしなければ安心」という誤解を与えかねないという懸念もある。

(b)や(c)についてはサービスプロバイダ側の設計の問題であり、ユーザは関与することができない。

今回Googleが提案した方法は、(a)の改良型(あるいは(a)~(c)のハイブリッド)というべきものである。再掲。

Google が公表したオプトアウトの方式は「アクセスポイントの所有者に対して、名称 (SSID) を末尾が " _nomap " で終わるように変更することを求める」もの。たとえば SSID が " Jitaku_AP " だった場合無線LAN機器の設定から " Jitaku_AP_nomap " に変更することになります

オプトアウトという意味では、(b)のSSIDステルス法も同様である。それよりも_nomapが優れているのは、これが「うちのAPマッピングしないでくれ」という明確な意思表示となるからだ。

SSIDステルス暗号化をオプトアウトフラグとして扱うかどうかは単に実装に期待するしかないが、_nomapデファクトになれば、万一オプトアウトが実装されずにマッピングされた際「俺は一般的に合意されている方法マッピング拒否の意思表示をしていたぞ!」と法的に主張できる可能性がある。Wi-Fiの規格に変更を加えるものでもなく、この用途以外に意味を持たないことからデファクトとして広まりやすいだろう。確かにSSID変更が困難なケースは考え得るが、しかしこれ以上に簡単な代案は私には考えられない。

これで解決?

解決しない。

ここに挙げたどの方法を採ろうとも、原理的に「サービスプロバイダマナー」程度にしかなりようがないからだ。オプトインですら、であるrobots.txtを無視するクローラを根絶することができないことにも似ている。そしてそれは、Google責任ではないし、Googleに責を負わせても全く意味がない。

最初に述べた通り、そもそもの問題は「Wi-Fi機器MACアドレスをタレ流しにしている」ことであり、これはWi-Fi仕様改訂で対応しないとどうしようもない。また、対応したとして、新方式へ完全に置き換わるまでには気が遠くなるほどの長い時間が必要だろう。WEPすら未だに根絶できないというのに。

また、Wi-FiMACアドレスをタレ流しているぞ、これは防げないぞ、という啓蒙もっと必要だろう。一般ユーザには何のことやらさっぱりわからないと思うが、それでも啓蒙しないよりはマシである

一つ付け加えるなら、個人的には、デファクトとなり得るオプトアウト方法を提示したGoogleさんはもうちょっと褒められてもいいと思う。これはApplePlaceEngineが今までしてこなかったことだ。

おまけ

ちなみに、Google Location Serverでは既に「2つ以上のMACアドレスがDBとマッチしないと位置情報を返さない」などの様々な対策実施済のようである。これにより、もしMACアドレスSSID漏れたとしても、その所在地こんな方法で正確に掴むことは困難になっている。PlaceEngineは知らない。

もう一つ。この問題は、Wi-Fiだけに起こりうる問題ではない。ひろみちゅ先生は本来この問題をRFIDの普及によって起こりうる問題として予測していたそうである。この辺りもっと知りたい方はgoogle:高木浩光 PlaceEngineとかして勝手に読んでください。

追記

PlaceEngineより、Google提唱する_nomap方式のオプトアウトに準拠する旨のリリースが出た。

PlaceEngineデータベースにおける無線LANアクセスポイント(AP)情報の取り扱いについて

GoogleからGoogle Location Service のWi-Fi位置情報データベースから無線LANアクセスポイント情報を削除するためのオプトアウト方法SSIDに"_nomap"文字列を追記する方法)が公開されました。

PlaceEngine サービスにおいても、Google社のオプトアウト方法に準拠する形でPlaceEngine位置推定データベースから該当するAP情報を削除する運用実施する予定です。具体的な実施時期や運用方法については、別途お知らせします。

また、PlaceEngineサービスにおいては、以前より、主にモバイルルーターなどに対応するため、オプトアウト(削除)したいMACアドレスサポート窓口へ送付して頂く方法などをとっておりましたが、こちらについても引き続き運用していきます。(「位置推定の改善」をご参照ください)

これこそがまさにGoogleの狙った効果だ。素早くデファクトになり得る。すると次の段階として、Wi-Fi機器の製造者が設定画面に「☑位置情報サービスからオプトアウトする(SSID末尾に_nomapを付加する)」のような項目を用意することが標準化する、などといった流れに進むことも期待できそうだ。これには一層の啓蒙活動が必要になるが、十分に現実的な範囲だ。

そして、「Wi-Fiだけの問題ではない」と書いた通り、あっさり同種の別問題が持ち上がってきた。今後、この手の問題はゴロゴロ出てくるだろう。そもそもどこまでが許される範囲でどこからが許されないのかといった大枠の議論も含め、どんどん問題にして世界中合意ルールを形成してゆく必要がある。先は長い。

2010-12-06

http://anond.hatelabo.jp/20101206143020

高木氏が「異常」と言っているのは、一番目の選択肢が変なURLだけになっていること。

でも決して「検索サイトが変な結果を意図的に表示させた」わけではない。

検索サイトがちゃんと決め事を守っているからこうなった。

技術的にはやろうと思えばrobots.txt記述を無視して収集できるし、

そうしたサーバ側を変更しなくてもアフターの状態にできる。

でもしない。robots.txtで「しないでください」と書いてあるから。

(昔は無視して収集する検索サイトたまにあった。今は知らないけど)

収集するなというところには入っていかない、礼儀しいクローラじゃないですか。

http://anond.hatelabo.jp/20101206130526

これ見て ? と思いました

http://takagi-hiromitsu.jp/diary/20101024.html#p01

高木氏はrobots.txtが修正されることにより、「検索サイトで正常に閲覧できる」ようになった、

と書いています。また、「/robots.txt によってすべてのクローラを排除していたため、図1の「ビフォー」のように異常な検索結果になっていた。 」とも。

検索サイトってそんなに偉いんでしょうかねぇ、と思っただけ。

http://anond.hatelabo.jp/20101206111519

どのことなのかわからないけれど、「使え」って話じゃなくて「変」って話じゃなかったっけ?

robots.txtサイト意思表示なんだけど、それ(意思表示)が変って事なら図書館側の問題だよね。

あと、googleにとっては岡崎市立中央図書館なんて努力する程のものではないでしょう。

図書館側がどうこうするつもりもなく、よほどの苦情もなければ、特別トップに出す必要性もないし

そんなもんだよ。

岡崎図書館の件で思ったこと

Google検索結果で表示がおかしい、という指摘があり、robots.txtを使え、というような話があったと思う。

でもGoogle検索結果の表示がおかしいのなら、それはGoogleの問題じゃないの?

Googleが実質、検索サイトの標準なのかもしれないけど、Google検索結果の表示でトップに表示されないのは図書館側の問題というのはおかしい気がする。

Googleサービスは色々なサイトを探し回って何かしらの基準で順番に表示させているわけだけど、その表示順で上位に行くために、図書館のWEBサービスで準備しないといけない、というのは本末転倒ではないの?

企業WEBサイト検索結果の上位に表示されたい、という企業側の思惑はあるだろうけど、公共機関については検索サイト側が努力するべきことじゃないの?

2010-11-03

http://anond.hatelabo.jp/20101103010216

無断リンク禁止はいくらでも主張していいし

最低限、metaタグなりrobots.txtなりでクローラ対策して、

リファラリンク元からのアクセス弾いてんのなら、主張していいよ。

主張するのは自由だから。

 

ただし、人が決めたルールに乗っかった上で、俺様ルールを通すのは無理だろ。

エスカレーター設計理念じゃなくて、安全上言ってんだろ。

 

モンペ臭がする。。。

 

思い出したけど、東京駅エスカレーターで一人で大きい荷物持って両サイド占領してたら、

後ろから来たサラリーマンに舌打ちされた。

じーっと見てたら目をそらした。

 

自分のペースで進みたいなら、人がいないとこ歩けよ、ばーか

2010-05-09

http://anond.hatelabo.jp/20100509163408

マジレスすると、技術的な問題はほぼない。

検索ブックマークBOTrobots.txtメタタグで避けることが出きるし、CAPTCHAなぞなぞ認証のような形のアクセス制限も広く運用されている。

必要なのは腐女子ニーズを把握し、必要な技術を選択し、または適切な選択肢を用意し、魅力をアピールしてその界隈でメジャーにしつつ、何らかの方法で利益に結びつける事。

つまり、ビジネス的な問題。

2010-04-04

http://anond.hatelabo.jp/20100404013718

そろってるっつーかなんつーか・・・

ログイン周りなんて、フレームワーク使わなくても、4時間かかるかどうかだよ・・・セッション周り慣れている人という前提なら。

 

問題なのはページ数が増えたときにすべてのページに間違いなく確実に同じ処理を入れることで

それが複数人のプログラマになっても、守られること。

そうなるとフレームワークの出番ってはなし。

あとは、それこそセッションハイジャックやらセキュリティ対策が時間がかかる。

 

今回問題なのは、そんな、慣れている人なら、そもそも、いわれなくても入っている。最初に入れておく一般的機能がまったくはいっていないこと。

robots.txtすらおかれていないこと。普通管理画面以下は、万一に備えて、robtos.txtを置く。という知識もないこと。

 

そして一番問題なのは PCソフト販売会社がその程度の、セキュリティー知識もない会社に発注するほど、セキュリティー知識がないこと。

コレだとすると、発注側にノウハウが無いので、今後も、セキュリティーの向上は見込めない。

 

こう言っちゃ何だが、ユーザー訴訟を起こすべきだし、PCソフト販売会社はさっさと、別なまともな会社に頼むか、

ショッピングカートなんて それこそ、実績のあるレンタルが他にもあるんだから、さっさと別会社に移行すべき。

http://anond.hatelabo.jp/20100404011633

しかしなぁ、

世の中には、パスワード一覧をEXCELファイルで作っちゃって、まちがってメールで関連先に送付しちゃって大問題っていう

インターネット企業』もあるわけだし・・・

それでいて、操業停止になるくらい、ユーザーが離れるわけでもないんだぜ?

そりゃぁ、セキュリティーなんて向上しないし、みんな無視するよなぁ

 

安かろう悪かろうで、そういう業者に発注するからそういうことになるんだが・・・

真面目にセキュリティーに取り組んでる奴がバカをみる・・・

嫌な時代だよな。

ちなみにな・・・

http://mag.wb-i.net/2010_04_02.html

対処策が・・・

1.metaタグの挿入(noindex,nofollow,noarchive)

2.USER_AGENTよるSpiderの排除

なんつーかな。

そもそも、セッション持って、外部から見られないように対策すべきであって、クロールされなきゃ良いって問題じゃないと思うんだが?

それにmetaタグよりrobots.txt使えば早いのに・・・とか、突っ込みどころ満載。

クッキーを使ったログイン機能と指定したIPアドレス(複数指定可能)からのみ管理プログラムアクセスできる機能を搭載予定

これを無しで販売したそのマインドがすばらしいし

それを購入した方のマインドもすらばらいい。

起きるべくして起きた事件としかいいようがない。

 

無かったのかよ・・・管理画面にログイン機能・・・

つーか、こんな初歩の初歩にひっかかるようじゃ、

真面目な攻撃食らったら簡単に個人情報吐き出しそうだな・・・このプログラム

SQLインジェクション感染したりして・・・w

ログイン ユーザー登録
ようこそ ゲスト さん