はてなキーワード: 検索エンジンとは
https://mizchi.hatenablog.com/entry/2018/08/24/060111
これを読んでの妄想
昔のディレクトリ型検索エンジンのようなサイトを一つ作る
ここにはrobots.txtで既存の検索エンジンからのクロールを拒否しnoindexを設定した上で、さらに特定の文字列をページに埋め込まないと掲載できないようにする
ユーザーが検索したときは登録順に表示するかランダムに表示するかが選べるのみで、サイト側にSEOを考慮させない
これをOHTTP(OverHTTP)プロジェクトと呼ぶことにする
ここまで書いたけどこれTorで良いんじゃね
日本語話者で良かったなと思う数少ない場面は,こういう量産されたスパムサイトの不自然に機械翻訳された日本語をすぐに見抜けるところ。
はてな民なら(煽り抜きで)あたりまえに知っていることだとは思うが,Google検索筆頭に主要な検索エンジンはマイナス検索とサイト指定検索を組み合わせて特定のサイトを除外できる。例えば,上記に挙げたサイトを除外しつつ,拡張子「.dat」について検索するには以下のような語句で検索すればいい。
ちなみに拡張子「.dat」は大抵,アプリケーションが生成する,汎用のデータ格納ファイルであることが多い。中身がテキストファイルとは限らないので,開くときはバイナリエディタを使うといいよ。
「邪魔だ邪魔だと否定ばかりしてないで使えるサイト教えろ」と言われそうなので,よいサイトを挙げよう: http://file.downloadatoz.comというサイトがおすすめです。ほかにも拡張子を調べるのに使えるサイトなどあればトラバかブコメで補足おねがいします。それだけでなく,「このサイトもスパムだぞ」,あるいは「もっと効率のよい検索方法がある」などの意見も大歓迎です。
A. 違う。Twitterの利用規約には投稿したコンテンツを(Twitterの条件に従うことが前提で)第三者が使用することに同意したとみなす項がある(https://twitter.com/ja/tos)。そしてBuhitterは開発者契約(https://developer.twitter.com/ja/developer-terms/agreement-and-policy.html)を遵守しながらAPIを使って情報を取得し、自サイトに掲載しているだけ。これはTwitter規約上問題にならない(商用利用含む)。
Q. ソースを見るとTwitterの画像に直リンしてある! APIなんか使ってない!
A. APIで取得するデータにはTwitterサーバーにアップされた画像へのフルパスが含まれるんだからそれで当たり前。ていうかTwitterサーバーへの直リンじゃなかったら逆にヤバい(なお直リン自体は法律上問題ない → https://toyokeizai.net/articles/-/151690)。
Q. Buhitterは引用要件を満たしていないから無断転載では?
A. 引用によらずとも著作物が自由に使えるケースはある。今回の事例で参考になるのは著作権法第47条の6と7(http://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/gaiyo/chosakubutsu_jiyu.html)。Googleなど検索エンジンが著作物をキャッシュしユーザーの求めに応じて送信することは従来違法だったがこの第47条の6と7が追加されたことによって可能となった。ただしBuhitterが「インターネット情報の検索サービスを業として行う者」として認められるかどうかは不明。
Q. 二次創作が広告付きサイトにのったら公式から商売していると思われるからマズいんだけど!
A. 即売会はともかく書店委託とかあまつさえダウンロード販売してる連中のいうことではない……というのはさておきTwitterもGoogleもpixivも広告で成り立ってる企業です。
Q. Twitterの利用規約に準じてるとかどうでもいいからとにかくはやく載せるのやめて!
A. 削除フォームからどうぞ → https://buhitter.com/application
Q. なんで無断転載されてるこっちが手間をかけなきゃなんないんだよ! サイト消せ!
A. だから無断転載ではないと何度いえば(ry。またサイトを消せ! と迫る行為は逆にBuhitterの権利を不当に侵害するものとなりえるので注意したほうがいいよ。
Q. 噂のbuhitter、運営元すらまともに明記してないようなサイトが問い合わせフォームだけはしっかり作ってるの絶対おかしいし、メアドを入力したら十中八九業者に情報を売られるかスパムorウイルスメールを送りつけられて危ない!
A. 根拠ゼロの誹謗中傷。Buhitter運営に訴えられたら敗訴しかねないツイートだと思いますよ。
んで。
今回の騒動みて思ったのは、普段Twitterをはじめとしたwebサービスをフリーライドとまでは言わないけど利用している身なのにそういうのに対する感謝とか一切ねーのなってこと。
TwitterやPixivやもっといえばインターネットがあるから描いた絵を多くの人に見てもらえ、人気者になったり金を稼げたりするわけじゃん。そういう仕組みには全力で乗っかっておいて、技術が絵を利用したときはものすごい勢いで噴き上がる連中なんなの?
そりゃBuhitter運営はTwitter社じゃないけどその利用規約や開発者規約に準じて何ら問題ない形でやってるだけじゃん。それをTwitterの利用規約は理解しないわAPIのような技術は理解しないわ誤解と偏見で運営に対する誹謗中傷もするわじゃお前らほんと何様なのって感じ。
絵を描いてる連中が、「この絵を描くのに何時間かかったと思ってるの!」とかキレてるの見ると思う。お前らが使ってるwebサービスも同じなんだぞ、と。それは自動で生まれてきたものじゃないんだ。少しぐらい感謝してもバチは当たらないんだぞ、と。
なんでelastic searchってキーワード出したのか分かんねえのかよ……
そこら辺の閾値決めて適当に無視してくれるんだよ。最近の検索エンジンのバックエンドは。
コレが増田の言うAIっぽい挙動をしていないってならそうかもしらんが、こういう検索エンジン利用して作られてるAIフロントエンドとか結構あるぞ。
りんなとかそうじゃないっけ?
増田はelastic searchとかは使ったことあるか? 在庫検索系のプログラムを作ったことは?
あるなら分かるはずだが、別に文脈を読まずとも検索された文章を分解するなりトークン分割してwhere文に入れるだけで、関連性が少なからずあるデータは「取れてしまう」んだよ。膨大にな。
それの中でより正確に近いだろうデータを出してあげるのが検索エンジンの仕事なんだが、そもそも沢山候補を引っ掛けてしまうことは検索としては失格なので、関連が疎なデータは結果から予め除外する。また、正当からは遠いと判断されるデータは正当の候補に挙げない。
この二つを高速に繰りかえすことにより検索結果を出力するんだが、
増田の言うようなファジィな検索は、そもそも結果が一意ではないという問題があるよな。人間が同様の質問をされた場合に、答えてくれる場合においてすらも返ってくる答えは「あまり正答率は高くない」よな。答えの一つではあるんだが、増田の求めたことでは無い。
逆に増田と意思疎通出来ている関係なら問題への返答はそこそこ正答率が高いはずだ。
つまり、増田の質問っていうのは質問の文章以外に「増田のそれまでの思考」というコンテキストがあって初めて解ける問題であって、
コンテキストなしの検索であればgoogleだろうが赤の他人だろうが正答率は一緒だよ。
なん度も繰り返している話ではあるんだけど、AIが出来ない無理無理言ってる奴らって「僕の考えた最強のAIが出来ない」ってだけの話で、増田の認識だけの問題なんだよ。
人間はフレーム問題を解決なんかしてないし、膨大な情報も扱ってない。
【ブログ初心者必見!】SEOはこれをやれ!!3つの基本・5つの実践 – 青二才は振り向かない!!
内容が易しいからというのもあるが、構成的にも文章的にも非常に読みやすい記事だった。文章うまくなってるじゃん。
それにしても青二才、ブログの先生みたいなことをするようになったんだな。ブロガーで飯を食おうとする人間の行き着く先は結局ここかよ、という気持ちが無いわけではないが、ちゃんとした記事かいてたので特に文句は無い。
内容は初歩中の初歩だが、初歩を丁寧に教えるのはストレスが溜まるのでこれを丁寧に説明している記事には需要があるだろう。はてなブックマークについている読者の反応のレベルが低すぎてやや戸惑うが、無駄に知識だけ多くて口やかましいが金にならない耳年増なはてな読者よりやる気はあるが頭すっかすかの素人を捕まえるというのは戦略として正しい。
決してはてな村の延長になっておらず、しっかり脱はてな村に成功しているといえる。
https://www.similarweb.com/ja/website/tm2501.com
6ヶ月平均の合計訪問者数
104.36K(104360セッション)
平均滞在時間
00:01:03
86.72%
SimilarWebの見方を間違えている人が立て続けに出ていてるのでSimilarWebの見方と数値のズレについて説明する - 鈴木です。別館
similarwebの結果では青二才のブログの6ヶ月平均PVは104360*1.34=14万程度となる。(※)
青二才ははてなブログ時代に20万だか30万PVとったと自慢していた時期があったからその頃と比べれば減っている。
しかし、はてなブログ時代と違い、炎上やはてなでのバズにはまったく頼っていないのは明らかだ。
にも関わらず、検索流入メインで勝負してこのPV。そう考えると実質的にははてなブログの頃より成長していると言ってよいのではないか。
青二才、偉い。とてもえらい。
気になることが無いわけでもない。PVはともかくとして平均滞在時間が短すぎやしないか。
青二才のブログは、そこそこ長文だ。平均して3000字くらいはあるだろう。ちゃんと読もうと思ったら普通の人なら3分はかかるはずだ。私は冒頭で引用したSEO対策の記事は最後まで読んだが3分以上かかった。ところが平均滞在時間は1分3秒しかない。私のブログも試してみたが1:33だったし、上のブロガーさんたちも1:30を下回る人はいない。単純に計算して3分の1の読者は数秒で「私が読みたいのはこれじゃない」と帰っているということになる。
なるほど、SEO対策した結果としてPVははてブに頼らなくてもそれなりの数字を維持できているようだが、読んでもらえていない率がかなり高いようだ。
直帰率も高すぎる。86.72%って。もうちょっとブログ回遊してもらえるように工夫しろよ。何の工夫もしてない私のブログですら80%以下だったぞ。
現状ではSEO対策として「検索エンジンから見栄えのよいサイト」は作れているようだが、そのことに頭がいっぱい過ぎて、検索エンジン経由でやってきた人が求めている情報を提供できていないということではないのか。青二才は記事の質の高さや中毒性のあるコンテンツが自慢だったはずなのに、どうしてこうなってしまったのか。
それともSEO対策メインにしているブログはみんなこんなものなのか。世のSEO対策メインのブログは、検索エンジンのほうばかり向いてないで、ちゃんと読者の見せるために自分のコンテンツをしっかり磨けといいたい。googleは阿保とかいいながらgoogleの奴隷になってるのダサすぎるぞ。
とはいえ、思ってるよりがんばっててしかも成果を出してるようで見直した。青二才、がんばれ。
青二才、がんばれ。ブログタイトルがめっちゃ恥ずかしいんだがこれを恥ずかしいと思わないきみがすき。(ここまでで1596文字)
(※)
注意点として、あくまでsimilarwebの数字だから正確な数字かどうかはわからない。例としてはてな時代の青二才よりも読者数が多かった有名ブログの結果をいくつか表示しておく。
今一番はてブでバズってる「不倒城」や「いつか電池が切れるまで」のPVが15万PV程度ということは考えにくいため、本当はもっと多いかもしれない。PV数40万と公表しているゆとりずむのPVも30万程度しかない。
昔社会学の授業で聞いた話だと、1割がアクティブに発言するメンバーで9割はROM(発言せずに読んでいるだけの人)って聞いたけどね。
どうやって9割のメンバーを参加させるかというのが当時の課題だったけれど、
「いらない情報は見たくないです」というのが検索エンジン世代だなと思った。
プロチチ風に言えば会話から1割含まれる情報を見つけ出すのが井戸端会議らしいけどさ、今はそうもいってられなくなったってことじゃ無いか?
余裕がなくなったとか、自分に合ったコミュニケーション方法を見つけやすくなったとか、
会社もそういうベタベタした関係を求めなくなってきたとかいろいろありそうだけれど。
一方でさみしい人はとことんさみしいんだろうな。
とりあえず質問に答えると、戸田山和久の『論理学をつくる』とかが定番
しかし目的であるところの「教養」や「審美眼」を論理学によって身につけられるかっつったらすげえ疑問
もちろん論理は学問を基礎づけている重要な要素ではあるが、論理学として本格的に学ぶような定理やらを使って自然言語を解剖しながら読み進めるなんてしんどいし、少なくとも「教養」や「審美眼」やらを身につける段階ではする必要もないだろ
とりあえず何でもいいから一つの分野を物にして「世界を切り分ける」ための視点を手に入れるというのは悪い戦略ではない
でも、そうやって得られるものはどちらかというと、世界を細かく分節して深く知るための武器であって、元増田が求めてるような幅広い知識を得るための手段としてはちょっとズレがあると思う
俺のおすすめの戦略は各分野で定番とされている入門書を一通り読むことなんだが、まずはそれらを探し当てるための検索スキル(検索エンジンに限らず、人とか図書館を使って調べる技術)が必要なんで、そういう探し当てる技術ってのを手に入れるのが最短ルートじゃねえかな
というわけで元増田はまず井上真琴『図書館に訊け!』を読むのだ
ネットで知識を漁るのは、本で基礎を身に着けてからにした方がいいと思う
よい記事、よい書き手をふるいにかけるための基礎知識を押さえといた方が楽だし早いし安全だ
俺の書いたクソ文章も信用すんな
15万と彼女の年金で1ヶ月20万ほどしかなくて・・・、生活はカスカスでした。 貯金も1ヶ月にお互い1万ずつぐらい
まとめ2-4記事/日
の更新を続けました。
ようやくトレンドサイトも軌道に乗り始め、1ヶ月に5から8万円は稼げるようになりました。
アドセンスと楽天がメインでした。 1日のアクセス数は2万PVぐらいでしたかな?
まとめサイトの方はアクセス数は1日4万PVから5万PVのままです。
アクセス数が増えなかった理由は、当時の共有レンタル鯖ではこのアクセス数を裁くのが限界で何度かレンタルサーバ会社から警告や制限や追い出しを食らいました。
(ラウンドロビンで対応したけど、記事の更新が大変だったデータベースがどちらかしか更新されないから)
ようやく一人で20万稼げるようになりました。
トレンドサイトの方が順調で、1日4万PVで専用鯖も借りるようになりました。
まとめサイトの方はアマゾンとクリック型広告(アドセンス以外)なので、収益は伸びず、更新だけに時間がかかり、でも2ちゃんねる好きだからまとめを続けていました。
トレンドサイトは安定して順調で、1ヶ月最低20万、アドセンスの単価があがる時は30万ほど稼げるようになる(7-8月 3月)
まとめサイトは労力の割に収益化ができていないのと、アマゾンがあなたのサイトももう広告貼らないでとダメだしされたので、サイトの閉鎖を決意するも、ライブドアブログから声がかかり、ライブドアでやることになる。
PBP収益プログラムである。(当時は100サイトほどが参加してたと思う)
ラ=ライブドアに移転しても4記事/日をしていましたが、アクセスも4万PVぐらいで収益は以前より1/3に減り、ラ運営に相談したところ、更新数を増やせばアクセスも増えるということなので
googleから2時間起きぐらいに検索BOTが来るようになりインデックスされるのも早くなることに気づく。
トレンドサイトは順調で月に平均25万から30万を安定的に稼ぐ
まとめくすを使い、私も1日に10から15更新するようになる。
複数の板に張り付くようになる(新鮮なネタを早くまとめるため)
この年から月のPVは1000万以上1300万PVまでに成長をする
まとめとトレンドサイトで、1ヶ月の収益は最低70万 最高は98万ぐらいでした。
実は2013年ぐらいから、張り付いてまとめるのがしんどくて、ログ速や過去ログサイトなどを使って、ネタを探してまとめをしていたんですが、
寝ても疲れが取れなくなり、1日に2回寝るようになりました。(朝と夜中)
最初は楽しいスレをまとめるのが面白くて趣味で2ちゃんまとめサイトを運営していました。
しかし、去年ぐらいから数字に追われるようになってから、ストレスが溜まり続け、精神も病んでいく状態になっていきました。
精神が病んだのは、まとめを運営してから、1日(半日すら)も休んだことが無く、1日18時間ぐらいまとめとトレンドサイトの更新で時間を費やしていたので、体が悲鳴を上げたんだと思います。
賢いサイトはここら当たりで服管理人などを募集して、自分の労力負担を減らしていっていましたね。
自分も服管理人をトレンドサイトの方で雇いましたが、時すでに遅しで、病魔に勝てずに、ついにはおきることも大変になったので、まとめサイトの売却をすることになります。
ただ、2014年後半ぐらいから?googleのまとめ対策があり、ラの上位サイト以外にいたサイトは検索からの訪問者は激減し、当サイトもそれに巻き込まれました。
ラのランキングで60-70位ぐらいにいたのが、80位から90位ぐらいまで落ちるようになりました。
1ヶ月1000万PVでアドセンス貼れなかったので、収益は40万ぐらいしかありませんでした。
そしてサイト売却を年度末までに済ませて、運営サイトはトレンドサイトのみになります。
まとめサイトを売ったので休める時間が増えるので、体調は回復するだろうと思ってましたが、どんどん悪化して、ほぼ寝たきりになりました。
そして、トレンドサイトの方は、2014年当たりから商材で儲けるという情報が出回り、ライバルが激増します。
それでも当サイトは運営歴が長いので上位表示されていましたが、トレンドサイトにもまとめ記事を作るようになってから数ヶ月後に手動ペナを食らってしまい、9月には収益ゼロになりました。
騙しリンクでランキングサイトへの誘導などもペナの要因になったと思っています。
寝ても寝ても疲れが取れずに、5分しか起きられずに、また体が重くなって寝るの繰り返しでした。
最初は疲れが溜まっているだけだと思っていたのですが・・・、1年こんな状態で休んだのにまったく改善しませんでした。
毎日、勝手に死にたいと頭が考えるようになり、ようやく自分の状態がおかしいと気づく。
実際に行動のおかしい人、見た目もおかしい人はそこそこいました。
今ではわかるのですが、自分の意志でそのようになりたくてなっているのではないということ、その人達もそれに苦しんでいるということ。
うつ病という言葉は知っていましたが、やる気が無い病気だと思っていたので、本人にやる気次第の病気だと思っていたので、
うつ病と診断された時はショックでもあったし、少し安心した自分もいました。
現在は2018年5月ですが、現在もうつ病の治療は続いています。
一時的によくなったりはしますが、体調が不安定で、よく寝たきりになりますし、健康的な時と比べるととても疲れが溜まりやすく、疲れやすい。
長く語りましたが、何を言いたいかというと、
若いそこの君へ、
病気や怪我をして、初めて健康であることのありがたみを感じることができます。
自分みたいにうつ病になったら、私生活もできなくなるので大変ですよ。
今は物販アフィリエイトを頑張って、(まだ5万しか稼げてませんが)また月に100万稼げるように這い上がるのが目標です。
今度は多更新とかせずに、土日は完全に休んで軽い運動を取り入れています。
今はまとめサイトで個人で参入して、収益化するのはとても大変だと思います。
未だに脳みそがGoogleの検索エンジンアップデートに追いついてないのな。
んで、顧客は当然そんなの調べないものだから「○○って会社の人にこうしたほうがいいっていわれた、こうしたら順位があがったっていってた」とかいってほんとしょうもない事を吹き込み。
やれ、メタキーワードにはワードを盛り込んだほうがいいやら、キーワード率を高めるために強引にキーワードを文章に盛り込めやら。
ひどいところだと、キーワード率を高めるために、検索されたいキーワードを並べたテキストを-9999pxして隠したほうがいいとかいってきやがる。
そういうのを吹き込まれた顧客に対して「今はこうなってますよ。そもそも検索エンジンに上位表示されることが目的じゃなくて、サイトにきたお客さんにお問い合わせされるのが目的ですよね。」って話を何回も何回も、月1回ぐらいのペースでしてる。
そもそもお客さんが言ってきたキーワードでは1ページ目、悪くても2ページ目の最初の方に出るようにしてるのに、やつらはそういうの無視してソースをみて、化石になった知識を押し付けてくる。
ほんと迷惑なんでやめてください。
元増田です(増田使うの初めてだったんですけど、使い方合ってますか?)。
・就労について
聞かれそうな質問、聞かれた質問に対して答えを事前に考えてリハーサルをしますが、本番でそれをうまく言えなくて失敗します。
・援助について
障害年金もらってますが、それだけで生計を立てるのは厳しいです。
・アフィリエイトについて
・記事は200くらい書いていて、SEO対策済み。検索エンジンからのアクセスはあります。あとはtwitterのbot使って集客とか。
・塾の手法は違法ではないが規約違反ですね。そんなこと言ってられないのですが、人に迷惑をかけるのは真っ当なビジネスではないと思います。その他教わったことは、既に知っていて実践しているものでした。
・うまく行くパターンって、アダルトサイト作って違法アップロードされた動画貼り付けるパターンですね。健全なやり方とは思えません。
お詳しいですね。アフィエイターの方ですか?