はてなキーワード: スニペットとは
「無関係な他人の炎上に巻き込まれて誹謗中傷された挙句、元ページを削除しても永遠にGoogleの検索結果から消えない」
ということがありました。
最悪です。
Googleは全く対応してくれる気なさそうなので、万に一つでも増田で話題になってくれれば何か違うかもしれないと思って書いてます。
あと単純にWEBに詳しいはてな村の人たちの知恵を貸してほしい、マジで…。
経緯
同じ職場の似たような名前の別人(仮にはてな太郎とする)が悪事を働く
→これってはてな次郎(これも仮名だけど俺の本名と思って読んで)じゃね?という感じで、俺が犯人ということにされる
2)スレッドが過去ログ倉庫に行くのを待つ(変に燃料追加したくなかったので)
3)無事過去ログ倉庫に送られたが、「はてな次郎」の検索結果にスレッドがヒットしてしまう
スレッドタイトルはこれも仮で悪いけど
4)弁護士に依頼して、該当スレッドから俺の本名(はてな次郎)を削除してもらう
※※ここ重要なところ※※
6)まだページタイトルだけは検索結果に出るが、しばらく待てば消えるだろうと思って放置
7)一年待つ
8)……消えねえええええええ(しかも検索結果に1p目に表示される…)
何が困るって、該当スレッドからは「はてな次郎」っていう本名こそ消えてるんだけど、
知人が読んだら「これってはてな次郎じゃん」ってわかる内容なんだよね
「このレイプ犯ってやつ、企画課の一番背高いやつじゃね?」みたいな感じで
「一部上場企業に連続レイプ犯がまぎれていた件www」って出てくることを…
つらすぎ…
原因はおそらく、該当スレッドが、
Googleのクローラーにとってめちゃくちゃ優先度が低いため、
何年待ってもクロールされず、インデックス更新が行われないこと。
平たく言うと、クローラーってロボットがいろんなページをくまなく探して、
それを「インデックス」って読んで、検索結果に出るようにしてるっぽいんだけど、
「このページには はてな次郎 って情報がある」って誤ったインデックスが、
(か、そもそもGoogleのインデックス更新システムがバグってる)
だから今俺にできるのは
(2ch側に
「このページがクロールされるよう
って頼むことも考えたけど弁護士に「明らかに無理」って言われた)
以下、試してみたこと。
※※状況が複雑なのと、
「まさかGoogleの検索がそんなバカなはずがない」という正常化バイアスがあるせいで、
どれも効果なかったので一読してみてほしい
・ページ内に本名が実は残っていないか検索したら?ソースコードも
→CTRL+Fでくまなく探したけど残っていない
・どっかのページから「はてな次郎」ってリンク張られてるんじゃないの?
→そういう場合は「リンク貼られてます」って表示が出るらしいけどない
https://www.google.com/webmasters/tools/removals
→キャッシュとスニペットはもう消えてる。もう消えてる(二度目)
→何十回と試したけど効果なし
https://www.google.com/webmasters/tools/submit-url
→何十回と試したけど効果なし
ていうかこのページがまともに機能してくれれば全部解決じゃんかよなんとかしろよGoogle
・Googleに名誉棄損だから消してくれっていいよ ここからできるよ
https://support.google.com/legal/contact/lr_legalother?product=websearch&uraw=
→ここに最後の望みを託して依頼したんだけど、
結果からいうとマジで不誠実な対応しかしてもらえませんでした。
どれくらい不誠実かというと返信が全部コピペの上に、会話が噛み合わないの。
↓
返信(長いので一部抜粋)
このサイトに対して法的措置を講じられ、結果として問題の素材が削除された場合、
その変更が Google の検索結果に反映されるのはサイトの次回クロール後です。
ウェブマスターによる変更後、早急にキャッシュの削除をご希望の場合は、
ウェブページ削除リクエスト ツール(http://www.google.co.jp/webmasters/tools/removals)から
↓
俺、「だからそれはもうやってるって。
クロールしてくれ」
↓
返信(一部抜粋)
対象の URL がご指摘のキーワードの検索結果に表示されないようにすることはありません。
Google では、ご要望のあったような形で特定のキーワードに対する検索結果を変更することはしない方針です。
お名前を検索したときに表示されるサイトは、検索キーワードの中の単語の組み合わせ、
文書の内容、その他の数多くの要素に基づき、Google の検索アルゴリズムによって関連性のある結果として選定されたものです。
ときには、検索キーワードとの関連性が最も高い結果であっても、検索キーワード内の単語そのものを含まないこともあります。
↓
俺、「検索結果を恣意的に変更してくれって言ってるんじゃない、
↓
返信(一部抜粋)
検索結果の情報がサードパーティのウェブページにはもう表示されていない場合は、
Google のキャッシュが徐々に更新され、最新のコンテンツが検索結果に反映されるようになります。
↓
という流れです。
検索結果をいじったりできないっていうのはわかるよ!
上のメッセージでは省いているけど、
「必要であれば顔写真付き身分証明書などの書類も提出できます」
おそらく、
という反応があると思うんだけど、
Google検索フォーラムというところで過去事例を探したところ、
同じような苦しみ方をしている人がたくさんおり、
三年以上待っても消えないという人もいました
一例
https://productforums.google.com/forum/#!topic/websearch-ja/jR3-1mfWciA;context-place=starred
https://productforums.google.com/forum/#!topic/websearch-ja/42c3-xqvgn4;context-place=starred
https://productforums.google.com/forum/#!topic/webmaster-ja/Q5qv_7d8skw;context-place=starred
わかりやすいのだけ…
これだけ定期的に同じような苦しみ方をしている人間がいるので
上記フォーラムで一番参考になったのはこれ↓
https://productforums.google.com/forum/#!topic/websearch-ja/ORA9iVvsa2g;context-place=starred
> 「2010年の7月なので、既に3年以上経過してい」ようと、そのクソ中のクソサイト/ページがグーグル検索システムにとって1/9999京の価値もなければ、10年でも50年でも、1度も再クロールされず、したがってその不都合な文言は検索に出続けるでしょう — いま現在まさにそうであるように。
とのことです。
10年後も50年後もわけのわからない汚名を着続けるわけですね ははっワロス
人力検索はてなでは思ってた百倍くらい親身になって考えてくれてマジで感謝だった
お前らがいなかったらやばかった、本当ありがとう
http://q.hatena.ne.jp/1507301385
口調全然違うけど俺だ
2chには何も期待してなかったけど、
もしくはGoogle社員の目に届いてGoogle社員が猛省してくれますように
だから頼む!!!!!みんなブクマしてくれ!!!!!!ください!!!!!!お願い!!!!!!!!
以下余談
・厳密にいうと、ページの中にはてな次郎の「はてな」だけは残ってるんだけど、
それって、「はてなって食べると美味しいの?」みたいな、俺の名前とは無関係な文脈で、
そんな珍しい苗字じゃないしそこだけで検索1p目にヒットするのはおかしいと思う…
ページの中に「観光」っていう言葉はないけど当然連想されるよね~みたいなことだったら
まだ諦めもつくんだけど、そういうんじゃない
っていうか俺の名前で検索して俺本人(いや俺は犯人じゃないんだけど)がヒットするのそのページだけだし
・だんだん「Googleそんな悪くないのかも?俺の被害妄想かも?」って気もしてきた
でも今マジでへこんでるのでブコメであんまり厳しく言われたら悲しすぎるのでそういう場合はやんわり注意してください…
でも俺かわいそうじゃない…?
※※追記
みんな本当にありがとう…
以下は論旨全体への反論というよりは事実誤認の摘示(むしろ論旨全体には賛成の立場)
・著者への尊重はない(そもそも目的外使用の許可も取ったことはない)
→→・著作権32条の条文そのものより判例法のほうが現在の主流。文化庁HPで「地の文の目的を補強する目的でやむを得ず(だらだら長く引用しない)」「原典しっかりかく」など3項目あげられているので読んで。
・AIに判定させるデータに使うのはそれは鑑賞なり解釈しようとした上の「引用」どころか加工、「改変」なのでは。
→この場合は同一性保持権を定めた著作権法20条2項3号(電子計算機での利用)または同3号(利用の目的または態様に照らしやむを得ない改変)が適用される余地がある。
→→引用32条とは別個の条文であり合法か否かの基準がそれぞれ異なっています、条文解説よく読んで。元増田は32条にこだわっているので書きました(32条条文だけみて「はいはいあてはまる」としてしまってはおい、プライバシー権は?っていうところに話がおよばないためにこの長文を書いています)。ていうか著作権法自体が、2条1号よめばデータベースが著作物に入るわけないのに十の三でやっぱり入るワとしているなど、矛盾の多い条文。つぎはぎパッチだらけ。立法趣旨をよむと20条などはグーグルなど検索サイトのキャッシュやサムネイルやスニペット(短文引用)などのことである。ネットからみると全部バラッバラにちらばっていて背骨がないのが著作権法。判例法で通常と異なる言葉の意味から(レコードにはCDやmp3を含むんだなとか)いちいち解釈し判断していかないといけない。
・「幼稚園児の書いた母の日の絵を、(勝手に持ってきて)保護者の肥満認定に使う」
→このたとえ自体は適切だし、このケースは確実にプライバシー権が上回る。
ただ、今回の論文のケースでは、少なくとも当該論文だけでは著者のプライバシーは一切明らかにならない点にある。
だって、IDと文章だけでは、その人の氏名も住所も容貌も、その人を特定する情報は何一つ明らかにならないのだから。
たとえ幼児のものであっても似顔絵として身体的特徴を描いた絵画とは根本的に異なる。
逆に言うと、あの論文に書かれており、URLをたどったpixivだけの情報で、それらがわかるというなら、どうしてわかるのか教えて欲しい。
なお、作者自身がプロフィール欄やその他のSNSで自分の個人情報をダダ漏れにしている場合はその限りでないし、そんなプライバシー情報に対する侵害のハードルは高くなるのは当然。
→→文体と「マストドンあたりがあやしい」とのわずかな情報で必死で御隠れになった神をおいかけなければならない信者の立場になってください、というわけで即売会に出ている人なら一発(ピクシブに即売会でうちのブースに来てくれという広告的な情報を載せる人が多い。当然、ペンネームをある程度の期間に一貫させておくことが創作活動や創作スタンス表明の基本になる)。ペンネームだとかピクシブ限定というところにこだわっているが(ふつう会員同士でなければ見れない情報とかはいざさらしにあった幼稚園の母親にだって意味がないなぐさめ。興味本位でたどり着かれる可能性があるというだけで恐怖です)、ネットにはもっとひどいことに特定班というのがいるわけです。http://dic.nicovideo.jp/a/%E7%89%B9%E5%AE%9A%E5%8E%A8 コミュニケーションってのはすべてが善意前提で成り立ってる世界です。あの人に伝えたい、なんならもっと多数の人にもみてもらってよい、という意志から、隠れたいという意志に代わるきっかけをもたらした罪は大きい。法的にも問題ないしここならさらに問題ないだろう、とおもって「都条例ではわいせつでない」ものを公表しておいてこのありさまですから、油断していたとの反動でとにかく消しまくっているかもしれません。マイピク限定にしていたってツイッターに鍵をかけていたって、結局は無駄だった、というのは唐澤弁護士だって引っかかった罠だと思います。
http://dic.nicovideo.jp/a/%E5%94%90%E6%BE%A4%E8%B2%B4%E6%B4%8B
あとプライバシー権でいう個人情報は個人情報保護法の個人情報とも、また、著作権でいうペンネームhttps://ja.wikipedia.org/wiki/%E5%AE%9F%E5%90%8D%E3%81%AE%E7%99%BB%E9%8C%B2 とも当然異なる可能性がある。なんたって、プライバシー権こそ判例法しかないんだから。ブブカ事件とかピンクレディー事件では芸名でちゃんと議論されてたと思うよ。
コンピュータ言語って世の中に山ほどあるけれど、それぞれの言語ごとに特徴がある(特徴のない言語は廃れていく)。
あまり言語に詳しくない人相手に、俺の考えるそれぞれの言語の特徴を書いてみようと思う。
なお、取り上げるのはある程度広く使われている言語に限りたいと思う。
言語名 | 概要 |
---|---|
C言語 | 高速動作するバイナリ生成を目的としたコンパイル言語。だいたいどんな環境でも使えるがバグ出やすい |
C++ | マニアック言語、高速、習得大変 |
Java | サーバで高速かつ安定に動作するコンパイル言語、大規模でよく使われる |
C# | 主にWindowsクライアント用のバイナリ生成に使われるコンパイル言語 |
Perl | 広く使われていたが今は若干時代遅れのスプリクト言語。汚い |
Python | Perlにかわって主流になりつつあるスクリプト言語。綺麗 |
PHP | Web開発にフォーカスされたスクリプト言語。一世を風靡した。 |
Ruby | とても綺麗なスクリプト言語 |
JavaScript | ブラウザで実行出来る唯一の言語。言語自体はいまいちだが、ブラウザの事情で需要あり |
Go | サーバサイドで安全かつ高速動作するバイナリ生成を目的としたコンパイル言語 |
メモリに直接アクセスして書き換えるといったコンピュータの機械語に近い言語構文を持つため、高速な処理が可能な言語。
コンパイラの歴史も古く環境も整っており、組み込み系などを含むほぼ全ての環境で利用可能な万能言語。
一方で、メモリの確保や解放といった基本的なことも自前で処理する必要があるため、コーディングの効率が良くなく、多種多様のバグを生みやすい側面も持つ。
ある程度以上のエンジニアであれば常識として知っておきたい言語だが、初めて覚える言語としてはあまり適当ではない。
C言語にオブジェクト指向を導入した言語。C++言語とはあまり呼ばれず、しーぷらすぷらす、もしくは略してしーぷらぷら、しーたすたす、などと呼ばれる。
C言語の速度を維持したままオブジェクト指向やテンプレートなどの効率的な記述を可能にしようとした意気は真っ当だったのだが、
当時最先端だった色々な技術や思想を叩き込んだおかげで、あり得ないほど複雑化した言語としても有名。
「C++を理解しています」という人はほぼ初級者で、本当に理解していくほど「C++には自信がありません」となっていく。
速度を追求する分野では良く使われている。完全に理解するのは難しいとしても、テンプレートくらいまでは理解しておくと仕事上なんとかなる…かもしれない。
サーバサイドで安全にコードを実行する目的でよく使われる言語。長い歴史を持っており、比較的高速に動作する。
当時は画期的だった「バーチャルマシン」や「ガベージコレクション」という機構を備え、CやC++でよく問題になるメモリの解放忘れというバグを生まず、
サーバサイドなどで何千時間と動作するソフトウェアに適した言語として受け入れられた。
必然的にエンタープライズ用途で利用されることが多く、各種ツールなども豊富。人海戦術がしやすい言語という側面も出てきた。
一方でブラウザにHello Worldを出すだけでも大変な労力を必要とするので、スタートアップなどではあまり使われない。
ガラケーのアプリや(ちょっと違うが)Androidなど、クライアントサイドでも使われることがある。
プログラミング言語で最初にJavaを覚えるという人は結構多いが、仕事としてJavaを使うのは大抵SI系の業務になり、なかなか辛い労働を強いられる可能性が高い。
クライアントサイドで安全にコードを実行する目的でよく使われる言語。こちらも比較的高速に動作する。
元々はWindowsのクライアント用の言語であり、Javaとは違ってクライアント向きのAPIが多数ある。
マイクロソフトが開発した言語ということもあり、マイクロソフトの優れた開発環境が利用出来るので開発効率は非常に高い。
Unityなどでも利用可能であるが、基本的にはクライアントの実行形式ファイルを生成する目的が大きく、サーバサイドではあまり使われない。
自作のゲーム開発をしたいのであればうってつけの言語。初めて覚える言語としても十分に良いだろうが、C#を使う仕事は近年無くなりつつある。
ほぼ全てのLinux系ディストリビューションに含まれており、ツールや様々な用途で使われていた。
上に紹介したC、C++、Java、C#のようなコンパイル言語とは違い、(少し語弊はあるが)1行ずつ実行してエラーがあれば止まるスクリプト言語である。
ちょっと開発してすぐに実行ということが出来るのと、コマンドラインでワンラインのコードを読み込ませてちょっとした処理が出来るなど応用範囲の広い言語である。
20年近く前にWebでCGIが普及した時には、ほぼどのようなサーバ環境でも実行可能だったこともあり、Perlを使うことが極めて多かった。
しかし、主に読みづらい言語仕様のせいで、近年新規ではほとんど使われなくなった。既存のコードもどんどん別の言語に置き換えられていることが多い。
日本の大手Web企業の一部が使っているので、そこに就職するために覚えるのもアリっちゃアリだけど、今からPerlをわざわざ覚えるのは強くオススメしない。
後発のスプリクト言語。こちらもほぼ全てのLinux系ディストリビューションに含まれており、それゆえに広く使われている。
インデントまで言語仕様で規定することで、誰が書いても読みやすいコードになるように考えられている言語である。
Perlの代わりに使われることが増えていて、周辺ツールなども充実しており、小規模から大規模までカバーする勢いがある。
ただ、Python2とPython3のバージョン間での非互換性があまり綺麗に設計されていなかったため、そこで混乱を招いていたこともあった。
最近だとマシンラーニング系のライブラリでPythonが使われていたり、海外ではPerlに代わる言語として受け入れられつつある。
Web開発に特化したスクリプト言語。CGIの代わりに使われ始め、一世を風靡した。
以前CGIでWebに何かを表示するには比較的大変な労力を割かなければいけなかったのが、PHPを使うと誰でも即座にWeb開発が出来たので爆発的に普及した。
またphp.netの豊富なドキュメント&スニペットのおかげもあり、開発初期の効率が大変に良い言語である。
残念なことに、言語やAPIの設計がいけていない点が多く、一部の人からは蛇蝎の如く嫌われている。
今でも根強い人気があり、海外でも小規模プロジェクトの最初の開発にPHPを選ぶのは比較的よくある選択肢であるようだ。
Webアプリを開発をしたいという明確な目的を持つ人が、最初に学ぶ言語としてPHPを選ぶのは理にかなっていると思う。
なおこの言語を本気でディスってる人は大体視野の狭いエンジニアであることが多いので、地雷エンジニアを見分けるのにも役立つ。
綺麗なスクリプト言語。日本発で世界的に普及している数少ないIT技術の一つ。
言語仕様が美しく、それゆえにファンが多い。Ruby on RailsというWeb用フレームワークの登場で、Webアプリでの採用例も一気に増えている。
基本的には他のスクリプト言語と同じくサーバサイドでのプログラミングに用いられることがほとんどである。
スクリプト言語で何かを作成するのであれば、Rubyを選んでおけばそう失敗することはない万能言語。
サーバサイドで何かすることに興味を持っているならば、最初に覚える言語としてはとてもオススメ出来る。
一方で、なぜかRubyが採用するWeb側のフレームワーク(具体的にはprototype.jsやCoffeeScript)はいつもクソなので、そちらは深入りしないのが吉。
ブラウザで動くスプリクト言語。ブラウザ戦争が勃発していた18年前、奇跡のようなめぐり合わせでベンダー間の合意が取れ実装された言語。
言語としてはプロトタイプベースのオブジェクト指向という少しめずらしい形式を取っているが、実際にはあまりその特徴は利用されていない。
言語仕様がイマイチで、大変バグを生みやすい言語であり、また関数のスタックが深くなる特性もあり、あまり積極的に使うべき言語ではないが
ブラウザで動く言語が現在これしかないので、大きなシェアを持っている。
一部の物好きがサーバサイドでこの言語を使おうと(主にnode.jsで)四苦八苦している(とはいえ、1つの言語でWebとサーバが完結するのは大きなメリットだ)。
ブラウザで動く唯一の言語のくせにとにかく書くのが面倒ということもあり、多数のAltJSと呼ばれるJavaScriptに変換される別言語を生み出されている。
まあJavaScript本体人が手で書く言語ではない…というのがECMAScript5までの印象だったが、新しい規格が順次導入されており、今後に期待。
Web業界で生きていくならば、好むと好まざるとにかかわらず覚えなければいけない言語である。
最初に覚える言語としては、ブラウザ上でゲームなども作れるし、node.jsでサーバサイドもできるしで、意外とオススメだったりする。
C、C++やJavaと同じでコンパイル言語。サーバサイドで高速かつ安定なバイナリを出力することを目的とされ設計されたGoogle発の言語。
その目的においてはかなり高性能を誇るので、特に速度を要求されるサーバサイドでのプロジェクトでは導入が進んでいる。
それ以外の目的ではあまりこの言語を採用するメリットはないが、ニッチな用途をピンポイントで抑えており、これから広く利用されることも期待される。
コミュニティも活発であり、初めて言語を覚える人が参入すれば喜ばれるだろう。言語としても美しい言語なので、サーバ系のプログラムに興味があればオススメである。
繰り返しだけれど、それぞれの言語ごとに特徴があり、特徴のない言語は廃れていく。
ここに挙げた言語は何らかの特徴があり、何らかの用途で必要なので生き残っている。
その背景を知った上で、ここにある言語は全部ある程度読み書きが出来るようになると素晴らしいと思う。
スニペット
Evernoteを使いこなすために大事なたったひとつのこと、それはキーワードを暗記すること。
昔Evernoteを使い始めたとき、ぼくはこれで記憶することから解放されると喜んだもんだった。
でも、ノートが5千枚くらい到達するあたりに気がついた。
Evernoteは記憶じゃなく情報。Google検索よりは、自身によって検査/推敲されているが読んで頭にロードしないと利用不可能な情報。
keyを想起し検索しEvernote内の情報を取り出し利用可能にするためにも検索キーワードのインデックスを脳内に構築する必要がある。
インデックスの構築とはすなわちキーワードの暗記という長期記憶化作業で、このインデックス構築を簡単にしてくれる手法としてはスペースドリハーサルがいい。
10分後→1日後→3日後→1週間後みたいなペースで復習するあれだ。
復習のタイミングを変えるだけで記憶の定着度は4倍になる 読書猿Classic: between / beyond readers
当然人間は意味のある事しか記憶できないのでkeyだけの記憶は意味をなさなくkey(検索キーワード)⇔ value(その意味、概要)の長期記憶化された双方向な知識ノードを構築する作業になる。
このうんざりする作業をとても簡単にしてくれるのがあの有名なankiだ。スペースドリハーサルのスケジュールを自動的に作ってくれる。スマートフォンアプリも存在するので隙間時間をインデックス構築に充てる事もできる。
Anki - powerful, intelligent flashcards
例えば、なにか新たにプログラミング言語を学習するとしたら以下のような流れになると思う。
基礎知識ほど応用が効くので基礎知識は原則暗記という形になる。取り出し機能が十分に暖められている長期記憶はアクセス速度が尋常じゃないくらい早いので、記憶があるというだけでググって記憶欠落を補う体験と別次元の体験を与えてくれる。
本末転倒じゃあねえかとおもうかもしれないが、ここで記憶するキーワードはEvernoteに蓄積する情報の上澄みみたいなものであることと、さらには長期記憶は利用しない時間がある程度経過すると容易に細部が壊れるてくるのでそこでEvernoteなどの電子的な外部記憶が必要になってくる。