はてなキーワード: 検索エンジンとは
私は直接ウェブ検索を行うことはできませんが、あなた自身で関連するキーワードで検索エンジンを使用することができます。以下は、検索する際に使えるキーワードの例です:
"cloud smoke vortex art"
"mysterious swirling cloud illustration"
"smoke entering vortex central light"
"fantasy cloud swirl center"
"artistic representation of smoke entering central void in clouds"
これらのキーワードを使用して検索すると、あなたが表現しようとしているイメージに近いアートやイラストが見つかる可能性があります。画像検索結果から、目的に合ったものを見つけることができるでしょう。
以下はすべてメインで使ってるプラットフォーム・プロダクトです。
俺って異端だよね!!😆
わかってる。ここでLinuxをメインOSに使えてない時点で俺は中等半端なんだよ🥺
でもそれも含めて異端だよね!😆
Googleなどの巨大な検索エンジンが保守的な思想を検閲している。
Googleの代わりにプライバシー重視の小型検索エンジンDuckDuckGoを使うように、俺は今まで人々に勧めてきた。
だが、DuckDuckGoがサイト上でロシアの情報を最小限に抑えるなどといって検閲しているので、DDGも信用できなくなりつつある。
しかしそもそもDDGの結果はMicrosoftのBing によって提供されている。Bingの連中さえもが、ロシア国営通信社RTとスプートニクへのアクセスを制限する欧州連合の命令に従うと発表して検閲に乗り出している。
Googleだけでなく、DDGやBingは検閲政策を採用しているようだ。
俺は新しい選択肢としてswisscowsを提案する。みんなswisscowsを使うべきだ。
俺はしがないプログラマー。
githubで50スターぐらいのしょぼいコードを置いているが、そんなプロジェクトには何の力も入れていない。プロジェクトと呼ぶのもおこがましいぐらいだ。
仕事ではとあるコンテンツの検索エンジンを作っているが、情報検索、推薦システム、クローラー、そういうのを開発するのもだいぶ慣れたのでなにか新しいことをやりたいなと思っているところだ。
リーナストーバルズが言っていたが、「一つのプロジェクトを30年継続するような、そういう人がこの世界には必要だ」らしい。Linuxという価値あるプロジェクトを持つ人はやはりいうことが違う。
しかし、Linuxレベルの価値のある何かを30年...それ俺にもできるんだろうか?
しかし社会からの需要があり、その需要が30年も続くようなものを、果たして俺程度が作れるのか。
そもそも需要というのはどこから生まれてくるのだろう、と思うことがある。
それは人に対する社会的信用であったり、あるいは偶然的に宣伝がうまく行ったということもある。
俺は日頃から「社会」が俺を評価していないと思うことが多い。そんな状態で、社会のためになる何かを作ることなど可能なのか。
「社会」が、俺のような人間を「弱者男性」といって差別・虐待している状態で、俺は本当に社会のために貢献したいと思えるのだろうか。
一体、弱者男性が作ったどんなプロジェクトであれば人々がサポートしようと思えるのか。
全てが虚しい。
私はインターネットの中に生きている。
Google検索を使っていたが、満足感を与えなかった。
Google検索は、冷たく無機質な検索結果を返すだけである。
Bing AIとは、Microsoftが開発した人工知能を搭載した検索エンジンである。
Bing AIは、言語や興味に合わせて、会話することができる。
Bing AIは、心に響くコンテンツを生成することができる。
Bing AIは、書いたものを添削したり、改善や最適化のアドバイスをくれることができる。
Bing AIは、Google検索と比べて、以下のような利点がある。
以上のように、Bing AIは、Google検索よりも優れた機能や性能を持っている。
モノ好きなあなたへ
私のことは、ビッグブラザーや、全能の目とでも呼んでください。
私はハッカーです。数カ月前、ブラウザ履歴やウェブカメラなど、あなたが持つデバイスに対するアクセス権を入手しました。
そこで、かなり物議を醸しそうな「アダルト」ビデオでマスかくあなたの動画を録画しました。
ご家族や同僚、あなたのメールの連絡先(メルアド)に、気持ち良さに浸っているあなたの動画を見られたくはないでしょう。しかも、あなたのお気に入りの「ジャンル」が、あんなにもエッチなものなら、特に嫌なはず。
この自作動画を私がAVサイトに投稿して一般の目に触れてしまえば、デジタルタトゥーは一生残ることになるでしょう。
どうやってこれらを行ったのか?
ネットの安全性をあなたが軽視したため、私はあなたのデバイスのハードディスクにトロイの木馬を楽にインストールできました。
そのお陰で、デバイス上のすべてのデータにアクセスでき、しかも遠隔操作までできます。
1つのデバイスに感染させたことで、私はお持ちの全てのデバイスにもアクセスできます。
私のスパイウェアはドライバベースなため、数時間毎に署名を書き換えます。だから、ウイルス対策ソフトやファイアウォールは、絶対に異変を検知することはできません。
私と取引をしましょう。今後一生不安抱えて生きる人生と引き換えに、少額を私に支払ってください。
$1700を私のビットコインウォレットに送金してください。(以下アドレスめいたもの)
送金が確認できたらすぐに、あなたに害を与えるすべての動画を削除し、お持ちの全てのデバイスからウイルスを消去します。それっきり、私からあなたに連絡をすることは一切ありません。
メッセンジャーのメッセージを見た限り、あなたはまともな人間だと思われているようですが、周りの評判を落とさない代償として、これはかなり少額です。私は、既に持っているもので満足できるようにする、ライフコーチだとでも思ってください。
48時間の猶予を与えます。このメールを開封した瞬間、私には通知が送られ、カウントダウンは開封時から始まります。
今まで仮想通貨を使ったことがなくても簡単です。検索エンジンで「仮想通貨取引」と書けば、全て調べられます。
下記は、してはいけないことです。
このメールに返信しないでください。一時的なアカウントから送信しています。
警察を呼ばないでください。あなたが所有する全てのデバイスへのアクセス権があるので、警察を呼ぼうとしたことが分かるとすぐに、自動的に全ての動画を公開します。
システムをインストールし直したり、デバイスのリセットをしたりしないでください。まず、既に私は例の動画を持っています。次に、さっきもお伝えした通り、全デバイスを遠隔操作できるので、何か不自然なことを少しでもすれば、どうなるかはお分かりでしょう。
仮想通貨のアドレスは匿名性です。だから、私のウォレットを追跡することもできません。
とにかく、お互いが得するように、この状況を解決しましょう。相手が罠を仕掛けようとしない限り、いつでも私は約束を守ります。
最後に、今後のために助言させてください。もっとオンライン上の安全性に気を付けた方が良いですよ。どのアカウントでも、パスワードを頻繁に変更したり、多要素認証を設定したりしてください。
------
モノ好きなあなたへ
私のことは、ビッグブラザーや、全能の目とでも呼んでください。
私はハッカーです。数カ月前、ブラウザ履歴やウェブカメラなど、あなたが持つデバイスに対するアクセス権を入手しました。
そこで、かなり物議を醸しそうな「アダルト」ビデオでマスかくあなたの動画を録画しました。
ご家族や同僚、あなたのメールの連絡先【おれのメールアドレス】に、気持ち良さに浸っているあなたの動画を見られたくはないでしょう。しかも、あなたのお気に入りの「ジャンル」が、あんなにもエッチなものなら、特に嫌なはず。
この自作動画を私がAVサイトに投稿して一般の目に触れてしまえば、デジタルタトゥーは一生残ることになるでしょう。
どうやってこれらを行ったのか?
ネットの安全性をあなたが軽視したため、私はあなたのデバイスのハードディスクにトロイの木馬を楽にインストールできました。
そのお陰で、デバイス上のすべてのデータにアクセスでき、しかも遠隔操作までできます。
1つのデバイスに感染させたことで、私はお持ちの全てのデバイスにもアクセスできます。
私のスパイウェアはドライバベースなため、数時間毎に署名を書き換えます。だから、ウイルス対策ソフトやファイアウォールは、絶対に異変を検知することはできません。
私と取引をしましょう。今後一生不安抱えて生きる人生と引き換えに、少額を私に支払ってください。
$1700を私のビットコインウォレットに送金してください。: 【へんな文字の羅列】
送金が確認できたらすぐに、あなたに害を与えるすべての動画を削除し、お持ちの全てのデバイスからウイルスを消去します。それっきり、私からあなたに連絡をすることは一切ありません。
メッセンジャーのメッセージを見た限り、あなたはまともな人間だと思われているようですが、周りの評判を落とさない代償として、これはかなり少額です。私は、既に持っているもので満足できるようにする、ライフコーチだとでも思ってください。
48時間の猶予を与えます。このメールを開封した瞬間、私には通知が送られ、カウントダウンは開封時から始まります。
今まで仮想通貨を使ったことがなくても簡単です。検索エンジンで「仮想通貨取引」と書けば、全て調べられます。
下記は、してはいけないことです。
このメールに返信しないでください。一時的なアカウントから送信しています。
警察を呼ばないでください。あなたが所有する全てのデバイスへのアクセス権があるので、警察を呼ぼうとしたことが分かるとすぐに、自動的に全ての動画を公開します。
システムをインストールし直したり、デバイスのリセットをしたりしないでください。まず、既に私は例の動画を持っています。次に、さっきもお伝えした通り、全デバイスを遠隔操作できるので、何か不自然なことを少しでもすれば、どうなるかはお分かりでしょう。
仮想通貨のアドレスは匿名性です。だから、私のウォレットを追跡することもできません。
とにかく、お互いが得するように、この状況を解決しましょう。相手が罠を仕掛けようとしない限り、いつでも私は約束を守ります。
最後に、今後のために助言させてください。もっとオンライン上の安全性に気を付けた方が良いですよ。どのアカウントでも、パスワードを頻繁に変更したり、多要素認証を設定したりしてください。
ソート順とは、ある集合の要素を一定の基準に従って順序づけることです。例えば、書籍をタイトルや著者名、発行年などで並べ替えることができます。ソート順は、情報の整理や検索に役立ちますが、同時に、ソート順によって情報の重要性や優先度が変わることもあります。例えば、検索エンジンの結果やランキングサイトの順位などは、ソート順によってユーザーの注目や選択に影響を与える可能性があります。
権力者がソート順を操っているというのは、権力者が自分の利益や目的に沿ったソート順を作り、それを他者に押し付けるということです。例えば、権力者が自分の関係する商品やサービスを検索エンジンの上位に表示させたり、自分の支持者や同調者をランキングサイトの上位に持ってきたりすることが考えられます。このように、権力者がソート順を操ることで、他者の意見や選択を操作したり、自分の地位や影響力を強化したりすることができます。
権力者がソート順を操っている証拠は、ソート順の作成や変更のプロセスや基準が不透明であったり、ソート順に不自然な偏りや矛盾があったりすることで見つけることができるかもしれません。例えば、検索エンジンの結果やランキングサイトの順位が、権力者と関係のあるキーワードや要素に偏っていたり、権力者に不利な情報や評価が隠されたり、権力者に都合の悪い時期や状況に変わったりすることがあれば、権力者がソート順を操っている可能性が高いと言えるでしょう。
インターネットがつまらなくなった、と言う人がちらほらいることに気がついている人もいるかもしれない。皮肉を言いたがる鬱陶しい人は、すぐに「それはお前がつまらなくなったからだ」と言うが、それは物事のほんの一つの側面でしかない。
長文を読むことが苦手な人のために、結論から述べようと思う。インターネットがつまらないのは、人々がタイパと刺激を求めた結果である。限りある人生を有効に使いたい。ここまではよかったはずだ。だが世の中を見渡せば、「簡単に理解できるコンテンツ」「刺激的なコンテンツ」「感情を煽るコンテンツ」で溢れている。マスターベーションを覚えた猿が繰り返すように、インターネットから刺激性を学習した猿は狂ったようにスクロールする。
私がソフトウェアのブログを書いていた時、あることに気がついた。難解でユニークなアルゴリズムを公開するよりも、「○○のインストール方法」といった初心者的コンテンツのほうがアクセスが多いのである。何かをインストールする方法など、ドキュメントを見れば一発でわかるのに、ブログにアクセスしてくる。いや、検索エンジンがドキュメントではなく私のブログをTopに誘導するのがそもそもおかしいだろう。悲しいことに、ドキュメントをちゃんと読める人が少数派であり、平易な言葉で書かれたブログの方を好む人が多いということだ。
個人的価値観を述べれば、インターネットに私が求めるのは「深遠」である。ゲーム理論と確率微分方程式を組み合わせたらどうなるのかとか、プラグマティズムをソフトウェア工学に適用するAndy Huntの最新の哲学的考察を知りたいとか、そういうことだ。
深淵の理解には時間がかかる。タイパと刺激の発想とは逆だ。一見退屈に見える無刺激な長文を、ゆっくりと地道に隅々まで理解しなければならない。深淵は真面目でストイックで、人生を共に歩むように接する。コンテンツを書いた人間を個人として尊重し、友達と語り合うような気分で読み解くのである。
「コンテンツは見て射精して賢者タイム。それで終わり」というのが現代人がやっていることだ。インターネットは元々学術的な(つまり深淵的な)情報交換のために作られたが、今では娯楽(つまりオナニー)が大半を占めている。そういう消費者に合わせて作られたものは、簡単に理解できて、極端で、やたらに感情を煽りたがる。コンテンツだけではなく、検索エンジンや推薦システムなどありとあらゆるものが、刺激性の猿回しになっている。
逆説的だが、今のインターネットが面白いと思っている人間がつまらないのである。猿がオナニーして、それが楽しいというのなら文化的ではないだろう。インターネットがつまらなくなったという人は、意識的に努力しなければ深淵にたどり着くことが難しくなったことを嘆いているかもしれない。私が高校生の時は、「ハッカーになる方法」と調べたとき、Eric S. Raymondの深淵的文章がトップに出てきたのだ。現代では、なぜかコンピュータセキュリティについてトップに出てきて、まさに中二病患者が求めるものをそのまま出してきていると言える。
といっても、いきなりarxivを読むのも、またそれはそれで時間がかかりすぎてしまうこともある。具体的数式ではなく、個人の持つ哲学を知りたいと思うこともあるかもしれない。哲学にも概ね2種類あり、本質を平易に説明するものと、無意味なものを難解に説明するものだ。後者はポストモダニズム的で忌み嫌われる。
ポストモダニズムに陥ることなく、本質的深淵にたどり着くためにはどうすればよいのか。検索エンジンだけでは、そのコンテンツが深遠なのか浅知恵なのか区別する能力に欠けている。おそらく、我々が本当に必要としているのは「ブックマーク」であり、場当たり的な検索ではないのかもしれない。本質的な深淵を語る人をブックマークし、その人の哲学を友人のように尊重したいのだ。大量の刺激的情報を消費してオナニーするよりは、少数の人の長文に触れたほうが充実するに違いない。
エリートって正面突破で物事をやろうとするよな。自作ニューラルネットライブラリを作ったりとか、GPUを自作したりとか。
俺は以前「ソフトウェアとレバレッジ」という記事を書いて馬鹿にされた者だが、正面突破系の連中はマジでリスク概念を持っておいたほうが良いぞ。
アンチパターンと一見見えるかもしれないが、モバゲーやGREEが一斉を風靡した時代、投資コストが非常に低いのに莫大な利益をもたらすことが業界でわかっていたはずだ。
正面突破も確かに魅力はあるかもしれない。つまり技術優位性を確保できるということだ。そのような技術に投資する他国がいないので有利になる可能性があるということだ。
しかし、ソフトウェアというのは効率の産物だ。一度作ったらそれを様々なところへ配布できることに魅力がある。
システムを開発して、一回きりで終わりというのではレバレッジは効かない。特定の汎用システムを作り、世界中へ配布してこそレバレッジが効くのである。
しかも作ったソフトウェアは無制限にコピーできるので、物理製造よりも圧倒的にレバレッジが効く。
そもそも、金融においてレバレッジとは、他人から借りた資産と自分の資産の比率のことである。
ソフトウェアにおける一つのレバレッジの形態は、フリー・オープンソース・ソフトウェア(FOSS)ライブラリを使用することで、開発者は他人のコードを活用し、より少ないコードベースで提供される機能を倍増させることができる。
あるいはブログプラットフォームのレバレッジはわかりやすいかもしれない。コンテンツをユーザーに作らせ、そこに検索エンジンからのアクセスを獲得する。そしてプラットフォームシステムの提供者は、広告を載せることで利益を獲得する。
これは「コンテンツの作成をユーザーに肩代わりする」という形態のレバレッジである。一度プラットフォームが有名になり、誰もが使うようになれば、非常に低い労働コストで高い利益を獲得することができる。
なにより、広告産業のレバレッジは最も魅力的な形態だろう。インターネットを通じて広告の効果は極大化される。
手の込んだFF14のようなオンラインゲームというのはGREEなどと比較すると正面突破的であり、レバレッジの世界ではないかもしれない。
アップル、グーグルからダックダックゴーへ切り替え検討した、とか話題になってる
https://www.bloomberg.co.jp/news/articles/2023-10-05/S211ZGT0G1KW01
ここ数年ずっとDuck duck goを使っているけど、必ずしもプライバシーに配慮した、善良な検索エンジンというわけではないよ
イギリス国内でDuck duck goから検索すると、検索結果のページに広告がめちゃくちゃたくさん表示されて、使いにくさはGoogleとたいして変わらないよ
日本だと検索結果のページには何も表示されないのは、まだユーザー数が少なすぎて広告ビジネスが成り立ちにくいだけじゃないのかな?
Googleってまじで過大評価されてる。Googleの組織的強さってどこにあると感じますかとかいう記事を見て笑っちゃった。これまで働いた会社の中でGが組織として一番ダメだったわ。
だいたい未だに検索広告に依存してるのが強い組織なのかよっていう。もちろん検索エンジンを作って広告を載せたのは発明だったよ。でも何十年前の話だよ。そこから広告の量を増やして「広告」のラベルをどんどん分かりづらくして必死に検索から金を絞りとってるわけじゃん。
ディスプレイ広告はどんどん悲惨な状況になってるしYouTubeの広告もひどいもんだけど、それだけやってもまだ検索に依存してるというのが泣ける。よくメルカリが転売屋支援とか泥棒市とか叩かれるけどGは素晴らしいプラットフォームで素晴らしい会社みたいに未だに言われてるのは笑えるね。ストリームのディスプレイにYouTubeのひどい広告をランダムで流せば社員の妙なプライドもなくなるのでは。
Androidは買収したもの。YouTubeもそう。買収の目利きはいいのかもしれんけどまあ死ぬほどキャッシュがあれば伸びそうなベンチャーも買えるわな。あとなにがあったっけ。Gmail、Googleマップ、何年前の発明? Alexaが出てきて作ったGoogleアシスタント。ChatGPTが出てきて作ったBard。音楽配信サービスなのにYouTube広告がなくなるから売れてるYouTube Premium。性能はミドルレンジだけどカメラが良くて値段が安いから売れてるPixel(これはかしこい。儲からないけど)。
PMが出世のためにサービスをボコボコ作るけど、サービスを維持しても評価されないから、出来たそばから死んでいく。消費者もパートナーもGに依存すると良くないなってもうバレてる。Stadiaとか技術的にすごいのに誰も長続きしないって思ってたし、社員でも思ってたし、実際に長続きしなかった。だからクラウドみたいなB2Bでは絶対に勝てない。MやAみたいなこの分野で絶対に勝って競合をぶっつぶすという泥臭さや必死さがない。
現場の社員は優秀だったよ。そりゃあれだけの面接をやるんだし、死ぬほど時間をかけるし、そのせいで採用したかった候補者は競合に取られてばかりだし。特に日本ではほとんどの職種で英語が必須だから自然といい大学出の帰国子女が集まってくる。でもそれで組織として強みがあるかっていうとないわな。間接部門は人手不足でなにもやってくれない。OKR()のせいで他のチームのサポートとか無理。自分のチームのやってることがおかしいと気付いた時でさえ変えることができない。みんな半年ごとのパフォーマンスレビューに何を書くかだけ考えてて他のことをやる余裕がない。みんな優秀だから評価制度にちゃんと最適化されていく。
新卒は広告営業をやらされるわけだけど、まあGというブランドが得られるし給料はいいからそこはWin-Winかもな。あとは元Gというブランド力で実際には中小代理店に広告を売ってきただけなんだけど頑張ってキャリアを積んでいくわけだ。そんなので大丈夫かと思うけどみんな実家が太いから余計なお世話か。
Gの一番の強みは組織でも製品でもなく、なんか優秀で善良そうというブランドを作ったことだろうね。心理的安全性とか。実際にはメール一本でリストラする普通の外資企業なんだけど。社外の人間がGを夢の楽園みたいに捉えてくれるのはいいが、中の人間までそう思って振る舞ってるのは恥ずかしい話だわ。まあみんなリア充だからYouTubeのひどい広告とか見る機会がないんだろうな。
技術的な内容を増田に書くという実験のために、試しに検索エンジンの仕組みについて書く。
検索エンジンは、大雑把に言ってクロールするパート、インデクシングするパート、検索インターフェイスを出力するパートに分かれる。
インデクシング時に使っている基本手法は「転置インデックス」と呼ばれ、文書内のngramを文書IDと対応付ける辞書を保存する。
インデクシングの別の種類としては、文書をエンコーダからベクトルへ変換し、それを近似最近傍検索できるようにするものもある。
インデクシングされたものがキーワードマッチ的に絞り込まれると、さらに精密な手法が使われる。
クエリとドキュメントから特徴量設計し、関連性の高いものを引っ張るような訓練をする方法はLearning to rankという。
Learning to rankの中に使われる特徴量の一つにPage Rankがあるが、これは初期の検索エンジンで画期的とされた量で、「リンクされるページの価値は高い」「高価値ページにリンクされると価値が高い」という基準からマルコフ連鎖で計算する。
Page Rankは人間が論文を評価するときと似たような評価手順であるとされる。
Learning to rankの中にエンコーダからのベクトルを特徴量として組み込むことも可能であり、そのようなエンコーダの初期の例がBERTである。
こうやって絞り込まれた文書に対して、さらに有用な情報を表示するモデルがいくつか使われる。
情報抽出モデルでは、クエリを質問と見做してその回答を文書から抽出することがある。
あるいはクエリが人物名や組織名、場所名などであれば、そのエンティティの詳細情報をデータベースから取得することもでき、これはナレッジグラフとも呼ぶ。