「クエリ」を含む日記

はてなキーワード: クエリとは

2024-11-22

■

また検索システムが壊れてんのかよ

ま、クエリだとかは簡単なもんだろうから、結局性能不足なんだろうな

2024-11-21

■お前らなんで「ノア ドット」を使ってるんだ！？？！！

NHK「選挙報道の在り方検討」　兵庫知事選受け稲葉会長｜共同通信
https://b.hatena.ne.jp/entry/s/nordot.app/1231906104544346810
　
にじさんじ運営ANYCOLOR社、Web マガジンを開設　ROF-MAOら所属 VTuberを特集｜ KAI-YOU
https://nordot.app/1220961370791477896

？？？なんでnordot.appとかいう怪しいサイトを経由してる！！？

調べてみると、どうやら共同通信とヤフーが共同出資してるサービスらしい。

ニュースサイトがノアドットに記事を出し、キュレーターという記事紹介をする人にそれぞれお金が行く仕組みらしい。

・・・いやでもユーザーとしては元記事をブコメしたくね？

さっきのリンクで言えば、KAI-YOUの元記事が ↓ になるんだが、リンクや注釈が増えてるし。

https://kai-you.net/article/90811

共同通信の方は元記事が無かった。ノアドットがそもそも子会社だからだろうか。

内容の差異もそうだけど、単純に気持ち悪い。

間に入ったこのノアドットや、「キュレーター」という第三者に俺のアクセス履歴が共有されてるって事じゃん？

やってることはYahoo ニュースと同じなんだけど、あれはちゃんとひと目でそうだって分かる作りになってて、タイトルにもYahoo! ニュースって入ってるから筋は通してると思う。

でもこのノアドットの方は全然そうと分からせないようにしてるし、コソコソしてて気分悪いわ。

それにこれがはてブに出てくるって事ははてブ使ってキュレーターが金儲けしてるってことじゃん。

はてなはそれでええんか？

それともお前らがキュレーターなんか？それもユーザーから分からんよな。気持ち悪いわー。

例えばAmazonのアフィリエイトリンクなら「tag=〇〇〇-22」というクエリパラメータが付いてて明確だから良いけど、ノアドットの場合はパラメータもサブドメインも無いからなんも分からん。

Permalink | 記事への反応(0) | 17:38

2024-11-20

■神サーチがほしい

なんかAIとかじゃなくてさ、「神サーチ」みたいのできねぇかな

神サーチって何かと言うと、この世の森羅万象について100%正しい内容を返す装置

例えば「詐欺を行ったことのある人物の名前と住所の一覧をcsv 形式でください」とクエリを投げるとそのとおりにしてくれる

もちろん、俺の個人情報(例えばパスワード等)も漏れるので諸刃の剣だが、神サーチを俺だけが使える状態にしておいてほしい

Permalink | 記事への反応(3) | 09:58

2024-10-30

■そういやSQLってデータベースじゃないよ

構造化クエリ言語

データベースから条件に沿ったデータを抽出するための言語であってデータベースとは違う

データベースはOracleとかSQLServerとかMySQLとか

「SQLServerやMySQLにSQLって入ってんじゃん！」っていう人はJavaとJavaScriptも同じだと思ってる人かな

それはそうと、なんか根本的に理解が違いすぎて「こっから説明すんの？」ってめんどくさがって無視してゴメン

Permalink | 記事への反応(2) | 09:54

2024-09-26

■中途エンジニアの採用 面談を任されたんだが、エンジニア 面接のお題ってどんなものがいいんだろう

（SQLを渡して）「このクエリを高速化するとしたらどうしますか」

「とあるバックエンドの負荷テストを任されたとするとまず何をしますか」

「モバイルアプリで使える投票システムの開発を任されました。技術構成とおおまかな設計を考えてください。スピード重視のパターンと機能拡張重視のパターンで考えてください。」

「検索エンジンが大量のデータから高速に検索できている仕組みを簡単に説明してください」

（インタビュアーの得意分野のコードを渡して）「このコードは不具合があります。不具合を修正してください。」

（穴埋め式のコードを渡して）「円と長方形の当たり判定の途中のコードです。このコードを完成させてください。」

Permalink | 記事への反応(0) | 16:38

2024-09-18

■anond:20240918152313

クリックデータの集計において、毎回全データに対して集計SQLを実行すると時間がかかりすぎ、一方でバッチ処理で集計結果を保存すると、その後に発生したクリックをリアルタイムで反映できないという問題があります。この課題を解決するためには、以下の方法を検討すると効果的です。

---

### **1. インクリメンタル集計の導入**

方法**:

**累積集計の更新**: 既存の集計結果に新しいクリックデータを追加することで、全データを再計算せずに最新の集計結果を得る。
**トリガーやストアドプロシージャの活用**: データベースで新しいレコードが追加された際に、自動的に集計テーブルを更新する仕組みを構築する。

利点**:

データの追加ごとに小さな計算で集計結果を更新できるため、高速でリアルタイム性が高い。

---

### **2. リアルタイムストリーミング処理の活用**

方法**:

**Apache KafkaやApache Flink、Apache Spark Streamingの利用**: これらのツールを使用して、データストリームをリアルタイムで処理・集計する。
**イベント駆動型アーキテクチャ**: 新しいクリックが発生するたびにイベントとして処理し、リアルタイムで集計結果を更新する。

利点**:

リアルタイムでのデータ処理と集計が可能。
大量のデータを効率的に処理できるスケーラビリティ。

---

### **3. データウェアハウスとマテリアライズドビューの利用**

方法**:

**データウェアハウスの構築**: BigQuery、Amazon Redshift、Snowflakeなどのクラウドデータウェアハウスを使用して、大量のデータを高速にクエリ可能な形で保存する。
**マテリアライズドビュー**: 集計結果をマテリアライズドビューとして保存し、定期的またはトリガーで更新する。

利点**:

大量データに対するクエリが高速。
マテリアライズドビューにより、最新データを含む集計結果を効率的に取得可能。

---

### **4. NoSQL データベースの活用**

方法**:

**時系列データベース**: InfluxDB、TimescaleDBなどを使用して、時系列データの集計とクエリを高速化する。
**キーバリューストア**: Redisなどを使用して、集計結果をキャッシュし、必要に応じて更新する。

利点**:

時系列データの処理に特化しており、高速な集計が可能。
データの追加や更新が高速で、リアルタイム性を確保できる。

---

### **5. キャッシュとインメモリデータグリッドの使用**

方法**:

**インメモリデータグリッド**: Apache Ignite、Hazelcastなどを使用して、データをメモリ上で分散管理し、高速な集計を可能にする。
**キャッシュ層の導入**: 頻繁にアクセスされる集計結果をキャッシュし、新しいデータが発生したときのみキャッシュを更新する。

利点**:

メモリ上での処理により、高速なデータアクセスと集計が可能。
キャッシュを活用することで、データベースへの負荷を軽減。

---

### **6. ラムダアーキテクチャの採用**

方法**:

**バッチ層とスピード層の分離**: バッチ層で定期的な全体集計を行い、スピード層でリアルタイムの増分データを処理する。
**データの統合**: 最終的な集計結果は、バッチ層とスピード層の結果を組み合わせて得る。

利点**:

バッチ処理の利点（高い精度）とリアルタイム処理の利点（最新データの反映）を両立。
スケーラブルで柔軟なアーキテクチャ。

---

### **7. ウィンドウ関数と部分集計の活用**

方法**:

**時間ウィンドウを設定**: データを時間帯（例：1時間ごと、1日ごと）に分割し、部分的な集計を行う。
**部分集計結果の組み合わせ**: 必要な期間の部分集計結果を合算して全体の集計結果を得る。

利点**:

データの分割により、各集計処理の負荷を軽減。
新しいデータが発生しても、該当するウィンドウの集計のみ更新すればよい。

---

### **8. メッセージキューと非同期処理の導入**

方法**:

**メッセージキュー（RabbitMQ、AWS SQSなど）の使用**: クリックイベントをメッセージとしてキューに送り、非同期に処理・集計する。
**ワーカーのスケーリング**: 非同期処理を行うワーカーを必要に応じて増やし、処理性能を向上させる。

利点**:

非同期処理により、リアルタイム性を維持しつつシステムの負荷を平準化。
スケーラビリティが高く、処理量に応じて柔軟に対応可能。

---

### **まとめと提案**

**リアルタイム性とパフォーマンスの両立**: インクリメンタル集計やストリーミング処理を導入することで、最新のクリックデータを含む集計結果を高速に取得できます。
**適切なツールとアーキテクチャの選択**: データの規模や必要なリアルタイム性に応じて、ストリーミング処理、データウェアハウス、NoSQL データベースなどを選択します。
**スケーラビリティの確保**: 将来的なデータ増加を見据えて、スケーラブルなシステム設計を行います。

---

具体的なステップ**:

1. **要件の明確化**: リアルタイム性の程度、データ量、システムリソースなどを考慮して要件を定めます。

2. **プロトタイプの構築**: 小規模なデータでインクリメンタル集計やストリーミング処理のプロトタイプを作成し、性能を評価します。

3. **システムの実装**: 選定した方法とツールを用いて、実際のシステムを構築します。

4. **モニタリングと最適化**: システムのパフォーマンスをモニタリングし、必要に応じて最適化やスケールアップを行います。

---

参考ツールと技術**:

**データベース**: TimescaleDB（PostgreSQL ベースの時系列データベース）、Amazon Redshift、Google BigQuery
**ストリーミング処理**: Apache Kafka、Apache Flink、Apache Spark Streaming
**キャッシュ**: Redis、Memcached
**データウェアハウス**: Snowflake、Amazon Redshift
**メッセージキュー**: RabbitMQ、Apache ActiveMQ、AWS SQS

---

ご質問の課題に対して、リアルタイム性とパフォーマンスを両立する方法として、インクリメンタル集計やストリーミング処理の導入を強くお勧めします。これにより、新しいクリックデータを即座に集計結果に反映しつつ、全データに対する集計処理の負荷を大幅に削減できます。

Permalink | 記事への反応(0) | 15:32

2024-09-04

■anond:20240904092822

マイクロサービスになってる

ここでいう高可用というのは、ESにリアルタイムで同時に何万というクエリが発生しても捌けるという話

Permalink | 記事への反応(1) | 09:57

2024-09-02

■[開発メモ] SQLを徹底的に最適化しようと思ったら、まずAIに聞く

SQLは構文はわかっていても、最適化方法がイマイチわからない言語である

ここでいう最適化とは、DB 設計の方ではなく、クエリの方

そこで、こういうことはCopilotに全部聞いてしまう

大抵のケースでは、DB処理がこれでかなり高速化される

比較のために同僚が用意したSQLと比較したが、コピることで数倍高速化された

Permalink | 記事への反応(0) | 14:52

■anond:20240902002141

ChatGPT「ユーザーセッションをDBに保存して、まだ有効期限をが切れてないかリクエストのたびにDBに聞きに行くやつや」
えっそれは・・・データベースへのアクセスがいっぱいになるよね？
ChatGPT「せやで」
あかんやん！DBのお金くらいは出したるとは言え、リクエスト毎のアクセスはあかんわ。

1リクエストにつき1クエリなんて大したコストじゃないんだからサービスが当たってから考えたほうがいい

リトルリーグで素振りしてる少年が将来の年俸100億の投資先を心配してどうする

Permalink | 記事への反応(1) | 00:29

2024-08-31

■anond:20240831200438

ボタンの情報もクエリに含まれるんだ。

知らなかった。

ありがとう🙏

Permalink | 記事への反応(0) | 20:36

■

増田で検索した時に、クエリパラメータに「search=検索」って入るけど、何の意味があるんだろうこれ。

消しても結果は変わってないように見える。

誰か知ってる人いたら教えて。

Permalink | 記事への反応(1) | 19:56

■anond:20240823132137

俺は公共の場でハッテン行為をしたことはないが、お仲間たちにハッテン場扱いされてる公共の施設を「社会見学」と称して冷やかし目的で利用すること、その利用中に実際にハッテンと覚しき行為を目撃すること、知人から公共の場でのハッテン体験談を聞くことは結構ある。

なので公共の場でハッテンするゲイの思考の一端を推測を交えながら紹介することで、元増田のブクマに寄せられてるノンケブクマカ諸兄たちの疑問に答えてみようと思う。

俺はそういう行為を実践してないし肯定もしてないしさっさと警察捕まれとも思っているが、そういうゲイのアングラな生態を大いに面白がってもいるので、こういうリテラシー低めの人間が無理な方はバック願います。あと当然ながら露骨な性描写も含む。

なぜラブホ使わない？

ゲイのハッテンにもグラデーションがある。アナルを使ってのバックプレイからただ互いの勃起を見せ合うだけのプレイまで、行為のハードソフトの濃淡もあるし、ラブな気持ちにも濃淡がある。

アプリで出会った2人が意気投合して、あるいは事前にリクエストして初ベッドからカップルのようにイチャイチャプレイすることもゼロではないが、基本ハッテンは「性処理」が目的で皆ドライなのだ。

例えば現場がトイレだと、小便器で互いの奮い立った逸物を確認したあと目と目で通じ合えば個室に籠もり、手や口を使って発射して立ち去るまでお互い一言も発しないなんてこともザラなんだそうだ。

そういう濃淡の淡のほう、サクッと抜きたいときにタイプの男の手や口を借りるだけ。その処理にわざわざ移動して金払ってラブホには行かないのだ。

あとハッテン場扱いされてる公衆トイレや一般銭湯・サウナに行くと指にキラリと光るものをお持ちの殿方が結構多い。いわゆる既婚ゲイ・既婚バイ諸氏であり、ゲイバレしたら困る人たちである。

既婚ゲイの秘匿・隠密行動度合いにも個々人でグラデーションがある。例えば後述の有料ハッテン場はゲイタウンじゃない繁華街でも雑居ビルの上階にひっそりあったりするのでバレ率はそこまで高くないから利用するが、ゲイ向けマッチングアプリは家族のスマホチェックや誤爆投稿、マッチ相手からの個人特定が怖いから利用しない、といったようなリスクの捉え方は人それぞれだ。

それでいうとラブホに男2人は現場押さえられたらもう言い訳できないのである、本人の感覚としては浮気でも本気でもなくただの性処理なのに。

だから外回り中の駅トイレや退社後の一般サウナ等、ノンケ男が出入りしても問題無い場所でそそくさとハッテンするのである。俺としてもそっちの方が通報されたときのリスクがヤベーだろどんな判断だよ！とは思っているんだが。

ゲイ向けマッチングアプリ使え！

実際若い世代は真剣交際目的でもヤリ目でもゲイアプリやXのDMを駆使して出会っている、健全でよろしい。アプリ自体の普及もあるが、コロナ禍初期の行動調査や燃料費高騰による入場料値上げで若い子が有料ハッテン場から足が遠のいたのもアプリ全盛の一因である。

しかし同じヤリ目でも女子を落とすゲーム感覚だったり、多少タイプから外れていても女性器ついてれば興奮するから OKだったりするノンケ男子と違い、ヤリ目ゲイ男子は男の好みが細かいのである。ヤるだけなので収入や性格は無視して問題ない、要は顔とガタイとチ●ポの好みである。

マッチして顔とガタイとチ●ポの画像交換したあといざ待ち合わせしても、「おめー過去の全盛期のマッチョ画像送りやがったな！今ガチムチ通り越してピザデブじゃねーか！」ってこともしょっちゅうである。

そうすると互いに顔・ガタイ・チ●ポさらした状態で即マッチ即ハッテン出来る有料ハッテン場が楽チンすぎて恋しい……でもお金ないから頻繁には行けない……そうだ一般銭湯なら低価格で全部見放題！という思考回路に実際なるのかは、俺はもう若くないのでほぼ推測だ。ただそういう話をぼかしてジョークの体で語る20代知人はいる。

有料ハッテン場に行け！

有料ハッテン場にも店ごとにいろいろ入場コードがあって、先ほど言及したプレイの濃淡の淡、ライトなプレイ専門の店も無くはないが、シャワー完備の店はアナルプレイ指向の客がほとんどで、手や口でサクッと抜きたいだけの人が公共施設なんて使わずお行儀よく出向いたとしても以外とマッチしづらい。

抱きたい・抱かれたい男たちからのバックプレイのお誘いを一回一回断るのもなかなかしんどいのである。(タチネコのポジションをロッカーキーのバンドをどこに付けるかでアピールするタイプの店だと、バック無し希望もバンドでアピールできる場合もある)

そしておそらくここが一番のポイントなんだが、全世代ウェルカムなハッテン場はそこまで多くないのである。

旅館業法の宿泊拒否にあたるからかどうかは知らないが、しっかりした個室で宿泊できるタイプのハッテンサウナは年齢制限がない一方、

クルージングスペースと呼ばれる、簡易なシャワー室と仮眠室(という名目のプレイエリア)だけあるタイプのハッテン場は、すぐヤれるノリの良い空気感を維持するため、来店頻度の高い性欲ギンギンの若い顧客のマッチ率や満足度を高めて利益をあげるため、大抵40歳以上の入場を制限する。

鍛えていて筋肉ムキムキなら多少トシいってても可のマッチョ専門ハッテン場なんかもあるがそれでも大抵40代までだ。ゲイのおっさんには若いゲイとサカる権利がないのである。

そしてゲイおじは当然全世代向けのハッテン場でもアプリでもハブられなかなかマッチしないので残る道は2つ。

1つは金で解決。ゲイ向け風俗、通称売り専のコア顧客層が50代おじになるのはこのためである。

もう1つはゲイ市場から抜け出す、すなわち公共施設でハッテンするのである。もちろん公共でヤる若いゲイにもタイプはあるしおじのモテ度もそう変わらないんだが、

ハッテン場の入場料ほどコストを払ってないし本番プレイでは無いぶん「サウナでオナニー見せ合うだけだし別にこのオッサンでもいっか」と妥協する子も稀にいるし(ヤリ目ゲイは好みが細かいという前段での話と多少矛盾してしまうが、プレイの濃淡で相手の許容範囲が変わる子はいる。痩せてるチビの巨●なら咥えてみてもいいが抱かれるのは嫌だとか)、

「トイレに籠もって何本咥えられるかチャレンジ」みたいなタイプとかオッサンとか関係ない変態趣味の子も極々稀にいるそうだ。そういう子をゲイおじはデマだらけの出没予告書き込みからモノホンを精査して日々ハントしているのである。

迷惑行為は迷惑行為

とはいえどんな理由があろうとも迷惑行為には違いない。ノンケ諸兄に迷惑かけない場でいちばんライトなハッテンがしやすい場所はどこだろう……脱ぎ系ゲイバーとゲイクラブイベントだろうか。自分はあまり出向かない業態なのでそれほど詳しくないが説明してみる。

脱ぎ系バーは下着一枚になった客同士が酒を飲みながら交流するゲイバーの形態で、店のコンセプトによって褌やケツワレ(ジョックストラップ、スポーツ向けの布面積少ない下着)等のドレスコード指定もあったりする。

服を脱いでゲイの心も解放する！のが主目的の健全なバーも多いが、広い店だとなぜかバーエリアの手前、ロッカーエリアの裏手に薄暗いダークルームがあり、そこに意気投合した２人が吸い込まれていったりする。

脱ぎ系クラブイベントも同様に下着一枚に着替えた客がクラブのフロアで踊りつつ、何故かフロア端の薄暗いダークエリアに消えていくスタイル。

もちろんバーでヤってもクラブでヤっても公然わいせつだし店側もはっきり「禁止」と告知してるのだが、要は「客同士が勝手にやってるだけで店は関知してないしサービスとして提供してない」のポーズのための告知で、現場はほぼお目こぼしされてる状態だし、過激を謳うクラブイベントだとフロアど真ん中、ミラーボール輝く下で尺八がおっ始まるのである。

妊娠の心配がないのと現在はおハーブも大っぴらには出回ってはないことから「風紀の乱れ」的な当局の摘発はないが、まあ本気出されたらしょっぴかれてもしょうがない乱痴気騒ぎだとは思う。

そしてここまでハッテンの舞台はすべて東京を想定して語ってきたが、地方の田舎はゲイ人口も少ないので当然有料ハッテン場も脱ぎ系バーもゲイクラブも商売として成り立たないから存在しないし、男同士でラブホに入ってるところなんか目撃されたら瞬く間に噂は広がり即死である。(繰り返しになるが公共施設でわいせつ行為を目撃通報されても即死の筈なんだがな)

そういう訳もあって公衆浴場でのわいせつ行為で逮捕というニュースは地方発のものが多い印象がある。(東京のローカルメディアが警視庁発表の同様の事件をわざわざニュースとして取り上げていないだけかも知れないが)

Permalink | 記事への反応(12) | 04:22

2024-08-27

■山奥SEOとは？意味やメリット、検索ボリュームの小さいキーワードでの成功事例を徹底解説！

2024年 6月1日から、X（Twitter）で「山奥SEO」というキーワードが話題になっています。今回は今話題の山奥SEOについてどこよりも詳しく解説しています。ぜひ参考にしてみてください。

山奥SEOとは？

山奥SEO とは検索ボリュームが0〜100以下のキーワードを対策することです。サジェストに表示されないようなニッチなロングテールキーワードを狙う戦略です。

対象者は多くないが、特定の情報や商品を必要としている人に対して、ニーズを満たす丁寧な記事を書くことがポイントです。

初心者向けの山奥SEOのキーワード選びのヒントは後述の「山奥SEOのキーワード選びのポイント」でご紹介します。

チラさんというアフィリエイターが2022年 11月28日にTwitterにて発言したことで生まれた言葉だと言われています。

山奥SEOのメリットは？

山奥SEOのメリットについて、考案者のチラさんは以下のように発信しています。

・ニッチで情報が存在していなかったクエリーで記事を書くため読者に超絶感謝される

・SNS シェアによる拡散が生じることで自然なアクセスや被リンクを獲得する

・自演スパムなどでは得られない強固なドメインが自動的に形成される

・一次情報が多くなるので尖らせた特化サイトであればEEAT対策になる

また、上記以外では、検索ボリュームの小さなロングテールキーワードは、ニーズが狭まっており、基本情報の収集は済んだユーザーが検索していることが多いため、CVRは高くなりやすいという点もメリットと言えるでしょう。

また、制作時のことを考えると、ニーズが狭く限定的なので、コンテンツの軸が取りやすく制作しやすいというメリットもあります。

【✏️寄り道コラム】検索ボリューム0とアクセス数の話

山奥SEOの基本情報について解説してきました。この記事を読んでおり、SEOに取り組んでいる方は、アクセス数や収益化など集客を必要とする目的があるはずです。

「山奥SEOは、検索ボリュームの小さいキーワードを対策するということはわかったけど、アクセスを得たり、稼ぐことにつながるの？」

と疑問に思っている方も多いのではないでしょうか？

検索ボリューム0のキーワードを対策した事例として、面白いデータがあります。

和訳：「検索ボリュームゼロのキーワードを扱う方法：ボリュームの少ないSEO キーワードを見つけて活用するプロセス」

こちらは、検索ボリューム0のキーワードにはチャンスがあるという内容です。

記事の概要は以下の通りです。

・検索数0のキーワードを対策した

・6ヶ月後に12,000のアクセスを獲得した

・ほとんどがロングテールキーワード

・ロングテールキーワードはCVRが高い

・競合性も低く、上位表示も狙いやすい

・KWはサジェストツールを使って探す

検索ボリュームが0のキーワードでも、一定のアクセスが見込まれ、さらにロングテールキーワードになるため、CVRも高くなる傾向があるというもの。

また、検索ボリューム0のキーワードは、競合が対策していない可能性が高いため、CVRが高いのにも関わらず個人が戦えるキーワードが見つかりやすいのです。

私も経験としてとくに商標系のロングテールや3語以上のロングテールはツールの検索ボリュームが一致しないことがあります。

また、類似キーワードや掛け合わせキーワードによって、対象のキーワードとは異なるキーワードでのヒットも発生するため、ツールでの数値と実数値は異なってくることが多いです。

山奥SEOも、このツールの数値と実数値の差による穴場を利用しています。

実際にGoogleのキーワードプランナーやAhrefs、ラッコキーワードなど利用するツールによっても、表示される検索数は異なります。そのため、ツールの数値が0だからといって対策有無を精査してしまうのはもったいないのです。

山奥SEOは稼げない？

ツールでの検索ボリュームが0でも、アクセスは一定確保できることがわかりました。

では、肝心の収益化には寄与するのでしょうか？

山奥SEOは稼げないと、Twitter上での発言を目にします。考案者のチラさんも「稼げないからやめた方がいい」と言っています。

しかし、月数万円くらいなら山奥SEOと類似した手法で制作したサイトの事例があります。そのため、お小遣いくらいなら稼げるというのが私の見解です。

超ロングテール×少数記事のSEO 戦略

2023年 1月に私がツイートした内容で、検索ボリューム0〜20のロングテールキーワード＋3記事の少数記事で26,920円の収益が確定したというもの。

私は山奥SEOではなく、超ロングテール×少数記事と呼んでいましたが、同様の手法で検索ボリュームは0、10、20、3記事のみの超ミニミニのテストサイトを運営しています。

厳密には山奥SEOとは、異なりますが、検索ボリュームが少ないキーワードでもお小遣いレベルであれば収益が上がることがわかります。

以下も同様のサイトについてです。

上記のツイート時点で25,000円ほど収益があり、現在でも5,000円から 20,000円ほどの確定がある状態です。

ツールから算出できる想定アクセス数の30倍のPV数がある

直近の2024年 1月〜4月の収益とアクセスデータは以下の通りです。

・1月（収益：21,220円、アクセス：486PV）

・2月（収益：21,641円、アクセス：449PV）

・3月（収益：5,120円、アクセス：374PV）

・4月（収益：15,520円、アクセス：295PV）

1つ4,000〜5,000円程度の成果報酬の案件が1つ〜4つ程度売れている状態です。

合計の検索ボリュームは30なので、通常なら月に30回しか検索されておらず、検索順位1位のCTRの平均は約40%と言われているため、

30回×40％＝12回

月に12人ほどしか訪問されないのではと仮説を立てることでしょう。

参考：Google Click-Through Rates (CTRs) by Ranking Position in 2024

しかし、実際には295〜486PVと、想定値の25倍〜30倍のアクセスがあることがわかります。

2万円程度ですが、3記事で検索ボリュームが0〜20のキーワードで、と考えると山奥SEOはキーワード選定次第では稼げるといっても良いのではないでしょうか？

山奥SEO 戦略にも活用できる低検索ボリュームのキーワード選びのポイント

山奥SEOや検索ボリュームの小さいキーワードを対策するときに重要となるのがキーワード選びです。

しかし、ただ検索ボリュームがないor少ないキーワードを選べばいいというわけではありません。

個人的には3つほどルールがあると思っています。

1. 市場 自体は大きいキーワードを選ぶ

ルールの1つ目は、市場自体は大きいキーワードを選ぶことです。

市場が大きく、ニーズもあるジャンルは、軸となる単ワードのボリュームが大きく、テールワードのバリエーションや数も多いです。

そのため、ある程度ニーズのある市場の大きなジャンルから試してみるのが良いでしょう。

2. 3語以上のロングテール キーワードを選ぶ

次に単ワードや2語ではなく3語以上のロングテールキーワードを選ぶことです。

単ワードで検索ボリュームがないキーワードの場合は、ニーズがほぼないに等しいため造語のような領域になってしまいます。

さすがに検索されないことには始まらないので、3語以上のロングテールから探してみるのが良いでしょう。

3. 対策 キーワードの前に検索されたキーワードを意識する

そして、3つ目は検索のフロー（特に直前）のキーワードが存在していることです。

ある程度ボリュームのあるキーワードの、サジェストのサジェストのような、軸となるジャンルキーワードの2から3階層下のキーワードが狙い目だと考えています。

具体的には、LSI キーワードやPAAなどを参考にテールキーワードを探していくのが良いでしょう。

サジェストキーワードやLSI キーワード、PAAには、検索ユーザーが意図的に検索しないが、目についたら検索してみようという潜在的なキーワードが含まれているからです。

新しい言葉を作るのは難易度が高い

今回の「山奥SEO」というキーワードのような、誰も知らない、検索されることも、対応するコンテンツもないキーワードを対策し、将来的に当てるというのは難易度が高いです。

そのため、業界や現場に精通しており、リアルなユーザーニーズを獲得できる人以外は推奨できないでしょう。

ただし、トレンド性のあるキーワードをトレンドブログに近い形で将来的にボリュームが大きくなることを見据えて、低いうちに先行者として対策しておくというのは山奥SEOに通づるものを感じます。

山奥SEOの今後と考察

よく考えてみると、X（Twitter）で起きたこの一連の流れ自体が、山奥SEOなのかもしれません。

世の中にない造語がSNSを通じて拡散され、話題になり、そのキーワードで記事を書き始める。

記事を見た人が、検索をすると、キーワードの検索数が増える。

私達は今、世の中から新しい言葉が生まれて世の中に浸透していく、まさにその瞬間に立ち会っているのかもしれません。

言い換えると、検索ボリュームが0の造語に、検索数が生まれるその瞬間に立ち会ったということです。

規模感は違いますが、世の中のバズや流行語などもこのようなフローを辿って広がっていっているのだろうと実感しました。

それこそ、まさに山奥SEOだといえます。

Permalink | 記事への反応(0) | 22:33

2024-08-19

■AIに算数を解かせる

クエリ: 現在体重w_0ポンドの豚がいる。この豚は1日あたりa_wポンド体重が増加する。飼育には一日あたりa_Pセントかかるとする。市場で豚1ポンドあたりの価格は、現在Pセントで、1日Cセントずつ価格が下がっている。この豚はいつ売るべきか。

以下、AIの回答。

問題の設定

初期体重: w₀ ポンド
体重増加率: a_w ポンド/日
飼育コスト: a_P セント/日
初期価格: P セント/ポンド
価格減少率: C セント/日

利益 関数の定義

豚を t 日後に売るときの利益 Π(t) は次のように定義されます：

Π(t) = (w₀ + a_w × t) × (P - C × t) - a_P × t

利益 関数の展開

利益関数を展開すると：

Π(t) = w₀ × P + a_w × P × t - w₀ × C × t - a_w × C × t² - a_P × t

この式は二次関数の形をしています。

利益の最大化

二次関数の形 -a_w × C × t² + (a_w × P - w₀ × C - a_P) × t + w₀ × P から、頂点の t 座標で利益が最大化されます。

頂点の公式

二次関数 at² + bt + c の頂点の t 座標は -b / (2a) で与えられます。ここで、

a = -a_w × C
b = a_w × P - w₀ × C - a_P

したがって、最適な売却日 t は：

t = (a_w × P - w₀ × C - a_P) / (2 × a_w × C)

結論

この t の値が、利益を最大化するための売却日になります。ただし、t は現実的な日数（非負整数）でなければならないため、計算結果を四捨五入するか、周辺の整数値で利益を比較して最適な日を選択する必要があります。また、価格がゼロまたは負になる場合は、それ以前に売却する必要があります。

この方法で、数学的に最適な売却タイミングを見つけることができます。

Permalink | 記事への反応(0) | 10:49

2024-08-17

■コンピュータ・サイエンスとは何か

コンピュータ・サイエンスで取り組まれている問題の一覧を紹介しよう。

計算複雑性

P対NP 問題
BQPとNPの関係は？
NC = P問題
NP = co-NP 問題
P = BPP問題
P = PSPACE問題
L = NL 問題
多項式階層 = PSPACE問題
L = P問題
L = RL問題
ユニークゲーム予想
指数時間仮説は真か？強い指数時間仮説（SETH）は真か？
一方向関数は存在するか？公開鍵暗号は可能か？
対数ランク予想

特定のアルゴリズム 問題における多項式 時間と非決定性多項式 時間

整数因数分解は古典（非量子）コンピュータで多項式時間で行えるか？
離散対数は古典（非量子）コンピュータで多項式時間で計算できるか？
格子の最短ベクトルは古典または量子コンピュータで多項式時間で計算できるか？
グラフ同型問題は多項式時間で解けるか？
グラフの正規化はグラフ同型問題と多項式時間で等価か？
リーフパワーおよびk-リーフパワーは多項式時間で認識できるか？
パリティゲームは多項式時間で解けるか？
二分木間の回転距離は多項式時間で計算できるか？
有界クリーク幅のグラフは多項式時間で認識できるか？
凸多面体上の単純閉準測地線を多項式時間で見つけることができるか？
与えられた2つのグラフに対して固定された辺を持つ同時埋め込みを多項式時間で見つけることができるか？
平方根和問題はチューリングマシンモデルで多項式時間で解けるか？

その他のアルゴリズム 問題

スプレーツリーの動的最適性予想：スプレーツリーは有界な競争比を持つか？
深さ優先探索木はNCで構築できるか？
高速フーリエ変換はo(n log n)時間で計算できるか？
2つのn桁の数の乗算の最速のアルゴリズムは何か？
決定論的で固定されたギャップシーケンスを持つシェルソートの平均ケース時間計算量の下限は何か？
3SUMは強い二次未満の時間、つまりO(n^{2−ϵ})時間で解けるか？
2つの文字列間の編集距離は強い二次未満の時間で計算できるか？（これは強い指数時間仮説が偽である場合にのみ可能）
X + Yソートはo(n^2 log n)時間で行えるか？
行列乗算の最速のアルゴリズムは何か？
全対間最短経路は強い三次未満の時間、つまりO(V^{3−ϵ})時間で計算できるか？
多項式同一性テストのためのシュワルツ・ジッペル補題は非乱択化できるか？
線形計画法は強い多項式時間アルゴリズムを持つか？（これはスマイルの問題リストの問題#9）
嫉妬のないケーキカットに必要なクエリ数は何か？
最小全域木問題のアルゴリズム的複雑性は何か？同様に、MST 問題の決定木複雑性は何か？MSTを計算するための最適なアルゴリズムは知られているが、決定木に依存しているため、その複雑性は不明。
ギルバート・ポラック予想：ユークリッド平面のシュタイナー比は2/√3か？

プログラミング言語 理論

POPLmark
バレンドレヒト・ギューヴァース・クロップ予想

その他の問題

アンデラ・カープ・ローゼンバーグ予想は真か？
チェルニー予想：n状態の決定性有限オートマトンが同期語を持つ場合、その長さは最大で(n-1)^2か？
一般化されたスター高さ問題：すべての正則言語は、限定されたネスト深さのクリーン星を持つ一般化された正則表現を使用して表現できるか？
単語の分離問題：2つの与えられた長さnの文字列に対して異なる動作をする決定性有限オートマトンに必要な状態数は何か？
すべてのユニークな基本セルオートマトンのチューリング完全性の状態は何か？

Permalink | 記事への反応(0) | 15:26

2024-08-14

■FANZAの検索結果から 熟女を除外するブックマークレット

興味のない作品が検索結果に混じるのは邪魔ですよね。

私は熟女モノとか人妻モノは眼中にないのですが、なぜだか最近そっち系の作品が多くて閉口しています。

しかしFANZA側の検索システムはNOT検索できるようになっていません。そこで、検索結果から除外できそうなものを除外するブックマークレットを作ることにしました。

さいわい近年は内容の概要文をそのままタイトルにしたような作品ばかりなので、タイトルに含まれるキーワードで除外が簡単にできそうです。

「熟女」とか「五十路」のような単語を含む作品を非表示にしてしまえばよいのです。

ブックマークレット

javascript: (() => {
    const r = /熟女|完熟|熟れ|四十路|五十路|六十路|人妻|奥様|妻|夫|母|ママ|おばさん|BBA|姑|嫁/;
    const q = '#list>li';
    document.querySelectorAll(q).forEach(l => {
        if (r.test(l.textContent)) {
            l.remove();
        }
    });
})();

ミニファイしたもの

javascript:(()=>{const r=/熟女|完熟|熟れ|四十路|五十路|六十路|人妻|奥様|妻|夫|母|ママ|おばさん|BBA|姑|嫁/;const q='#list>li';document.querySelectorAll(q).forEach(l=>{if(r.test(l.textContent)){l.remove()}})})()

このブックマークレットで、検索結果に含まれる熟女系作品の数を1/3くらいにまで減らすことができます。

使い方

ブックマークレットとは、ブックマークにURLではなくJavaScriptを登録して、閲覧中のページ上で自分（やほかの誰か）が作ったプログラムを実行できるしくみのことです。普通のブックマークと同じようにブックマークバーなどに並べておいて、クリックひとつで呼び出すことができて便利です。

登録のしかたは簡単。PC用Chromeを例に説明します。

①まず、どこのページでもいいので（今読んでいるこのページでもよい）ブックマークをひとつ作り、ブックマークバーなどの呼び出しやすいところに置きます。

②できたブックマークを右クリックして「編集...」を選びます。

③「名前」欄は、自分にわかりやすい名前に変更します。でも「FANZA フィルター」などあけすけな名前をつけると、誰かに画面を覗かれた時に困りますよ。

④「URL」欄に、上記したプログラムコードを入力します。ただし上記のコードは私向けのキーワード選定になっていますので、ご自身の好みに合わせたキーワード選定をしていただければよいかと思います。/単語1|単語2|単語3/ のように記述してください。

ふつうのソースコードと、改行・インデントなどを省いてミニファイ（最小化）したもの、どちらをコピペしても大丈夫です。

⑤編集の済んだブックマークレットを保存します。

⑥FANZAで動画を検索します。

⑦このブックマークレットを起動します。すると、瞬時に検索結果が減ります。

キーワードだけが異なる複数のブックマークレットを登録しておいて、場面に応じて使い分けるなどの工夫もできるでしょう。

コード 解説

上記のスクリプトが何か悪さをするようなものではないことを説明するために、また、JavaScript を学習し始めたばかりの人のために、このシンプルなスクリプトの解説をします。

javascript:

URLの種類を示すスキーム名です。一般的なURLは https: や mailto: などで始まりますが、javascript: と書くと、これに続くコードがプログラムとして実行されます。

(() => {
    // 処理
})();

ここからが JavaScript です。まず処理全体をくるむ大きなカッコと最後に付け足された () は、自己実行無名関数という形式です。今回のブックマークレットは変数を含みますので、実行するページに元々ある変数たちとバッティングしないようこのようなかたちにします。

const r = /熟女|完熟|熟れ|四十路|五十路|六十路|人妻|奥様|妻|夫|母|ママ|おばさん|BBA|姑|嫁/;

除外したい単語を羅列した正規表現です。個人個人で設定が変わる部分なので、編集しやすいように切り出しておきました。

const q = '#list>li';

フィルター対象とするHTML要素群のクエリーセレクター文字列です。検索結果に一覧表示される、個々の作品要素を選択します。FANZAがシステム改修を行うと変わってしまう可能性がある部分なので、メンテしやすいようにここだけ切り出しておきました。

document.querySelectorAll(q).forEach(l => {
    // 処理
});

クエリーセレクター q に一致する要素 l ひとつひとつについて反復して処理を行います。

if (r.test(l.textContent)) {
    l.remove();
}

もし要素 l 内のテキストが正規表現 r と一致していたら、要素 l を取り除く、という処理です。正規表現 r はキーワードの羅列ですので、テキストの一部にキーワードのどれかが含まれていたら一致したことになります。

魂の叫び

追記

NOT検索できるよ。俺はこの検索結果をブックマークしている「サンプル -近親相姦 -MM号 -義母 -義父」

ほ、ほんまや……！！！

Permalink | 記事への反応(10) | 11:51

2024-08-05

■Googleは何考えているか分からない

たとえば「1118.9/759.4=」とGoogle検索する

実際にはブラウザの検索窓を電卓代わりに使っただけだ

しかしGoogle検索は律儀に計算結果だけでなく検索結果も返してくれる

8件ヒットしたんだが最後の1件を除きすべてがロンジンマスターコレクションとかいう腕時計がらみだ

「必須にする: 1118.9/759.4=」と書かれたリンクを押すと最後の1件だけになり、腕時計たちは消え去るんだが

逆にこの7件たちは「含まれない: ~~1118.9/759.4=~~」という状態でなぜ一意にこの腕時計モデルだけが上がってくるのか

その答えは759.4にあった

これがその時計の型番に含まれているのだ

検索ワードの中からコンテキストを無視して一部分を抜き出した場合にヒットするものを見せてくるのが

Googleの「あんたのクエリは信用でけへんから本当はこういうことなんやろ」精神なのである

我々はここに限界を感じるべきなのである

我が求めているのは「おっ？何計算してはるんすか？んー……これはライカンスキルLvMAX時の特殊スキル、基礎ブレイク倍率とチャージ時の倍率の伸びしろを見てるんとちゃいます？あたり？ビンゴ？いやー楽しいっすねゼンゼロ、どうすかこの解説動画なんかよく見られてるみたいですぜ旦那ァ」

とか名推理をかましていらん世話をやいてくれるおっそろしい検索エンジンなのである

Permalink | 記事への反応(0) | 02:09

2024-07-23

■SQL難しくない？

なんでgroup byで指定したカラムしかデータ取得できないんだよ

そんなデータなんに使うん？

普通条件に一致したレコードの全データ欲しくなるやろ？

何でかんな使えないクエリばっか作ったん？

使い方難しくして、使える奴らを限定して、誰でも使えるものではないって希少性高めたいんか？

Permalink | 記事への反応(3) | 11:54

2024-07-14

■まだWEB 広告で消耗してるの？

この言い方も古くなったな。イケハヤ元気だろうか？（興味ない）

さて、先日のオオタニサンの記事で、トップコメが

うーんどうしたら音声付き動画を勝手に再生するのを止められるのかなあ
https://b.hatena.ne.jp/entry/4756131185384734112/comment/nakag0711

であり、そんな消耗から遠い地に移住を果たした私は全ブクマカに声を大にしてアドブロックをオススメするのであります。

具体的には、昨年末ホッテントリ入りした、下記ブログの対策をすること。

自宅サーバにAdGuard HomeとTailsclaeを導入してあらゆる環境で広告ブロックする
https://text.yusukesakai.com/entry/20231112/1699716129

これで、勝手に再生する動画に煩わされることはなくなるし、大量に張られているWEB 広告を知覚しながら意識から追いやるという認知不可からもおさらば。

この、知覚しながら認識しないようにするというのが、自然とできているようで、実査にWEB 広告を消してみるとこんなにスッキリした画面だったんだと感動すらある。

まー、でも自宅鯖にDNS建てるとか面倒だって人は、とりあえずAdGuardが公開しているDNSを設定してみると、その効果を感じられると思う。

言ってみれば、移住先にお試しで１週間ぐらい泊まってみるってやつだ。先のページのこのコメントで言及されてるやつね。

前は同じことをやっていたが面倒くさくなって端末に直接AdGuardのDoHを指定するようになった
https://b.hatena.ne.jp/entry/4746515581533875055/comment/Rambutan

じゃ、それでいいじゃんって話しだけど、自分でAdGuard Homeを導入すると、以下のようなメリットがある。

日本固有アドネットワーク用のフィルタを導入できる
アドブロックのON/OFFが簡単に行える
お手元に余っているラズパイの有効利用
自宅鯖でアドブロックしているのが格好良いという優越感を手に入れられる

やってみようと思ったそこのあなた！今日明日は休みで天気が悪いかなら、ちょうど良いタイミングだぞ。

ほとんど最初のブログに書いてある通り何だけど、私が最初分からなかった、Tailscaleの導入理由について補足する。

Tailscaleってのは、今あるネットワークに加えて、VPNで新しいネットワークを作るアプリだ。（個人の理解です）

凄いのが、ご家庭のルーター内部にいるサーバと、4G/5G回線のスマホが、ルーターの設定なしにつながるところ。さらに、そのスマホを家のネットワークに繋いでも、TailscaleのVPNはつながったまま。もはや、どういうテクノロジーで実現しているのか良く分からない。

で、なんでTailscaleが必要かって言うと、Tailscaleの機能で、つながった機器のDNSをTailscaleで設定したDNSにしちゃうよってのが出来るから。

元のブログの「ウェブブラウザからTailscaleの管理画面にログイン後、DNS設定ページに移動します。」ってあたりからがそう。

このやり方の賢いところは、Tailscaleの接続を切れば、いままでのDNSを参照してアドブロックが解除されるところ。最初に上げたメリットで、アドブロックのON/OFFが「Tailscaleアプリ起動＞VPNに接続/切断をクリック」で実現できる。

後はやるだけ！

一応、デメリットも書いておく。

例に上げたオオタニサンの記事のように、WEB 広告満載のページを開くのに時間がかかるようになります。

これは、大量のDNS クエリをフィルタにぶつけているからで仕方がないかなと。

NOTEや、Qiitaのように、独自でマネタイズ頑張ってるところは、ほぼ影響なしです。

なかなか表示されないページは、「あー、広告たくさんなんだろーなー」と思いつつ、先にブクマのコメントを読んでればいいので、実質的にはデメリットとは言えないかも。

あとは、AdGuard HomeとTailscaleを信用するかどうかですね。

私がもう我慢ならないとアドブロックを行ったのは、出てくるWEB 広告が軒並み「アソコドーピング」になったから。

いや、pronhubで出てくるならいいけどさ、ゲームやアニメの情報見ようとしてもアソコアソコアソコ。

しかも、最近のアダルト広告、画像を生成AIで作ってるのか、なんか微妙な気持ち悪さがありません？見ていられなくてWEB 広告を根こそぎ排除する方向にしました。ページの内容に沿った広告ならいいのに、現状は広告主が広告内容に責任を持たない状況なので、自衛するしか無いという結論。

長くなりました。結論としては、みんなAdGuardHome ランドに移住しておいでよ！

Permalink | 記事への反応(2) | 14:16

2024-07-04

■anond:20240704133236

知らんけど素直に考えると単元ごとに売買のクエリを投げてるんじゃないの？

10単元買い注文出したら10回投げる。レイテンシがあるので10回の間に別のクエリが挟まることもある。

Permalink | 記事への反応(0) | 13:40

■anond:20240704001726

実行したSQLの全部がログされてることもある
（SQLで認証処理してたらここでも残る）

クエリ飛ばす前に暗号化しろよｗｗｗｗ

さすがにそれはないｗ

DB上で暗号化する意味がわからんｗ

Permalink | 記事への反応(0) | 01:03

2024-06-25

■anond:20240625003111

俺の用途としては以下がポイントになってる

日本語でクエリを入力して、マルチリンガルで結果を返す
概念検索。「丸い食べ物」とクエリを投げれば、りんごなどが出てくる（キーワードマッチでは実装できない)
ユーザーベクトルの定義。閲覧アイテムの平均ベクトルで検索して推薦すると性能が良い

こういう検索を要するアプリを作っているので、ANNが必要

Permalink | 記事への反応(0) | 00:38

■anond:20240607100125

あのさぁ、君ANNを実装したライブラリとか使ったことないでしょ、faissとかElasticsearchとか

君は「KNN」と勘違いしてるみたいだけど、sklearn起動してmodel.fit(X, y)みたいなことをするんじゃないんだよ、ANNは

index.add(vectors)とかやってインデクシングした上で、index.search(vq, k)みたいにベクトルで検索するのがANNね

だから「確率」じゃなくて「距離」なんだよ、出力数値はね

レコメンデーションエンジンなら、コンテンツをベクトルに変換して、インデクシングして、クエリベクトルでサーチするって話

コンテンツをベクトル化する方法は様々あるので、NLP固有の話ではないし、単純な行列分解もベクトル化には使える

君ね、ANNとKNNって大抵別文脈で使われる用語だから今のままだと笑われるよ？

Permalink | 記事への反応(1) | 00:19

2024-06-22

■anond:20240622210837

内部的には「東京03 - 千代田区100 - 発行番号1234」みたいな戸籍謄本のクエリに使われる戸籍単体のシリアル番号があるはずだよな　表には絶対出ないだろうけど

Permalink | 記事への反応(0) | 21:16

2024-06-19

■2024 年の検索エンジンとしてのソーシャル メディア

今では誰もが何かを検索するためにソーシャルメディアを利用しています。レストラン、コース、洋服店など、文字通り、あなたが欲しいものはすべてソーシャルメディアだけでなくGoogleでも入手できます。人々はソーシャルメディアを娯楽のためだけでなく、何かを知ったり、世界で起こっていることに関する情報を入手したりするために利用しています。たとえば、最新のニュースはまずTwitter (X)でトレンドになり、次に他のソーシャルメディアプラットフォームでトレンドになります。私自身、何かを検索したり購入したりするためにソーシャルメディアを使用することがあります。ソーシャルメディアに関する私の個人的な経験はかなり良いものです。

しかし、まず検索エンジンとは何かを理解する必要があります。

検索エンジンは、インターネット上で何かを検索したい場所のようなもので、探しているものを見つけるにはキーワードを入力するだけです。ソーシャルメディアが登場する前は、Googleが世界をリードする検索エンジンでした。「ソーシャルメディア」が検索エンジンだと言っているのではありませんが、正直に言うと、私たち人間はソーシャルメディアを検索エンジンにしてきました。頭に浮かんだものはすべてGoogleで検索していました。実際、ソーシャルメディアが登場する前の時代には、何かを検索することを「グーグルで検索」と呼んでいましたが、現在ではソーシャルメディアは検索エンジンとも呼ばれています。検索すると、グラフィックとともに多くの回答が得られるからです。