「クエリ」を含む日記 RSS

はてなキーワード: クエリとは

2023-09-26

検索エンジンの仕組み

技術的な内容を増田に書くという実験のために、試しに検索エンジンの仕組みについて書く。

検索エンジンは、大雑把に言ってクロールするパート、インデクシングするパート検索インターフェイスを出力するパートに分かれる。

インデクシング時に使っている基本手法は「転置インデックス」と呼ばれ、文書内のngramを文書ID対応付ける辞書を保存する。

インデクシングの別の種類としては、文書エンコーダからベクトルへ変換し、それを近似最近検索できるようにするものもある。

インデクシングされたものキーワードマッチ的に絞り込まれると、さらに精密な手法が使われる。

クエリドキュメントから特徴量設計し、関連性の高いものを引っ張るような訓練をする方法はLearning to rankという。

Learning to rankの中に使われる特徴量の一つにPage Rankがあるが、これは初期の検索エンジン画期的とされた量で、「リンクされるページの価値は高い」「高価値ページにリンクされると価値が高い」という基準からマルコフ連鎖計算する。

Page Rankは人間論文評価するときと似たような評価手順であるとされる。

Learning to rankの中にエンコーダからベクトルを特徴量として組み込むことも可能であり、そのようなエンコーダの初期の例がBERTである

こうやって絞り込まれ文書に対して、さら有用情報を表示するモデルがいくつか使われる。

情報抽出モデルでは、クエリ質問と見做してその回答を文書から抽出することがある。

あるいはクエリ人物名や組織名場所名などであれば、そのエンティティの詳細情報データベースから取得することもでき、これはナレッジグラフとも呼ぶ。

2023-09-21

これらはすべてサボりとみなされる

1.Excel関数を使って計算自動化する

2.Accessを使って必要情報自動抽出する

3.タスクスケジューラ機能を使って特定作業自動化、定期化する

4.リモート接続機能を使って特定場所に出社せずともPC操作可能にする

5.これらで空いた時間のんびり過ごす

これらはいずれも知っているかいないか、つまりスキル問題に過ぎないのだが、こういったことをするとわが社ではサボり、手抜きとみなされるようだ。

かに、あまり複雑な関数クエリを作ってしまうと、万が一破損等した場合に手直しが難しくなるというデメリットはあるので、よいことばかりではないところはあるが。

せっかく身につけたスキルなのだが、なんだかやるせない。

これから先私が身につけるべきスキルは、実際にはサボりながらもそうは思わせない、演技力スキルだろうか。

2023-09-19

anond:20230919144849

事務屋がエンジニアを名乗ることは無いだろう。それって意味無いし。SQLクエリを出すくらいだったらAccess使いと大して違わん。

anond:20230919132154

俺の知り合いにもSQL覚えてクエリ書いてるって事務屋がいる。そこの会社ではそういうのが重宝されているそうだが、どこまで一般的なのかはわからん

まあ、その程度ならむしろ会社システム屋さんには助かるんだろうなとは思う。

anond:20230919050058

事務屋でもRDBを触るところも極少数だがないこたない

インフラ領域は触らんけど、まぁRe:dash経由でクエリ書いたり

2023-08-15

anond:20230815214743

それは状況による。あくまでも正しいクエリがなんであるかわかったケースをお前は言っている。

今置かれている状況を正しく認識した上で正しいクエリというものがわかる。

お前が「ググれば3秒でわかる」と言ったところで、周囲の人は「何を?」という感想しかならないのがそれを証明している。

2023-08-09

anond:20230809121101

ORM始めようとするとOUTER JOINやらやらCASEやら複雑なサブクエリを含むようなSQLわからんくてンンンンンってなる

2023-07-19

anond:20230719121405

AIロボット裁判官が公平にジャッジしてくれる

シン・特許庁デジタルリポジトリ登録される世界のすべての絵をスキャンし、顔、構図、タッチなどのすべての要素でオリジナルとのL1/L2距離を求め、距離閾値を超えていればたとえそれがマネマネ絵でなくてもマネマネだとジャッジされる

それを恐れた作者たちは作品の公開前にシン・特許庁APIクエリ照会をするという手順を踏むことになる

2023-07-06

ある程度データが溜まったら違うDBに移行することを前提としたDB

やばすぎクエリに「それ次のでかいDBでやったら死ぬからな」と警告する

2023-06-17

anond:20230617200328

SEやっててパワークエリVBA使うくらいだったらコード書いちゃうんでそれらを触ったことない。

からこういう話見る度に違う業界行ったら面接通らないんだろうな……今の業界にしがみつかなきゃな……と戦々恐々としてる

おっさん(48)「Excelできます!」面接官俺「パワークエリVBAは?」おっさん「できません…」俺「それ、Excelできるって言わないよねw?」

この前、職場事務職(月21万円)の面接無職おっさん(48)が来たんだが

パソコンスキル質問

そのおっさんが「パソコン得意です。Excelできます」ってドヤ顔で言ったんだよね

そこで俺は「パワークエリVBAできる?」って聞いたら

おっさんが「できません…」って言い出して呆れた😅

ExcelなんてそれこそパワークエリVBaできてなんぼなのに

じゃあ何ができるんですか?って聞いたら関数とか…って言い出してドン引きしたわ

そんなん教えたら誰でもできるもんやん

パソコンテスト一応やらしたけど、関数にvlookup使ってたしこれはないなあって思って落としたわ

無職からって暇つぶしに冷やかしに来るのやめてくれよ。。。

2023-06-07

anond:20230607140318

組織運営の話されてもな

トラフィックについてもだいたいインフラクエリ設計が主でRailsでやることは多くないでしょ

キャッシュミドルウェア入れるのと、フロントエンドの処理は圧縮して分割しましょみたいなもんじゃないの?

2023-06-04

これはaiテストする場所ですか。私の日記を見た人はあまりいないのではないでしょうか。今年からchatgpt、claudeなどのai製品を使い始め、彼らはまだスマート司書のような気がします。中国でもいくつかのaiを作ったが、私はまだあまり使ったことがない。スマート司書に似ているかもしれませんね。ほとんどは、データベース内で関連する構造コンテンツを迅速に提供するために構築されたクエリリプライです。 日本ai世界サプライズを与えるかどうかは分からない。ただai未来を持っており、近いうちにai設計者たちもみな未来を作るのに夢中になる日がくる

Anond AI作成

2023-05-01

anond:20230501010844

クエリつきの動的RSS生成みたいなRSSフィードの根本理念に反するようなことするからやで

末期だからしたとも、したから末期だったとも、どっちともとれるけどな

2023-04-07

anond:20230406215529

とくにログインもせずにIPローテートしてクエリ送りまくるだけで大量のマイナス評価をつけられるってこと?

2023-03-08

電音部ーハラジュクエリアミティングーにいってきた

ので、感想を書き残す。

 

昼の部

ネイルハウスくん、DJ下手なんやね。ぶつ切り繋ぎアンセム連発、DJ半年の子かと思った。

いい曲かくし、remix上手いのにまさかmixが下手やとは意外だった。

 

モエショップ、好き。曲が好きなのが大きいけどBPM低めでノリやすいし、計算されたセトリに丁寧なmix、わかりやす煽り安心感があった。

 

ぴっこさん、やるやん。正直あんまり曲知らんというか、前にちょっと聞いてみた時は未来茶系サウンドの焼き直し感があって、またkawaii系のフォロワーか、もうおなか一杯やわと思ってたけど、生で通しで聞いてみたらええやんと思ったね。

あれだけ可愛いで埋め尽くすセトリエリアテーマにぴったり合ってて仕事できるなと思った。

まあでも一番キてたのはkawaiiからハカハカの潰れたサウンドへの流れ。この日を通して一番トべるポイントだった。 

 

夜の部

ネコハカ、煽るのが上手い、安定感しかない。でも曲が全く刺さらんのよね、ごめんなさい。どうしてもギター邪魔に聞こえる。

これは俺の好みの問題しかないのでネコハカのお二人には何の非もないです。パフォーマンス力は文句なしトップ

 

norくん。客のレスイマイチなことにキレて、音止めてやり直したところで、おいおいやってんねえ!となった。数十人規模の小さい箱ならよくやるけど、企業主催公式ホールイベントであれやる度胸ない。さすがだわ。バカ広い会場でいつも通りのクラブDJやってくれる安心感よな。

ただ声がちょっと聞き取りづらかったのが残念。

 

Yunomi大先生コンテンポラリーアートっすか?

うごちゃんミニマルミュージックremixからの枕もとにゴースト

たぶん何か意味があるんだろうけどそれを読み解けるほどうごちゃんのこと知らないんよね。

何年前だったか京都南座に🍵見に行ったら、デカマスクデカグラサン青髪女性が歌ってて、そのときはへー、この人人気の配信なんや、くらいにしか思わなかったけど、そのあと何年かして自ら命を絶ったってニュースを目にして、少し悲しくなった。そんなことを、思い出したわ。

そんなスタートだったからか、全体的に重く、悲しい雰囲気があったね。明るくキラキラした曲も素直に楽しめないというか。まあ夜の部のコンセプト的に間違ってはいないと思うけど。

それにしてもYunomi大先生はどこに向かってるんやろね。俺はまだフォローしてくつもりだが、ここ数年の転向以降ついてけないオタクも多いんじゃないか

DJ感想はこんなところかな。

 

その他、ステージングやらについて

電音部史上最高やないか?昼の部の小道具大道具モリモリで視覚的にハラジュクをわからせにくるのよかったし、夜の部は夜の部で変化がわかりやすかった。照明、音響文句なし

ライブパート字幕が出てくるの、ありがたかったな。新曲でも言葉がスッと入ってきて、ミュージカルみたいに楽しめた。

そう、ミュージカルみたいに楽しめたのが大きい。

原作?の物語舞台上で表現するっていう一本の筋が通ったことで、全体が一つにまとまってて、いい感じやった。

いままでの電音部のイベントって正直な話、いろんな界隈のオタクを集めてわーわー騒いでるだけっていう、なんかよくわからんもんやったけど、今回のは違ったね。

ようやくバンナムが電音部をやる意味が出てきたんやないかと思ったわ。

アニソンフェスみたいなもんは文脈を共有してるから成立してるわけで、アニメ化ゲーム化してない小説だけの電音部は文脈が薄すぎてなんかようわからんかった。

もちろんオタクが集まってわーわー騒ぐのも楽しいけど、そんなもんはバンナムがやるまでもなく、いろんなオーガナイザーが低コストでやってくれてるし、バンナム謹製のお高いチケットには見合わんのよな。

なんにせよ光明が見えてきた感あるし今後が楽しみやわ。

2023-03-02

anond:20230302150009

paizaとドットインストール試してみる

テーブル設計とかテーブル2枚とか3枚のクエリとかも試せるのかな

JOINとかGROUP BYとかがムズい......

anond:20230302145313

環境構築はできてる

SELECT * FROM table;

みたいなのも分かる

けど

そっから先のTwitterみたいなの作ろうとした時どういうテーブル作ってどういうクエリSELECTすれば良いのか分からん

SQLってどうやって勉強すればいいの

プログラミングJSで動くの作れたけどSQL分からん

追記

chatgptで

sqlite3でtwitterみたいなサイトテーブル設計をして。

上記Twitterのようなサイト特定ユーザータイムラインを表示するクエリの例を教えて」

って聞くと、こういうの表示されるけど、こんなの絶対パッと思いつかんやろ!!

特にJOIN2回使うのが全然分からん。なんならJOIN1回の部分も分からん

っていうか、hatena君、sqlシンタックスハイライトするとインターナルサーバーエラー返してくるんだが...

>|エスキューエル|

パイプパイプ<

class Foo
  def bar'baz' # return baz
  end
end

sqlだけっぽい......

CREATE TABLE users (
  id INTEGER PRIMARY KEY AUTOINCREMENT,
  username TEXT NOT NULL,
  email TEXT NOT NULL UNIQUE,
  password TEXT NOT NULL,
  created_at DATETIME DEFAULT CURRENT_TIMESTAMP
);

CREATE TABLE tweets (
  id INTEGER PRIMARY KEY AUTOINCREMENT,
  user_id INTEGER NOT NULL,
  body TEXT NOT NULL,
  created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
  FOREIGN KEY (user_id) REFERENCES users (id)
);

CREATE TABLE follows (
  follower_id INTEGER NOT NULL,
  followed_id INTEGER NOT NULL,
  created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (follower_id, followed_id),
  FOREIGN KEY (follower_id) REFERENCES users (id),
  FOREIGN KEY (followed_id) REFERENCES users (id)
);


SELECT tweets.id, tweets.body, tweets.created_at, users.username
FROM tweets
JOIN follows ON tweets.user_id = follows.followed_id
JOIN users ON tweets.user_id = users.id
WHERE follows.follower_id = [特定ユーザーID]
ORDER BY tweets.created_at DESC;

2023-02-27

もしも掲載雑誌が既知じゃない状態かぐや様と五等分の花嫁さらっと提示されて、さてどっちが青年漫画でどっちが少年漫画か当ててみよと言われたら多分俺は答えられないだろう。

青年漫画かどうかの判断基準少年漫画と比べたときの内容の大人っぽさに据えてみたとしても、どっちの方が大人っぽいか良く分からん。答えを知ってる立場で見るなら確かにかぐや様には時事ネタ政治経済的な文脈での人間の汚さを描いてるところがあるという点で、少年漫画と比べて大人っぽいのかなあと言えなくもないが、どうも後付けな感じがする。五等分の方がフィクトセクシャルに向けて性をより押し出そうという点ではそっちの方が大人向けなのではないかという感じもする。

なんでこんなことを考えているかというと、新しく面白い漫画を発掘しようと思ったところなのだが、経験上俺が面白いと感じるツボを押さえた内容を持った漫画が出されてるジャンルというのは少年漫画青年漫画の双方にかなりの重なりをもってまたがっているからだ。そして少年漫画青年漫画の内容上の区別が思いのほか難しいときてる。

ならこれらをいっしょくたにして探したいと欲するところなのだが、電子書店で受け付けるクエリというのはグーグルツイッターほど融通が利くものではなく、or検索すらできない。

男性向け」というタグを用いてる書店もあるが、このタグには18禁でない程度の白塗りお色気漫画が多数含まれている。

その気が無いときにお色気漫画ばっか出てきて検索ノイズしかなく著しく発掘効率が落ちるというわけだ。

ああ、別に学園漫画ラブコメに限って面白いと感じるわけではないのであしからず

社畜ちゃん少年漫画なのに社畜となんとかの1000何日だっけ?は青年漫画とかってのもみるとほんと内容的から論理的にそう区別された根拠説明できるものじゃなくて便宜上区別しかないなあ。

2023-02-25

ChatGPTにJavaScriptブックマークレットを作ってもらってるんだが

このChatGPTのJavaScript説明がどうしても分からない。解説あってる?

var idx は、現在開いているWebページURL文字列に ? が含まれている場合に、その位置を取得するために使用されます。これは、クエリ文字列の開始位置特定するために必要な処理です。

たとえば、以下のようなURL現在開いているWebページURLであった場合

https://example.com/search?q=keyword&page=1

var idx = url.indexOf('?'); というコードを実行することで、変数 idx には 8 という値が代入されます。これは、? の位置URL文字列の8文字目にあることを示しています

var idx はURL文字列の何番目に?があるかって意味だとは分かった。でも例文のURLだと?の位置はhから数えて27番目だよね。聞いてみた

おっしゃる通り、指定されたURL https://example.com/search?q=keyword&page=1 において ? の位置は h から数えて 27 番目の文字です。

しかし、ブックマークレットコード中では idx の初期値として url.indexOf('?') を設定しています。この indexOf() メソッドは、指定された文字列最初に現れる位置を返します。もし文字列が見つからなかった場合は -1 を返します。

したがって、ブックマークレットコード中で url.indexOf('?') を実行すると、? の位置が返されます指定されたURLにおいて ? は https:// の直後に出現するため、url.indexOf('?') の実行結果は 8 になります

まりブックマークレットコード中では ? の位置ではなく、? の次の文字(q)の位置が idx として設定されていることになります

なんか意味がわからない。その後もどっから数えた数字がidxになるのかいくつか聞いてみたが堂々巡りになってしまって明確な答えが分からない

2023-02-10

昇進審査面接失敗した!

昇進したらどうしたい?

みたいなこと聞かれてさ、

「紙の伝票とか台帳とか、報告書とか、そういうのやめたい。」

って答えたらさ、

「具体的にどうしたらいいと思うか?」

とか聞いてくるわけ。

技術的な話しようかと思ったんだけど、その、ジジイさ、パソコン音痴なわけ。

会議開きたいから添付のExcelにマルバツつけてメール返信してくれ」

って感じの、日付とその隣にマルバツをつけるセルが用意されたファイルを送ってくるような人なわけ。

他にも、社内数百人に自由記載アンケートとかもそういう送り方してくる人でさ。

返信されてくるメールに添付されたExcelファイルを全部別の名前をつけて保存して、一つ開いてはコピペ、一つの開いてはコピペしてる人なの。

まあ、仕方ないから思うことを話したさ。

から検索できないデータなんて不良債権から、わざわざ印刷してから保存はやめろ。

印刷してハンコしてからpdfとかもっと無駄だ。

世の中にはデータベースっていうものがあってだな、そこに行く前に絶対必要になるからデータデータの繋がりもリレーションで書き出せ。

データは単純集計された整然データの形で保存しろ

っとひとしきり。

それで、返ってくる言葉

抽象的でわからない。もっと具体的に、ファイル名で分類するとか、どうやって台帳で管理するとか、なんかあるだろ?」

とか言ってくるわけ。

いや、技術的な話を聞いたのはお前だろと。

もっと会社システムみたいな壮大な話じゃなく、自部署をどう解決したいかを教えてくれるか?」

みたいな返しをしてくるから

「小さな組織ならパワークエリアクセスで足ります。」

って答えても、よく理解してくれないわけ。

終始すれ違い。

あー、失敗した。

2023-01-31

TogetterカノニカルURLを正しく設定しろ

はてブではたまにこういうことが起こる。👇

 

全国のパン好きのみなさん、一生かけて回るので推しパン屋さんを教えてください→地域別で分けてみた

https://b.hatena.ne.jp/entry/s/togetter.com/li/2064362

全国のパン好きのみなさん、一生かけて回るので推しパン屋さんを教えてください→地域別で分けてみた

https://b.hatena.ne.jp/entry/s/togetter.com/li/2064362?page=2

全国のパン好きのみなさん、一生かけて回るので推しパン屋さんを教えてください→地域別で分けてみた

https://b.hatena.ne.jp/entry/s/togetter.com/li/2064362?page=3

 

同じまとめのブックマークがいくつも作られてしまっている。

それぞれ何が違うかというと、分割されているページの位置だ。

ページごとにURLが異なるので(?page=nの部分)、はてブから個別コンテンツ認識されてしまっているのだ。

 

Togetter以外にも記事をページ分割するサイトはいくらでもあるが、このようなことが起こることは少ない。

はてブシステムは、ページ分割されているどのページをブックマークしても親ページ(先頭ページ)がブックマークされるように作られているからだ。

ただし、それにはブックマークされる側のページで「カノニカルURL」が正しく設定されている必要がある。

 

カノニカルURLとは、「この記事っていろんなURLバリエーションがあるけど、SNSとかで拡散する時はこのURLを使ってね」という「代表URL」のことだ。

WebページURLには、(まさにこの例のように)ページ分割位置を示すクエリパラメーターがくっついたり、効果測定アフィリエイトのためにクエリパラメーターが勝手にくっついたりすることがよくある。同じページでもURL無限バリエーションができてしまうが、それぞれが別個のコンテンツだと認識されてしまうと不便なこともある(まさにこの例のように)。

そうならないように、アクセス本来まっさらな親ページ(先頭ページ)に集約するのがカノニカルURL役割だ。

 

はてブも、分割の途中ページがブックマークされてもカノニカルURL記述に従って先頭ページがブックマークされる仕組みになっている(この仕組みが実装されたのはわりと最近なんだけど)。

それなのにTogetterブクマが👆あんな風になっちゃうのは、ひとえにTogetter側のカノニカルURLが正しくないからだ。

カノニカルURL記述じたいがないのかと思って調べてみると、そんなことはない、ちゃんとある

link rel="canonical" href="https://togetter.com/li/2064362?page=3"/>

なんと、クエリパラメーターをくっつけたバリエーションURLのほうをそのままカノニカルURLにしてしまっている。本末転倒な使い方だ。

 

もろちん、クエリパラメーターがくっついたままのURLカノニカルとしなければならないケースもあるだろう。クエリパラメーターが記事IDになっているようなサイトはいくらでもある。

しかTogetterに関しては違うと思う。なぜなら、分割の途中ページでもSNS拡散ボタンは先頭ページのURL登録するようになっているからだ。

まり拡散アクセス記事の先頭ページに集約したいという意思ちゃんとうかがえるのだ。SNS拡散ボタンカノニカルURL矛盾がある。

 

文句のついでにカノニカルURL解説をしてしまったのでちょっと長くなったけど、とにかくTogetterカノニカルURLの設定をとっとと見直してほしい。

ログイン ユーザー登録
ようこそ ゲスト さん