「クロール」を含む日記 RSS

はてなキーワード: クロールとは

2024-04-04

はてなー画像生成AIを誤解しているようだけど

はてなーは「電子書籍が出れば紙書籍が売れなくなるのは当然の流れ」というノリで生成AIイラストレーターのことを語ってるけど、実際のところは「漫画村で読めるから単行本は買わない」というノリに近いのが今の生成AIの現状なんですよ。

ここら辺は漫画家の中でも理解できていない人がいて、森川ジョージさんが正にそれで同業者からフルボッコにされている真っ最中なんだけどね。

還暦近い方なので仕方ないところではあるんだけど、漫画家協会理事やってるから面倒なんだよなぁ、マジで

 

 

それはともかく、画像生成AIは数億のイラストを元にして絵を生み出してるんだけど、その元となったイラストはほぼ全部無断転載で、中には児童ポルノ画像まで入ってるのまで有って問題になっているんですよ。

なので欧米では法で規制しようかという話も当然のように出ているわけです。

将棋AIAI同士で対局を繰り返してその棋譜を元に強くなるんだけど、画像生成AIは現状はどうしても人間が描いたイラストを元にせざるを得ないので問題を孕みまくっているんですよね。

 

 

クリーンデータセットを元に学習すれば良いんだけど、そのようなイラストは現状だと著作権切れの古いイラストしかないんじゃないかな?

そんな面倒なことをせず、Pixivというジャップが大量に良いイラストを纏めてくれてるからクロールしてぶっこ抜いて使おうぜ、というのが今の画像生成AIの現状だと思う。

 

 

それでも身内だけで使ったり、自分画力向上のための添削ツールとして使ったりするくらいならまだ理解できるんだけど…

現状だと「才能ないし努力もしたくないけど、SNS漫画イラストチヤホヤされてるインフルエンサーが羨ましくて仕方が無い! でも自分では努力したくないでござる!」というクズ画像生成AIで勝ち誇ったり、勝手に嫉んだ漫画家イラストレーターに似た画風の画像を出力して誹謗中傷に使ってるから問題になっているんだよ。

先月までアニメやってた「即死チートが最強すぎて、異世界のやつらがまるで相手にならないんですが。」の主人公クラスメイト他人から貰ったチートでイキってたけど、正にあんな感じのクズが量産されてるんだよね。(「即死チート」の作者は人間の愚かさというものがよくわかってらっしゃる。)

 

 

そして最近だと更に先鋭化してAIを使ってるに違いない、とAI警察化して勝手認定して冤罪発生させまくりなんだよなぁ。

イラストレーターが潔白証明しても耳を貸さないし、懲りないし、本当にクズなんだわ…

とにかく、功罪のうち、罪の方が大きすぎるのでイラストレーター漫画家はピリピリしてるんですよ。

 

 

はてなーの中には「Winny本体が悪いんじゃなくて、悪用するユーザーが悪いんだ!」という人が居るかもしれないけど、今の画像生成AIは「違法画像を大量に同梱したWinnyを配布している」状態なんですよ。

ダメに決まってるだろ、常識に考えて。

 

 

さっさと法規制して欲しいものだけど、日本でそれ関係国会議員である赤松健氏はこの件に関しては動くことは期待できないと思うんだ…

だってデビュー作が「AIが止まらない」だよ?

AI擬人化して開発者である主人公ラブコメする作品を描いた人なんだよ?

最新作の「UQ HOLDER!」では人類進歩を全肯定し、そのために血を流しながら前に進むような漫画を描いた人だよ?

AIという先進技術規制するのとは正反対立場な人なんですよ。

なので、イラストレーター漫画家諸氏は赤松健氏以外の議員ロビー活動をした方が良いと思います

2024-04-01

anond:20240401155117

パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ

で、じゃあデータはどうしているのかというと、クロールしてる

あるコンテンツ検索エンジンを作っているのだけど、基本的にはデータクロールで確保

機械学習教師データは?というのは、distant supervisionでラベルづけしてるよ

2024-03-02

[]ラチェット&クランク パラレルトラブル PS5

とりあえずクリア

難易度は一番低いやつ

プレイ時間わからんが多分15時間くらいか

途中詰まりそうになったときもあったけどなんとかクリアできてよかった

ps2の1はラストステージで詰まってクリアできんかったからなー

ロックマンのワイリーみたいな立ち位置なんだなラチェクララスボスって

リベットがかわいかったなー

声もあってた

逆にラチェット眉毛ぶっといしもさくてきもかった

画面のきれいさとロードのなさはすぐ慣れて、後半は逆につまんなかったなー

クランクメインのパズルステージもつまんなかった

最初の1時間くらいの楽しさだけで十分だったかなー

まちとかステージオブジェクトもやたらリアルで数おおいけど、逆にそのせいでどれが壊せるものかとか、

大事な隠しアイテムかとかがすげーわかりにくくなっててイライラした

最後最後アクセシビリティってオプション設定あることしって、インタラクトできる箱とかゴールデンボルトとかギミックとかの色を変えたらすげープレイやすくなったわ

最初からしとけばよかった

距離レンチなぐりはなぐってる感あるからいいけど、

わりとメインのはずの遠距離武器の爽快感いまいちだったのは微妙だったなあ・・

イージーでも敵硬すぎたから余計にそういう感じした

距離攻撃とどかねえから遠距離必須みたいな敵やボスが多いから余計に感じた

ベルトスクロールみたいにエリア内の敵倒さないと次に進めないのが結構あるけど、

終わってるかどうかがすげーわかりにくくて、終わってないのに進もうとして死ぬってのも何回かあってうざかったなー

まあ1回やればいいかなって感じ

スターオーシャン6とかもこういう感じで交互に見せてくれればよかったのになと

ラチェットリベットで2週させられてたらクソうざかったと思うわ

こんな感じで1周で両方みせてくれたらいいんだよ

絵師さんは何もおかしなことを言っていない

もう分断を煽るのはやめませんか

現在混乱を招いている要因は、おそらく以下の二つ

   

1. 著作権法第 30 条の 4 ただし書き解釈

2. それぞれがAIを異なる意味で使っている 

 

 

著作権法第30条 4 ただし書きの解釈

AI利用に向けて改正されたとされる著作権法30条の4は AIならなんでも許されるというわけではない。以下のように条件がついている。

  

著作物は,次に掲げる場合その他の当該著作物表現された思想又は感情を自ら享受し又は他人享受させることを目的としない場合には,その必要と認められる限度において,いずれの方法によるかを問わず,利用することができる。ただし,当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者利益を不当に害することとなる場合は,この限りでない。

 

 

この辺りの解釈について紛糾している様子。

同30条の 4 は平成30年当時、事業者研究者によるAI利用を想定していた。現在では一般市民AIが広く普及し状況が変わってきたこから、同条の適応範囲について再整理を図るという趣旨で公開されたのがAI著作権に関する考え方について(素案)」

そして素案に対するパブリックコメント募集した、というのが現在の流れ。

 

 

  

それぞれがAIを異なる意味で使っている

 

 

 

それぞれは別におかしなことは言っていないと思う

 

 

反反AIネット上にある全ての絵をクロールしているんだよ!お前の絵だけ除けるか!」

 

たぶん、CLIPのこと。テキスト画像翻訳を行う。犬の画像を見て「犬」識別することができる。

ネット上のあらゆる画像テキスト学習することで作られた。OpenAIによって公開。画像生成だけではなくいろんなところに使われている。

  

  

  

PixivAI学習禁止です」

たぶん、画像生成器(拡散モデル)のこと。

画像生成AIテキストエンコーダ(CLIP)と画像生成器の組み合わせでできている。stable diffusion等は拡散モデルを使っている。

   

拡散モデルこんなかんじ

1. イラストを用意する

2. イラストノイズを振って汚す

3. 汚れたイラストから元のイラストを予想させる

 

学習を繰り返しノイズを増やしていくと最後ただのノイズから画像を出力する 連想ゲーム絵師誕生する。連想ゲーム絵師連想しかできないので自分が描いたものが何かわからない。犬を描いてといっても車を描いてくる。なので CLIPが誘導したりダメ出ししたりする。

 

拡散モデル学習に使われるイラスト

どこかのイラストサイトデータベースを使っているはず。「著作権的に安全な〜」みたいな触れ込みのやつはどこかのデータベースを購入して使っているんだと思う。

Pixivの主張は別におかしくない。このあたりはAI著作権に関する考え方について(素案)p7」(エ)において解説されている。"robot.txt"への記述によりAI学習を行うクローラーアクセス制限しているにも関わらず、勝手学習に使うことは「データベース著作物潜在的販路を阻害する行為」として著作権違反になる(Pixivが将来的に本当に販売するかどうかは置いておく)

 

 

絵師AI学習禁止です」 

追加学習(LoRA)のこと。

既存モデル数枚のイラストを追加学習させることで絵柄を模倣ファインチューニング)する。

特定絵師さんのイラスト勝手に使う者がいるようでトラブルになっている。

 

絵柄に著作権はないのでは?

絵柄に著作権はない。学習の際に行われる複製が著作権侵害にあたるかどうかが争点になっている。

 

著作権法30条の4 より

  

この辺りは「AI著作権に関する考え方について(素案)」及びパブコメの返答に現状の解釈が示されているので興味のある方はどうぞ。

(p6. 特定クリエイター著作物のみを用いてファインチューニングを行う場合〜を参照)

※ここははっきりとは断定していないので自分で読んだ方が良いと思う。

  

(私の読解:)

程度問題ぽい。よくある画風なら問題にならないけれどはっきりと特定絵師さんとわかる感じだとダメそうですね

(私の読解終わり)

絵師さんのプロフィールを叩いている人は意味わからん

別にプロフィールなんて「トイレから出たら手を洗ってください」でも「フォローする際には五体投地してください」でも好きに書いてよいだろう。

それが法律に記されているかどうかは関係ない。ただのお願いだ。

AI学習禁止」と書くなと騒いでいる人は何を考えているのかよくわからん

  

AI著作権に関する考え方について(素案)」にも再三出てくるがAI学習技術的に回避することは禁止していない。30条の4は権利制限であって、イラスト差し出せという強制ではない。

分断煽りうんざり

パブリックコメント

 

見ればわかります個人よりも一般企業による意見が多く、返答とあわせてとても読み応えのあるものです。

このファイルを読んで個人の頭の悪そうな意見だけ抜粋してくるのは非常に違和感があります

 

技術創作への興味を失い、ただ相手サイドの頭の悪そうなやつをみつけて叩く人たちとは距離を置きたいところです。

2024-02-12

anond:20240211181217

軽微利用のくだり、その解釈だと検索エンジン普通に違法にならね?

検索エンジン側で持ってるデータベースクロールしたデータを全文ぶち込んでインデックス作ってないとこんな検索速度出せないでしょ

まさか検索するたびにクローリング走らせて全文中に検索ワードとの合致あるか調べて結果返すわけでもあるまいし

https://public-comment.e-gov.go.jp/servlet/PcmFileDownload?seqNo=0000267588

パブコメ用に素案も読み返してたんだけど、検索拡張生成(RAG)についての文化庁見解新聞協会のそれとはそもそも大幅な食い違いがありそう

https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf

というか問29に沿って考えれば、「情報解析によって時事情報(※ただの事実であって著作権によって保護されない)を表示する」が主であって、その過程における「既存著作物を複製翻案等する」は従であるとも評価しうるのでは

2024-02-08

個別ページじゃなくてトップレベルドメインから全部クロールして魚拓取れるサービスってないかな?

記事数が1000以上あって手作業ダルいんじゃが

2024-01-16

ワイがなぜか図書館が好きになれない理由3つ

いや嫌いじゃないんすけどね。なぜか忌避してしまうのよ。

理由1:古い本がたくさんあって埃っぽい&手あかっぽい。臭い

理由2:ネットほど情報が新鮮ではない。

理由3:がちの専門的なものはなく、趣味雑学の域を出ない。

理由4:999%の確率で朝9時から場所占有する爺さんばあさんがいる。

理由5:その爺さんばあさんと世間話永遠としている司書さんがいる。

理由6:「どっかの他人の家」感がなじめない。ビジネス然としてほしい。

理由4~6がなければいいと思うんすけどね。

年寄りサロンみたいになっていて、それさえ解決できれば。情報クロールには良いと思う。

あと本はぜんぶ電子化して座席の端末で電子ペーパーを閲覧できるようにしてほしい。

 

📚📚📚 追記 📚📚📚

ジイさんと!バアさんと!数珠をにぎって空おがむ!ハァ(゚Д゚)!

オラこんな図書館いやだ~

2024-01-08

anond:20240107212251

朝ごはんヨーグルトオールブランにする

→超快便 昼のドカ食い防止

ホットカーペットをやめてデカい布団被る

乾燥で肌荒れしなくなった

洗濯物畳まない

→部屋にカゴ3つぐらい置いてタオル肌着、それ以外で分けてぶち込む 気に入ってる服だけハンガー掛ける

使い捨て食器積極的に使う

→紙皿紙コップ割り箸プラスプー

骨盤矯正シート

→バックジョイっていうやつ椅子に敷いてる 姿勢がかなり楽になった

プール付きのジム

→大体週2ペースで2年通ってるけど7kg痩せた いつもクロールで300mぐらいだらだら泳いでる 水泳疲れた感じしないのにしっかり体動かせるから太ってる人には良いと思った

葛根湯と邪払のど飴

→人多い場所をうろついたときとか風邪気味のときに使うと体調崩れにくい

2023-12-30

anond:20231230213056

んー、でもないからねえ

一致検索で出ないんだからクロール拒否してるのかな?

2023-12-15

[]

こんにちは

週末にはエキナカのお惣菜を買って帰るのがお決まり千葉大学医学部医学科落ち早稲田大学先進理工学部生命科学科卒おじさんです

母には韓国料理惣菜自分と父には焼き鳥を購入しました

また駅のスターバックスホット抹茶ティーラテを購入しました

大学時代スターバックスにてパートナーをしておりましたが、最初の一ヶ月は慣れずにしょっちゅうバックヤードで「笑顔練習」をさせられていたことを緊張した新人さんを見て思い出しました

さて、勉強を開始して3日目ですが

仕事の合間や昼休みには英語

・出勤前、帰宅後に数学

という流れが出来ています

職場でも隙間時間英語勉強している同僚や上司が多いためその波に乗らせていただいています

明日明後日は自宅にて英語数学学習を進めつつ過去問参考書を使って受験必要な全科目を概観する予定です

結果を出すために同じリズム、同じスピード、同じフォームクロールを泳ぎ続けるように勉強することを目標としています

その意味でも図書館カフェ自習室などではなく自宅の自室で行うことが重要だと思っています

それでは良い週末をノシ

2023-12-10

白いピンポン玉を求めて:純粋な娯楽への回帰

僕は弱者男性プログラマーだ。コードを書いて金をもらっている。

そんな僕が、社会学政治に興味を持つ人が多いこのような場で物申すというのはちょっと変だと思うかもしれない。

実際、社会学なんて僕の専門じゃない。

僕はコンテンツ収集するクローラを書いたり、それを検索できるようにインデクシングしたり、あるいはコンテンツクリック履歴に基づいておすすめを表示させたりするプログラムを書いている。

このようなプログラムにも、社会的側面というのは存在する。利用者が何らかの目的によってその検索ツールを利用し、調べたいものにたどり着く。コンテンツプロバイダー、ユーザーシステムという3つのアクター社会形成されている。

社会学者がコンピュータについて語ることがあるぐらいだからプログラマー社会について語ってもいいだろう。

僕が常々思うのは、人々の目的だ。

まり「この検索ツールを使う人は、一体なにがしたいんだ」「コンテンツ提供する側は何が目的なのか」ってこと。

もっと状況を限定するために、「ブログ検索」というツールについて考えてみよう。君がクエリを投げてブログを調べようと思うのは一体どういうときなのか。あるいはブログを書こうと思う人たちの動機は?

動機基本的needとwantによって分類されると考えて良い。need場合、例えば確定申告書の書き方について調べていて、適切な情報を知りたいと言ったケースがそうだ。

wantというのは社会的本能に結びついている場合もあるし、退屈しのぎということもある。承認欲求基本的社会的欲求だし、ハッカー自分の知見を公開するのはちょっとした挑戦だろう。

リーナス法則というのを聞いたことがあるだろうか。マズロー欲求解創設と似たようなもので、「生存」「社会」「娯楽」という3つが人の行動原理だとリーナス・トーバルズは言っている。

ブログを書くのが「生存目的という人はどういう人だろうか。きっとそれ以外に職がなく、必死アフィリエイトで稼ぎを得ている人だろう。

ブログを書くのが「社会的目的」という人は、すごいことをして認められようとか、専門家とつながりたいと考えているかもしれない。

しかし「娯楽目的」というのはもっと崇高なものに思えてくる。ブログ文章を書くのが単純に「楽しい」といった人たちのことだ。

生存社会、娯楽という3つの階段によって、コンテンツの質というもの判断できるのではないかと、僕はそういう仮設を持っている。

アフィリエイト生存目的の発信をしている人たちのコンテンツは、お世辞にも良いとは言えない。クリックベイトであったり、感情を煽ったり、SEOクラックしたり、初心者的だったりする。

社会的目的の人たちはもう少しマシで、認められようとして努力をする姿勢がある。でも、「たくさんの人と繋がりたい」という目的場合ちょっと注意が要る。結局、そういう人は手当たりしだいにアクセスを増やそうとするからコンテンツの質は下がってしまう。

文章を書くのが楽しいけど、人に評価されることはどうでもいい」という人たちのコンテンツを探すことは難しいが、こういう人たちのコンテンツは奥深いことが多く、表面をなぞったようなアフィカスブログとは一線を画している。

しかしこれはコンテンツ提供する人の観点である。これらのコンテンツクロールし、検索できるように整備している「システム」の観点から見ると、どうしても「広告利益」のようなもの重要視されやすい。

Googleであれば、Google広告利益に貢献するようなコンテンツ検索結果で優先表示するかもしれない。そしてそれはまさに生存欲求のためのアフィカスを優先しているのと同じことなのだ。

インターネットがつまらなくなったと言う人たちがいる。僕は次の喩えでこれを説明しようと思う。

昔のインターネットというのは、水の上に白いピンポン玉が浮いていた。この白いピンポン玉は良いもので、楽しいものだ。

ところが徐々に黒いピンポン玉を投下する人たちが増えてくる。黒いピンポン玉は悪いものだ。手を使って沈めようとしないと、白いピンポン玉が見つからない。

そして今のインターネットは黒いピンポン玉が一番上に浮かんでいて、白いピンポン玉はその下で見えなくなっている。

白いピンポン玉は純粋な娯楽精神を持ったコンテンツのことで、黒いピンポン玉は「アクセス数を増やしたい」がために鬱陶しいことをしているコンテンツのこと。

まりインターネットでは年々白いピンポン玉を見つけるためにエネルギーを使う必要が出てきてしまっていて、疲れているとき必然的に黒いピンポン玉を見るしかなくなっているということだ。

リーナスは「文明は、生存社会、娯楽という段階に進んでいく」と言っていたが、インターネットは「娯楽、社会生存」という逆の階段を降りている形になっているように思える。

現段階では、アテンションの総和が一定であるために、ネット人口が飽和し、広告企業利益は落ち込んでいる。純粋な娯楽ではなく、企業の生き残りをかけた戦争突入してしまっているのだ。

僕は今のインターネット社会では、意識的面白いコンテンツを見つけるためにエネルギーをかけることがかなり重要だと思っている。ダラダラとやっていたらアフィカスとバズ目的しか目につかない。

例えば人間が一日に読める文章量なんて限られているから、本当に面白い人を見つけたらRSS購読しておいたほうがいいと思う。

うるさいハエがクソに群がっている。「クソを美味しくないと思うなら、お前がつまらない奴だからだ」と左翼思想家が指摘するかもしれない。

僕はクソよりもステーキが好きだ。あなたのようなハエではなく、人間からだ。

2023-11-18

anond:20231117191942

コントローラー部分の名前ググって先頭にあった横すクロール分派ったら、URLあんなっちゃって失礼。URLなおした。

マジで暖かくていらいらしなくなったのでおすすめします。ただし、足下の空気乾燥してのど渇くのでちゃんとお水とってください。

では。

2023-11-15

情弱だったせいで昔、情報商材系のどうしようもないのにひっかかった

もう20年以上前の話だ。

多聞漏れ就職氷河期の中でどこにも就職できず就職活動も半ば惰性になってしまい、親も厳しく当たってきたわけじゃないが心配しつつやっぱり何か言いたそうだったし、それを察して申し訳なくてそそくさと部屋に戻ってはずっとネットをしてるような状態だった。

社会経験のまるでない、そのくせ疲れ切った根性なしの無職だった。

出会い系エロメールに引っかかったオッサンの話なんかを「バカバカだ」と思いながら読んでいた。

 

ジオシテーィーズかFC2あたりの適当広告だったと思う。

『自宅で月50万円も夢じゃない!』みたいな情報商材文字が飛び込んできた。そんなに稼げるわけないだろと思いつつ、それでもふっと「何かの足しにはなるかもしれない」とよぎってしまった。バカだ。今の自分がそこにいたら、その目の前の四角い板でなぜきちんと調べないんだと肩を掴んで罵倒したと思う。

でも当時は、仕事はまだまだ見つかりそうにない。無聊をかこつ穀潰しでいるのはいたたまれない。何も言わずにいてくれる親にも申し訳ない。

そういう気持ちでぎりぎりだった。

 

申し込んで届いたのはWeb上のメールアドレス収集ツールだった。クッション封筒に入ったCD-ROM

 

当時はティーカップなどの個人BBSWebにはあふれていて、それらをクロールしてアドレスを集めてくるのである

そして集めたアドレス提携先の健康食品だの英会話教材だの紹介するスパムメールを送り付ける。一日に1000も2000も。

紹介する商品も割ときわどいのがあって、これさえ飲めばガンが治るとか、そういうのはさすがに良心咎めたから手を出さなかった。

文面は俺が考える。それで購入者がいたらインセンティブが入る。

こうして読むとバカバカしいだろ? 儲けなんて出るわけがない。

文章を考えるのは結構好きだったが、好きとかそういう次元でできる作業じゃない。

 

それでも何とか作業をこなして報告メールを上げると「増田さんすごい!がんばってますね!」と白々しいメールが来る。

金だけ巻き上げられたんだと気づくというか直視せざるを得なくなるまで時間はかからなかった。

このメールアドレスを集めてくるツールいくら払ったと思う?

CD-ROM一枚に50万円だ。

 

そんな金、社会経験もなく就職もできないペーペーが一括で払えるわけがない。当然向こうのセッティングでローンを組まされた。

よくわからない中部地方会社名前が入ったカードが送られてきて、月々2万円の2年間だ。

稼げるわけでもないのに借金を負ってしまった。大馬鹿だ。

月々2万は大した額じゃないが、あのころ自分バカさを呪うしかなくてただただ重くて憂鬱だった。

 

結局、俺の送ったスパムからは何一つ売れなかった。

そのキットを立ち上げることも全くなくなった。

 

途方に暮れて就職活動の傍らバイトを始め、家に申し訳程度の金を入れつつローンも返してたが最後の方で精神的にダウンして返済が滞ってしまい、ついに親にバレた。

めちゃくちゃ怒られた。当たり前だ。50万円をドブに捨てて挙句自業自得で病んだ不肖にもほどがある息子である

 

今は超低空飛行の零細に勤めてなんとか食っていってるけれど、恐らくあの時のローン延滞のせいでいまだにクレカ審査に通らない。

 

今時の人は学校情報なんて科目もあるしあのころの俺より何千倍もリテラシー高いと思うけど、弱ってる時に変なもん掴んじゃうと一生響くから気を付けてな。バカから伝言だ。

2023-11-02

anond:20231102190848

ゲーム自体プログラミング入り口にちょうどよかったりするけどね

攻略情報を見やすい形に整形するとかがプログラムを学び始める動機になったりするから

 

細かくページ別れた見づらい攻略サイトの情報を見やすくするために自動クロールして、データ集めて、整形して見やすい表のHTMLで出力するとか

2023-11-01

anond:20231101100846

deeplの前に作ってあったlingueeというサイトがあって、そこでクロールして集めた10年以上のデータがあるからこそあの精度を出せるのでは

2023-10-29

anond:20231027224113

ザーッと読んでいて、まだ出ていないようだけれど、水泳だとクロールがそれ系だろうな。

クロールはもともと貴族競泳させていた時に他者より速く泳ぐ方法として編み出された技じゃなかったっけ?

クロール発明されるまでは平泳ぎみたいな泳ぎ方が普通だったようだけど、今や泳ぎ方を教えるとなると最初はこれだよね。

まさに、一般攻撃魔法状態

ちなみに、日本で初めて競泳オリンピックに出た人はそんなことも知らず平泳ぎクロールと戦ったんだから、まあ、結果は推して知るべし

今でも自由形はみんなクロールから人類はこれを超える泳法をまだ生みだせてないということなのかな。

一般攻撃魔法ほどじゃないけど、最初出てきたときに最強だったけど今はスクールふつうに教えてくれる泳ぎ方はあとバタフライもあるねか。

左右対称に手足を動かすというクロールを殺すことを目的としたかつての平泳ぎルールの穴をついた泳法がバタフライだったような。

2023-09-26

検索エンジンの仕組み

技術的な内容を増田に書くという実験のために、試しに検索エンジンの仕組みについて書く。

検索エンジンは、大雑把に言ってクロールするパート、インデクシングするパート検索インターフェイスを出力するパートに分かれる。

インデクシング時に使っている基本手法は「転置インデックス」と呼ばれ、文書内のngramを文書ID対応付ける辞書を保存する。

インデクシングの別の種類としては、文書エンコーダからベクトルへ変換し、それを近似最近検索できるようにするものもある。

インデクシングされたものキーワードマッチ的に絞り込まれると、さらに精密な手法が使われる。

クエリドキュメントから特徴量設計し、関連性の高いものを引っ張るような訓練をする方法はLearning to rankという。

Learning to rankの中に使われる特徴量の一つにPage Rankがあるが、これは初期の検索エンジン画期的とされた量で、「リンクされるページの価値は高い」「高価値ページにリンクされると価値が高い」という基準からマルコフ連鎖計算する。

Page Rankは人間論文評価するときと似たような評価手順であるとされる。

Learning to rankの中にエンコーダからベクトルを特徴量として組み込むことも可能であり、そのようなエンコーダの初期の例がBERTである

こうやって絞り込まれ文書に対して、さら有用情報を表示するモデルがいくつか使われる。

情報抽出モデルでは、クエリ質問と見做してその回答を文書から抽出することがある。

あるいはクエリ人物名や組織名場所名などであれば、そのエンティティの詳細情報データベースから取得することもでき、これはナレッジグラフとも呼ぶ。

2023-08-26

anond:20230826224822

google自体の成長も鈍ってきてるしクロール頻度とか品質低下が分かりにくいとこは劣化させてそう。

2023-07-03

水泳の授業男女別いいんでね?ドサクサに紛れてクロールの手を前を泳いでる人の股間に当てる手法をやる人もいるしな!

2023-06-17

左右でクロールの息継ぎできる?

子供の頃はスイミングスクールに通っており水泳部ではなかったが今でもOWSとかトライアスロンするくらいは泳げるんだけど、左右で息継ぎができず(というかしようと思ったことがない)、1、3、5の奇数回掻いて右側で息継ぎしかできないことに気づいた

これって普通なのか自分が習ったスイミングスクールの癖なんだろうか?みんな左右で息継ぎできるもんなんかな?

2023-06-10

子どもの頃、スイミングクラブに通ってて、学校でも特に水泳の授業サボってなかったが

背泳ぎ』と『犬かき』しかできないワイは泳げるようになるだろうか?

スイミングクラブクロールの仕方は叩き込まれたのでクロールっぽい動きはできるが

息継ぎができなくて反対側に行くまで無呼吸になるのよな

背泳ぎは呼吸の必要がないので習得できた

 

よくわからないが、背泳ぎや老人みたいビート板でバシャバシャするのではなく、

クロールしまくったら、ストレス解消と筋肉作りに良かったりしない?

ログイン ユーザー登録
ようこそ ゲスト さん