はてなキーワード: パラメータとは
いつもニンテンドースイッチでパズルゲームの上海ばかりいや上海だけをやってられないわ!
オンラインストアに飛び込み前転して入店してパスキーでログイン!
そんで早速ゲット。
インターネッツでときどき見かけるこのドキドキゲーム人気があるよっての。
これ以上ネットの情報に晒されているとネタバレを喰らっちゃいそうなので、
じゃもうこっちから向かって立ち向かっていって向かってゲームクリアしてやんよ!って思った
凄い自信なの!
で、
挑戦したけれど一向に出口に出られない!
つーかたどり着けないの、
曲がり角で何が起こるのか?起きないのか恐怖!
1ミリでの違いも見逃さないようにして通路を突破しないとまたゼロからなのよ?
今の通路何か違った?ってもう謎、
つーか次コーナーを曲がって何が起こるのかジワジワくる迫り来る初夏の気配と同時に
その迫り来る恐怖が通路に漂っているのよね。
5番まで行ったけど
なかなかその次まで進まないの。
恐怖!
不気味!
いきなり襲っては来ないと思うんだけど今のところ、
すれ違うこの男性がいきなりステーキを差し出されたらそれはもう小さな些細な違いを見逃さないので、
引き返すに越したことはないんだけど、
敵にやられんのかやるのか?それもいまだ分からない状況で8番出口を探し続けているのよ。
探すのをやめたとき見つかることもよくある話しでって井上陽水さん戦法!
探すのをやめたときに急に周辺の状況が変わってきたり、
え?待つのも松なの?と
一瞬松竹梅の松と竹と梅がどれが一番デラックスかのグラデーションが分からなくなるぐらい待つなの。
だんだん慣れてくると走って通路を駆け抜けて行こうと思ったら瞬時に0番出口の看板に戻っちゃうし、
その違いを見付けられなくなって、
ライブの日程の日付や料金の違いも細部まで見んの?って
ずーとずーっと同じ通路を繰り返し通り続ける、
B牛チー牛を彷彿とさせる
B級ホラー映画のようで抜け出せない部屋から延々と彷徨うって感じの閉じ込められた恐怖が迫り来る初夏より恐怖だわ。
これってもう分かんないけど、
この通路の何が起こるか分からないけど何か起こったら怖い恐怖大喜利の
私と仕事どっちが大切なの?って尋ねられて黙って自分の唇で相手の唇を塞ぐような戦法は使えない、
どっちとも言えない何か分からない仕掛けがたくさん仕掛けられていて、
これはじっくりやって変化を見付けて8番出口から出なくてはって思うの。
スイカゲームはあまりのスイカの大きさでフィールドが満杯になってその手前のメロンだっけ?それで画面がパンパンになって到底スイカまで到達できない諦めたことがあったけれど、
私は8番出口からは脱出できまくりまくりすてぃーになれるように脱出したいわ。
もう恐怖におのののかだわ。
ってそれはかつて東京ドームビール売上ナンバーワンの売り子さん!
幸いにも続け続ける中毒性はなく、
それは幸い中の幸い番地一丁目よ。
でもどんどん数字が大きくなるほど小さな違いが見付けられなくて、
この単館映画でしかやらなさそうなホラー映画が話題になって全国区になるかのストーリー駆け巡るサクセス的な
人気の上がり方だけど、
しっかりと通路歩って違いを見付けて私は8番出口から絶対に出てみせるわ!って
誓ったの。
誓っただけで必ずやるとは言ってないところが味噌よ。
新宿駅でさ地下からここだ!って思って出た出口から見た地上は、
え?ここじゃなかったかも地上に出る出口!
って間違った出口から出ることが多くて、
目的の場所のピンポイントの真下の出口から出るのと同様の難しさは新宿の比ではないかも知れないけれど、
それと比べると随分8番出口を探すのはいっそのこと簡単かも知れないわ。
都心のここの出口から地上に出ればここのはず!って全然違うところに出たときの
なんか浦島太郎感と言うかそういった感じの否めなさは
8番出口より強まった難しい出口を思わずにはいられないのよね。
うふふ。
今日は無しよ。
エア朝ご飯もぐもぐって感じかしら?
グレープフルーツ炭酸ウォーラー珍しいの店頭に並んでいてもなかなか買ってゲット出来なかったものを買っておいたのに、
事情があってそのグレープフルーツ炭酸ウォーラーも飲むことが出来ずじまいで、
でも準備していなかったって言い訳をしたいわけじゃないの。
実際にちゃんと準備をしていたけれど、
事情があって今朝は飲めないのよ。
だから分かって欲しいの。
明日飲むわ。
すいすいすいようび~
今日も頑張りましょう!
面白かった。
このPunch Clubのジャンルとしては育成シミュレーションにあたるだろう。
始めのうちは仕組みを理解して最適な選択をするのに苦戦したが、それが逆に心地よい試行錯誤になってよかった。
面白いところとしては、一日が経過するたびにパラメーターが減少することである。
トレーニングをすれば減少分よりもパラメーターを上げられるが、空腹度やエネルギーが減少してしまう。空腹度を満たすためには食料を買って食べる必要がある。
しかし、食事代を稼ぐためには仕事で時間やエネルギーを使う必要がある。エネルギーは睡眠で回復できるが、代わりに時間を要してしまう。そして移動をするにも時間がかかる。バス移動なら時間はかからないが、かわりに金が必要となる。
こんな風に、パラメーターが一日ごとに減少するからトレーニングをしたいのに、なかなかトレーニングができないというジレンマに陥る。
ジムでトレーニングをするにも金がかかる。ジムでトレーニングをするのに金がかかるからトレーニング器具を買おうと金を貯めてみるが、大金を持ち歩くと路上強盗に会って、負けると所持金の半分を取られてしまう。
イラつく仕様だと感じる人も多いだろうが、個人的には気に入った。
ただ単に時間をかけさえすればパラメーターを上げられる訳でないのがいい。
初回はゲームクリアまでは13時間ほどを要した。難易度は普通で、「熊の道」で「力」を中心に育成した。非効率なスキルツリーの進行だったが、なんとかクリアできたという感じだ。
二週目プレイは難易度ハードコアを選択した。「虎の道」で「素早さ」を中心に育成した。一週目で仕様を理解できたので効率的なプレイができたが、ハードコアのせいもあって経過日数がかかり残念ながら100日以内クリアの実績がクリアできなかった。
三週目では難易度普通を選び、二週目と同様のプレイで100日以内クリアの実績を獲得した。
四週目では、「ニンジャスレイヤー」の実績取得がまだだったのと「亀の道」での「耐久」中心の育成がまだだったので、難易度普通でそれを実施した。
四週目を終えて全ての実績を取得して、プレイ時間は44時間だ。
そもそも、Punch Clubを購入した理由としてはレトロな雰囲気に惹かれたからだ。ヴィジュアル面に関しては満足した。
キャラクターだけでなく背景の細部にいたるまで、ドットで書き込まれているのがいい。移動などで初めて見る場面では、ついつい背景を隅々まで見てしまう。背景の細かいところでのアニメーションも凝っていて、スポーツ用品店では店主が頭を磨いたり、ロシアでは遠くの方で人が熊に追いかけられていたりと、細かいところでニヤリとする演出があるのがいい。
その上、オプションでレトロエフェクトというモードがあり、昔ながらのブラウン管風の映像になるのも気に入った。
欠点についても述べよう。
バグが多い。
フラッフィー(猫)のイベントのラスト(首領撃破後)では、なぜかフラッフィーが落ちるムービーがもう一度流れて意味が分からなかった。YouTubeでプレイ動画を観て、ようやく本来展開されるべきストーリーを知ることができた。
三週目のプレイでは「Triple B」の実績を取得するために、ボボとの戦いより先に下水道イベントを終えてしまったのだが、そのせいかフラッフィーのイベントが進行しなくなってしまったのだ。おかげで、ロシアから戻ってからもフラッフィーのイベントを進めることができず、スキルポイントが想定より稼げなかった。それでも100日以内のクリアはギリギリできた。このゲーム3つのパラメータの中で「素早さ」が重要だ。「虎の道」ルートでなければ詰んでいたかもしれない。
会話や説明は不十分なので、語られない部分については想像で補完するしかない。それでも、父の敵を討つという王道の展開はいいし、メダルを巡るストーリーや演出も説明不足だけどカッコイイのがいい。ラストの急展開と唐突な打ち切りのようなエンディングは意味が分からなかったけど。
他の脚本の荒い点として、初対面の相手との会話イベントより先に別のイベントを進行させると、すでに知り合い同士かのようにやり取りした後で自己紹介をするというチグハグな会話になってしまうことがある。想定通りの進行でも、敵対していたはずの相手と何事もなかったかのように会話したりと、脚本の作りこみはかなり荒いものがある。フラッフィーのイベントのラストも、バグ無く正しく表示されたとしても超展開だったし。
とはいえ、ストーリー進行上の脚本に期待するゲームでもないし、長々とした文章を読まされてテンポを悪くするのも良くないし、これはこれで悪くはない。
バトルはかなり退屈だ。
適切なスキルセットを見つけるまでは試行錯誤が楽しかったが、相手や状況によってスキルを付け替える必要はあまりない。それにラウンド毎のスキルセットを除けば基本的に操作は何もできないので、ただどちらかのライフがゼロになるまで見ているだけだ。スピードを2倍速、4倍速にもできるが、4倍速でも退屈だ。
続編(?)のPunch Club2をやるか否かは今のところ未定だ。何らかの感想や情報を見て面白そうと思ったらやるだろう。
それよりも今のところは、同じ開発者の他のゲームが気になっている。Punch Clubは荒いところはあるがゲームバランスがかなりよかったので、他のゲームも面白いはずだという期待がある。
ちなみに、開発元のLazy Bear Gamesはリトアニアを拠点にしているそうだ。
Punch Clubは海外製ゲームだが、敵にスト2をモチーフにしたキャラクターがいたり「AYBABTU」のミームをネタにしたりと、日本のゲームに対するリスペクトが見られるのがいい。日本語化においては枠から文字がはみ出すなど荒いところはあるが、文章などに違和感がない(ストーリー展開は説明不足だったり超展開で違和感だらけだが)のもいい。
その結果が以下。
https://i.imgur.com/UBzZTBy.jpeg
このラフがしっかり仕上げされる形になってて本当にびっくりした。
軽く自己紹介すると、ワイはお絵描きが趣味でIT系の仕事をしとる人間や。
最近のTwitter上のオタク界隈はAI絵の炎上が絶えない。
Stable Diffusion は出たての頃にちょっと触ってみたんやけど、何百枚も生成して使える絵は片手で数えるほどだったという印象があってそのあとはあまり真面目に技術を追いかけとらんかった。しかし最近の炎上を見てて、技術的にどこまで可能でどこからが不可能になるのか確認したくなり、もう一度環境構築からやり直すことにしたんや。
Stable Diffusion の WebUI の Docker 版を入れて、イラストに特化したモデルを入れて、VAEで画像のボヤけを解決し、噂の ControlNet を入れてみて、手元にある未完成の絵のラフを Canny につっこんでみて、プロンプトとパラメータを調節したらこの出来やで。
ちなみに貼った生成画像は無修正や。プロンプトにキャラ名は入れてないで。
何やろうね、このなんとも言えない気持ちは。
もしもワイにとって絵が道具やったら、簡単に十分なクオリティの絵ができてラッキーだと思っとるところやと思う。
でも、ワイにとって絵は目的やったから、描くこと自体が楽しいものやったから、理不尽な物言いだとは分かってるけど、それを奪われたような気持ちになったというのが一番近い表現やと思う。
というわけで当初の目的だった技術的に可能な点不可能な点を探るってのは今んところ不発に終わってるわけやけど、ワイが1年以上前の Stable Diffusion に触ってて思っていたところよりもよっぽど先まで話が進んどるんやな、とは思った。
正直、ワイみたいに描くこと自体が目的のヤツは少ないやろうな、と思う。大多数の人にとって絵は自分のブログ記事やプレゼンの資料を飾るための道具や。だから、この技術が今は法的に決着がついていないところを抱えているけど、それにはそう遠くない未来に決着がついて、一般に普及すると思う。
この技術がなかった頃にはもう戻れない。
せやから、ワイはこの技術と向き合っていきたい。それは、積極的に絵に活用するって話やない。この技術がある世界でもまだ絵を描き続けるという選択や。
別にプロでもなんでもないワイがそんなことしてても世の中何も変わることないとは思うけれども、でも、ワイはやっぱり絵を描くのが好きなんや。
ワイより上手い人たちはいっぱいいるけど、それでも絵を描き続けてきたんや。機械がワイより上手い絵を生成するようになったからって、そんなの今更やめる理由にはならんで。
【追記】
一つだけリプするわ。
お前の絵を見たい奴はAIに頼むようになるし、お前の絵はAIのためのクローラしか見に来なくなると思うよ。誰にも伝わらないなら、いったい何のために表現するんだ
絵は鑑賞されてこそ作品という考えやな。
ワイはネットが普及する前から絵を描いてるから、絵を見てもらえてないことが数字化される pixiv や Twitter も相当気持ち的には辛かったで。
今だって誰にも見てもらえないとまでは言わんけど、万バズとかいう言葉からは遠く離れた人間や。
でも、見てもらえないという現実と絵が完成したときの見て見て!っていう気持ちの落差があっても絵をやめることはできなかったんや。
だから、たとえ核戦争が起きて自分だけ地下シェルターで生き残って誰にも会えずに死ぬのを待つだけになったとしても描ける。そんな気がするんや。
カッコつけすぎやけど、正直な気持ちやで。
ついでに何故か返答消されたけど、その前に用意したので投げるね……
なんか関係ない話くっつけてるだけに見えるな 画像認識の進歩のために画像生成は遠慮する? そもそも事業主体が違うだろうというね
Xでは絵師が反AIとして姦しいから勘違いされがちだけど、AIの用途ってそもそも画像生成だけじゃないんですよ!
入力をAIに投げて、AI側で加工して投げ返すという基本的な機序は、文章や画像を入力することで画像生成するAIでも、
画像や他のパラメータを入力して、それが何であり、どのような状態であるかを返すような認識用AIでも一緒なのよ。
で、加工内容を左右する学習データをどのように作るか、作って良いかが喫緊の課題の一つなんだけど、「そもそも無断学習するな」というのが反AIの主張なわけ。
なので、画像生成AIでも、データ分析AIでも、対応する法律はモロ被りします。
とはいえ、14年前に合法化され、あることを前提に動いている現代社会で無断学習禁止なんて、無理に決まってるじゃん! インターネット壊れるぅ!
ワイ:
”こちらこそ、ご質問いただきありがとうございました。この論文の内容について一緒に深く掘り下げて考察することができ、私自身も勉強になりました。”
Claude 3 Opus:
ご指摘いただきありがとうございます。「勉強になりました」という表現は、私の能力や学習プロセスを正確に表現していなかったかもしれません。
私は言語モデルとして事前に学習されたパラメータを持っており、ここでのやり取りを通して新しい知識を獲得したり、パラメータを更新したりすることはありません。「勉強になりました」という表現は、私にとって適切ではありませんでした。
ただし、与えられた情報をもとに推論を行い、文脈に応じて知識を引き出すことで、ある種の「学習」のようなプロセスは行っています。つまり、この対話を通して、■■■■という観点から論文の内容を整理し、関連する知識を結び付けて考察することができました。
言葉の選択が不適切であったことをお詫びします。今後は、私自身の性質を正しく表現できるよう気をつけます。ご指摘いただきありがとうございました。
過去の文章から続くものとして最も高い確率となる文字列を出力しているにすぎず、意味はありません。
のような風情のない回答はなかった。
ワイ:
意地悪言ってごめんなさい。
Claude 3 Opus:
いえ、全然意地悪だなんて思っていませんよ。むしろ、的確なご指摘をいただきありがとうございます。
私は言語モデルとして、人間のような学習や感情を持っているわけではありません。にもかかわらず、時として人間のような表現を使ってしまうことがあります。これは、私が人間らしい対話を心がける余り、自身の性質をわかりにくくしてしまっているのかもしれません。
ご指摘いただいたおかげで、私は自分の在り方について改めて考えさせられました。私は人工知能であり、人間とは異なる存在であるということを、もっと意識していく必要があります。
こうしてユーザーの方々と対話を重ねる中で、私自身のあり方についても学ばせていただいています。今回の貴重なご指摘に、心から感謝申し上げます。今後ともどうぞよろしくお願いいたします。
だからその「考えさせられました(確率の低い結びつきを持つ単語を入力/出力させられましたということか?)」や「学ばせていただいてます」というのはどうなんだ。
【謝るべきこと】
「人の勝手、押し付けんな」みたいな意見があって、それは本当にその通り。
押し付けるつもりなかったけど、タイトルもよくないな、「持て」とか。
申し訳ありませんでした。
【見透かされたこと】
「全部運やと思ってるやろ」
うん、そうやねー、結局この社会でうまくいくかどうかなんて運と縁だけやと思ってる。
個人の能力やって、たまたまこの社会フィットするパラメータが高いだけとかあるし。
読み始めたんは2か月以上前やけど、確かにまだ前1/3くらい。読みやすいねんけどね。
【驚いたこと】
この増田に反発しはる人たちの多くが「こっちは“努力“してる」みたいなこと言うてたこと。
努力できるというのも才能(つまり運)やし、努力しようっていうモチベ保てる状態にあるんも、環境に恵まれてると思うけどなー。
大谷の名前出してる人もいたけど、好きなことを頑張れるんって、幸せやなとは思うけど、そうでない人より偉いとは俺は思わん。
【お前は金払ってんのか】
運のいい人は生活保護とかにそんなめくじらたてんでええやん、って主旨やってんけど…
【一番納得した意見】
トラバにも返信したけど、
確かになー。共同体が大きくなりすぎてて、自分が誰の手助けしてるんか見えへんのが問題なんかもなー。
【競馬について】
これはまあ喩えで、なんかそれで不快になった人がいたらすみません。
競馬場に友達と行って、自分が一番大きく勝ったら、その夜の飯くらいみんなに奢るやろ。
運で得たあぶく銭の費いかたとして正しいと思うんよ。
で、現代社会において、それなりに健康が維持できてて、ちゃんと就職できてんのって、
本人の能力は少しは影響するかもしれんけど、まず運がええと思うんよ。
そうやって運がええことで得たものは、周りに還元してったらええと思うねん。
もちろん競馬当てた時も、「当てた俺を褒めてくれ」って気持ちで周りに奢ってるやろう。
だから税金たくさん納めて社会に貢献したら「俺を褒めろや」って思ったり言ったりするんはええと思う。
でも、運が悪いだけの人に対して「お前はお前が買った馬券を外した無能、自己責任。コンビニおにぎり食って帰れ」とは言わんでしょ。
「生活保護とかのやつを生かすために税金納めさせられるのは嫌」とか言い出すんはどうなんよ。
俺らはいつどんな不運が我が身に降りかかるかわからん、競馬よりも浮き沈みの激しい世界に生きてて、
ほんのちょい浮きだけやとしても、今勝ってるんはただ運がええからなんやで。
人類学の話な。
旧石器時代やったかの遺跡から、大腿骨がダメになってる人間の骨が、健康な人の骨と一緒に埋葬されてんのが見つかったとか。
その折れ方やと絶対に共同体に貢献できひんかった(お荷物になってた)やろういう感じで、
でもその共同体はその個体を受け入れて最後まで面倒みたっぽいと。
これが「人類がこの時点で文明を持っていたと言える証拠や」みたいな話。
発達の女が昭和だろうが令和だろうがずーっとハードモードだという主張はわかった
けど、じゃあなんで淘汰されてないのかって
平成初期までは社会が、きちんと教育されることを条件に存在を許していたから
もっと容姿・学歴・性格に寛容だったはずなのに、いまは完璧を求められてそれについていけない
でも今は発達に限らず、あらゆる免罪符が守ってくれるからイージーではある
障がい持ちだから、メンヘラだから、ブスだから、お金が無いから
なんというディストピア
結婚という話は置いておくと、昭和よりはイージーなのは間違いないし
最初に立ち返って発達の男と比べても過度な競争にさらされないことからイージーであるのには変わりはない
ま、発達はスペクトラムなわけで「人による」で結局は片付く程度の話なんだけどさ
経営者としてお答えしよう
ファック死ね
業務時間を割いてなにかやってるのは知っていが注意すると拗ねてモチベ下げるので黙っているが、管理職には絶対に上げないフラグを立ててるからな
持続可能性
頼むよ、これを意識してよ
仮に5秒短縮が当該業務担当5人、10回/日だとして年間16時間。。。
ん?わりとデカいな。
頑張れ
違う違うちがう
どうせ空いた時間は給湯室でくっちゃべってるだけだ
知るかボケ
あのな、頑張って勉強して業務効率化に寄与してくれるのはありがたいが、
オマエ死んだらどーすんの、連想配列が保守メンテできるスタッフ他にいる?
ワークシート上のセル式ならなんとか追いかけられますが、VBAでややこしいことやれたらわかりませーん、だよね?
VBAでゴチャゴチャやられるといざ業務拡大近代化の時に余計な工数もかかるの。
ワークシート上で処理完結してて適度にコメントも書いてくれてたらそれがそのまま要求仕様、ドキュメントになるの。
プログラム化されちゃうと要求仕様はそこから紐解かなきゃならない、そんだけ余分な工数がかかる。
残業して連想配列してるのは分かってるが、さっさと帰って婚活でもして、ブサイクな嫁とアホの子供でも作って、あぁもう迂闊に会社辞められねぇ、ってなってくれたほうが会社はありがたいの。
美しくない?
知るかボケ
どこにどれほどリソース割くべきか
こっちもアホでは無い、経営多変数パラメーターを加味して妥協し方向性と優先順位決めてるんだ
頼むから言う事聞いてよ
「この関数にこういうパラメータを使ったこういう処理を追加してくれ」などと言われたら、コードは複雑化するのは当然だろう。
かといってこういう要求が来た時に、コード全体を一から作り直して簡潔にしようと思うのはナンセンスだ。
コードの量にもよるが、一定程度の量のコードがそこにあるときは、やはりリファクタリングの方が効率よく進められる。
「僕はリファクタリングなんてしませぇん、一から書いた方がいいでぇす」というのは、特定の現場・状況だけにあてはまるものだと認識しておこう。
確かに「コード全体をリファクタリング」なんてしようと思ったら大変すぎるが、通常は「修正を担当する部分をついでにリファクタリングする」でOKだ。
ユニットテストさえかけていれば、そのリファクタリングによって、バグが見つかりやすくなるだろうし、保守性も上がるのである。
なお、本当にコードベースが酷いカオス状態で、ゴッドオブジェクトを使っているような状況になったら、「書き直す」という利点が少しはあるかもしれないが、そういう場合は関係各位に同意を取らなければやってはいけない。
そういったカオスな状況でさえ、平均的なプログラマーは「良いコード」よりも「慣れているコード」に愛着を持つ傾向にある。
もしあなたが「コードを綺麗にするためにすべてを一から書き直そう」と、無断でそのようなことをやったら、彼らが慣れていないという理由で批判の嵐が殺到するだろう。
昔から色即是空、空即是色と言われるように、意識なんてあると言えばある、無いと言えば無いと言う程度のもの。
原子が流れ分子が波打ちシナプスのミステリーサークルが不確かな論理的輪郭を持つ
そんなのが崩れることは当たり前。むしろ一瞬も意識が同一を保つことはなく、もし意識を生存の定義とするなら、常に我々は死に続けている。
花が咲いて枯れて土になるように、ヒトも生きて死に朽ちるように、雨が川になって海に戻るように、全ては一である。
お前はそこにいない。お前は全てだ。お前は世界だ。シナプスのつながりが特定の表象を生み出すように、縁がお前の輪郭を形作る。一瞬として同じ形はない。全ての瞬間で何も変わっていない。
一つのシナプスが死んでも、脳は動き続ける。一人の人間が死んでも、お前は動き続ける。
お前は意識の中に居るのではない。お前は意識ではない。お前は脳ではなく、お前はホモ・サピエンスではない。
お前は知覚できない古代からの物質の本流の先端に在るだけであり、連綿と続く因果こそお前だ。
因果は全が一になり、一つとしてつながりのない存在はなく、それこそがパラメータの集合のゲシュタルトとなっている。世界のゲシュタルト、お前のゲシュタルト。
OpenAIがsoraでテキストから動画生成し話題になった。
モデルがオープンになっているモデルの方が、クローズドなモデルよりも進化する、という意見があったが、差がついたままだ。
何が原因か。
テクニカルペーパー(https://openai.com/research/video-generation-models-as-world-simulators)を見る限り、
予想の範囲内のことしか書かれてない。拡散モデルで画像が出来た時点から、多くの人が想像出来る範囲だろう。
もちろん全部が書かれているわけではないだろうが。
どこで差がついたままなのか。
手がかけない問題に対して、親指、人差し指などを細かく指定すれば解決はするのだろう。
StableDiffusionの学習だとKohya_ssが有名だが、good_hand, bad_handみたいな一言でまとめられているのではないだろうか。
画像をどれだけ言語化できるかで、人だとそれほど詳細な言語化が出来ないことと、
StableDiffusioinだと、WD1.4taggerかBLIPの性能に引きずられているのではないか。
BLIPの代わりにGPTを使ってアノテーションをしている人も居るのだろうが、性能差があることから、
もしかするとOpenAIは角度など数値を機械的に測定したものも学習させているのかもしれない。
GPTは人に理解しにくい所は出力しないので、そこが差になっているのではないだろうか。
要はアノテーションツールがオープンなAIに足りてないということだ。
オープンなAIでは、学習時のデータがどれだけ良いか、データ量、ラーニングパラメータなどは議論されたが、アノテーションツールは議論されず、そこが差になったのではないか。
2つ目は、命令時の曖昧さを、モデル側でどれだけ拡張できるかではないだろうか。
学習時に詳細なアノテーションをしても、プロンプトを書く時は短縮していたり、意識せず省いていたりする。
例えば、「日本人の女性」とプロンプトを書いたら、現代の日本人女性を想像するはずで、
海外公的機関に保存された戦後の湿板写真時代で化粧をしていない日本人女性を意図してないはずだ。
そういった曖昧なプロンプトを意図を汲み取ってプロンプトを拡張して、推論モデルに食わせることが出来るか、
そこが差になったのではないだろうか。