Attention機構は、自然言語処理タスクにおいて、入力文の中から重要な部分を選択し処理するためのアルゴリズムです。GPTは、Transformerと呼ばれるモデルアーキテクチャを使用しています。Transformerは、Attention機構を利用して、入力文中の各単語の関係性を学習します。これにより、モデルは入力文全体を理解し、より質の高い出力を生成することができます。

Me:

GPTは医療の知識が弱いと聞くけど、このAttention機構の仕組みと関係ある?

GPT:

GPTは、学習データに基づいて学習されます。そのため、学習データに医療に関する知識が少ない場合、GPTは医療に関するタスクに対して劣る結果を生成する可能性があります。Attention機構は、入力文中の各単語の関係性を学習するために利用されています。しかし、Attention機構自体は、学習データに基づいて学習されるため、学習データに医療に関する知識が少ない場合、Attention機構も医療に関するタスクに対して劣る結果を生成する可能性があります。しかしながら、GPTには大量のテキストデータを学習し、自然言語処理タスクに対して高い性能を発揮する能力があり、知識を持っていない領域でも新しい知識を得る能力を持っています。そのため、医療に関するタスクをGPTに与える場合は、十分な医療に関する学習データを与えることで、GPTが医療に関するタスクに対しても高い性能を発揮することが期待できます。

Me:

ポイントは、Attention機能を医療用にチューニングするのではなく、医療データを学習データとして与えることが、GPTの医療分野への強化に繋がるんだね。

GPT:

そうですね。Attention機構は、入力文中の各単語の関係性を学習するためのアルゴリズムです。GPTは、学習データに基づいて学習されます。そのため、学習データに医療に関する知識が少ない場合、GPTは医療に関するタスクに対して劣る結果を生成する可能性があります。それに対して、十分な医療に関する学習データを与えることで、GPTが医療に関するタスクに対しても高い性能を発揮することが期待できます。そのため、Attention機能を医療用にチューニングするのではなく、医療データを学習データとして与えることが、GPTの医療分野への強化に繋がるということになります。

次ぎに専門家の監修について深掘り

Me:

GPTが医学的な正確性や専門性を獲得するには、意思決定者としての専門家の監修が必要という認識だけど、仮にそれが可能になった場合、GPTは医療現場で使われるようになると思う?

GPT:

GPTは、大量のテキストデータを学習し、自然言語処理タスクに対して高い性能を発揮する能力があります。しかしながら、GPTは人間の主観や判断力を持っていません。そのため、GPTが生成する出力は必ずしも正確であるとは限りません。そのため、医療現場でGPTを使用する場合は、専門家による監修が必要です。専門家は、GPTが生成する出力が正確であるかどうかを判断し、必要に応じて修正を行うことができます。これにより、GPTが生成する出力が正確であることが保証され、安全かつ効果的な医療を提供することができます。そういった意味で、GPTが医療現場で使われるためには、専門家による監修が必要であり、GPTはその監修に基づいた情報の提示などに利用されることが考えられます。

Me:

ユースケースとしては何が考えられる?

GPT:

GPTは、自然言語処理タスクに対して高い性能を発揮する能力があるため、医療現場での様々なタスクに利用することが考えられます。例えば、医療文書の自動生成や翻訳、診断支援、治療プランの生成、疾患の予防に関するアドバイスの生成などが挙げられます。また、GPTは大量のテキストデータを学習することで、新しい知識を得る能力を持っているため、医学研究や新しい薬物の開発にも利用することができます。ただしながら、これらのタスクにおいてもGPTが生成する出力は必ずしも正確であるとは限らないため、専門家による監修が必要です。

Me:

専門家の監修は、GPTのユースケースの内、どのフェーズで必要になると思う?

GPT:

GPTが生成する出力が正確であることを確認するために、専門家による監修が必要になります。そのため、GPTを利用する各フェーズで専門家の監修が必要になることが考えられます。
学習フェーズ: GPTが学習するデータについて、専門家が正確性や適切性を確認し、修正を行うことが必要です。
生成フェーズ: GPTが生成する出力について、専門家が正確性や適切性を確認し、修正を行うことが必要です。
アプリケーションフェーズ: GPTが生成した出力を使用するアプリケーションについて、専門家が安全性や効果を確認し、必要に応じて修正を行うことが必要です。
これにより、GPTが生成する出力が正確であることが保証され、安全かつ効果的な医療を提供することができます。

Me:

各フェーズごとにその適用の難易度を教えて。

GPT:

各フェーズごとに適用の難易度は異なりますが、概ね以下のようになります。
学習フェーズ: GPTが学習するデータの整理や整形は、技術的なスキルが必要になりますが、専門家が正確性や適切性を確認するための作業は、通常は難しくありません。
生成フェーズ: GPTが生成する出力を確認し、修正するためには、専門的な知識や判断力が必要になります。このフェーズは、専門家によって適切に行われないと、生成された出力が正確でない可能性があります。
アプリケーションフェーズ: GPTが生成した出力を使用するアプリケーションの開発やテストには、技術的なスキルが必要になりますが、専門家が安全性や効果を確認するための作業は、通常は難しくありません。
ただし、これらは一般的な話であり、実際には、専門家がそれぞれのフェーズにおいて監修するために必要なスキルや知識は、それぞれのアプリケーションやタスクによって異なります。

Me:

たしかに生成フェーズにおける出力のパターンは他のフェーズと比べ管理しづらそうだけど、その難易度を調節するための工夫はあったりするの?

GPT:

生成フェーズにおいて、GPTが生成する出力を確認し、修正するための難易度を調節するための工夫には以下のようなものがあります:
GPTが生成する出力のフォーマットを明確に定義することで、専門家が確認する作業を簡略化することができます。
GPTの出力を確認するためのインターフェースやツールを開発することで、専門家が確認する作業を効率化することができます。
GPTが生成する出力に対して、事前に定められたルールや基準を適用することで、専門家が確認する作業を効率化することができます。
GPTが生成する出力を多数の専門家に確認してもらうことで、正確性や適切性を確認することができます。
GPTが生成する出力を正確性や適切性が高いと判断される場合は、人手を減らして出力を採用することができます。
これらの工夫により、GPTが生成する出力を確認し、修正するための難易度を調節することができます。また、専門家が確認する作業を効率化することで、より多くのGPTが生成する出力を確認することができ、正確性や適切性が高い出力を得ることができます。

最後に出力フォーマットの深掘り

Me:

GPTが生成する出力のフォーマットを定義するにはどうすれば良いの?

GPT:

GPTが生成する出力のフォーマットを定義するには、次のような方法があります。
テンプレートを使用する: GPTによる出力には、事前に定義されたテンプレートを使用します。これにより、GPTが生成する出力のフォーマットが明確に定義され、専門家が確認する作業を簡略化することができます。
スキーマを使用する: GPTによる出力には、事前に定義されたスキーマを使用します。これにより、GPTが生成する出力の構造が明確に定義され、専門家が確認する作業を簡略化することができます。
入力と出力の関係を明確にする: GPTによる出力は、入力に対応した形式で生成されるようにします。これにより、GPTが生成する出力のフォーマットが明確に定義され、専門家が確認する作業を簡略化することができます。
これらの方法を組み合わせることで、より正確かつ適切なフォーマットを定義することができます。

Me:

GPTの出力テンプレートの使用方法を教えて。

GPT:

GPTの出力テンプレートを使用するには、以下のような手順を踏むことができます。
出力テンプレートを作成: GPTが生成する出力のフォーマットを定義し、テンプレートを作成します。例えば、診断書のフォーマットや手術手順の書き方など。
GPTにテンプレートを学習させる: GPTに、作成したテンプレートを学習させます。
GPTに入力を与える: GPTに、入力として必要な情報を与えます。
GPTが生成する出力を確認: GPTが生成した出力が、事前に定義したテンプレートに沿っていることを確認します。
修正を行う: GPTが生成した出力が、事前に定義したテンプレートに沿っていない場合は、修正を行います。
このように、GPTの出力テンプレートを使用することで、GPTが生成する出力のフォーマットを明確に定義することができ、専門家が確認する作業を簡略化することができます。また、テンプレートを学習させることで、GPTが生成する出力が予め定義したフォーマットに沿っていることを保証することができます。

Me:

GPTのテンプレートとスキーマの違いを教えて。また、プリセットと何が違うのかも教えて。

GPT:

GPTのテンプレートとスキーマは、出力フォーマットを定義するための方法であり、それぞれ異なる特徴があります。
テンプレート: GPTの出力に対して、事前に定義された文章のパターンを使用します。例えば、診断書のフォーマットや手術手順の書き方など。テンプレートは、GPTが生成する文章のフォーマットを明確に定義することができ、専門家が確認する作業を簡略化することができます。
スキーマ: GPTの出力に対して、事前に定義されたデータ構造を使用します。スキーマは、GPTが生成するデータの構造を明確に定義することができ、専門家が確認する作業を簡略化することができます。
プリセット: GPTの出力に対して、事前に定義されたパターンやデータ構造を使用します。プリセットは、GPTが生成する出力を明確に定義することができ、専門家が確認する作業を簡略化することができます。
つまり、テンプレートは文章のフォーマットを定義するのに、スキーマはデータ構造を定義するのに、使用します。プリセットは、テンプレートやスキーマのような事前に定義したパターンやデータ構造を使用することができます。ただし、プリセットは、具体的には何を指すかは定義が異なります。

Me:

Pythonのopenaiライブラリでテンプレートやスキーマを再定義することは可能?

GPT:

はい、openaiライブラリは、新しいトレーニングデータ、テンプレートやスキーマを含むように、GPT モデルをファインチューニングすることができます。 openai.Completion.create()メソッドを使用して、GPT モデルをファインチューニングすることができ、トレーニングデータ、テンプレートやスキーマ、ファインチューニングパラメータを指定することができます。また、openaiは既にテンプレートやスキーマが組み込まれたモデルも提供しており、それらを直接使用することができます。

Me:

`openai.Completion.create()` メソッドでテンプレートやスキーマを再定義する方法を教えて。

GPT:

openai.Completion.create()メソッドを使用して、GPT モデルをファインチューニングするには、次のようにします。
トレーニングデータを用意: GPTに学習させるためのデータを用意します。このデータは、テンプレートやスキーマを含んでいる必要があります。
openai.Completion.create()メソッドを呼び出す: openai.Completion.create()メソッドを呼び出し、トレーニングデータ、ファインチューニングパラメータを指定します。
ファインチューニングを実行: 指定したパラメータに基づいて、GPT モデルをファインチューニングします。
このように、openai.Completion.create()メソッドを使用して、GPT モデルをファインチューニングし、テンプレートやスキーマを再定義することができます。ただし、学習データとして適切なものを選び、ファインチューニングのパラメータを調整する必要がありますので、注意が必要です。また、トレーニングデータとして使用するテンプレートやスキーマによっては、モデルの性能が改善しないこともあるため、適切なものを選ぶことが重要です。また、ファインチューニングを行うためには、足りないデータや時間、計算リソースが必要です。

Me:

当該メソッド用のファインチューニングパラメータは `prompt` を使うんだよね?

GPT:

はい、openai.Completion.create()メソッドでは、promptパラメータを使用して、GPT モデルに対して、生成したい文章のフォーマットやデータ構造を指定することができます。このpromptによって、GPTは指定されたフォーマットやデータ構造に従って文章を生成するように学習します。このpromptには、テンプレートやスキーマを含む文章を指定することで、GPTに学習させることができます。

Permalink | 記事への反応(0) | 14:58

2023-01-21

■AIって、自分じゃカスタマイズできないってなっていくのか？

ファインチューニングやゼロショットって技術があるのは知っているが、実際やってみるとそれなりにデータが必要で、かつ良いデータが必要だったりする。

他にそのそもAIにやって欲しいのはそれじゃないんだよなってのがある。

RPAはまだわかる。

ノーコードは出来るとは思ってないけど、マウスなどで動かしているのをキャプチャしてコードに吐いてくれれば、

関数は調べられるようになる。

でもな、今のAIってそんな感じじゃないんだよな。

あとやっぱりクラウドになりそうでな。

ローカルで動かしたい、カスタマイズしたい。

Permalink | 記事への反応(1) | 13:28

2023-01-17

■今のパソコンの性能、中途半端なんだよな

AIが色々出てくるが、学習やファインチューニングしようとすると性能が足りない。

個人のパソコンで出来る範囲で学習させると、それほど便利な物が出来ない。

メモリーは128GBまでなら個人でも買える価格だが、多くが使い道がない。

仮想環境何個も立ち上げる人くらいか。

かといってGPUのVRAMになると容量が全然足りない。

24GB程度か、頑張って40GB程度だろう。

動画だと、エンコードでの画素数を増やすって方向はいいけど、

演出やエフェクトを多用するって方向だと、あまり恩恵がない。

レイトレ話題になったが、ゲームでも拡大して見比べないと違いがわからない程度。

かといって本格的なフォトリアルなものだと性能が足りず、未だに８個のGPUをレンダリングファームで借りるとかになる。

CPUのコア数増えても、ベンチ以外でフル活用出来るソフトがそもそもない。

かと思ったらAIだとCPUは全然使われて無くてGPU性能で決まる。

Raw 現像くらいか、CPU使うの。

ただRaw 現像ソフトも進化止まってるんだよな。

音楽だとDAWでオーケストラなんてやろうとすると何故かまだ止まる。

性能足りてそうなのにリアルタイムが悪いのか、ソフトが悪いのか。

GPU2個以上にしようとすると、コンセントのワット数超えるしさ。

2台以上のパソコンでクラスタ分散処理ってなると、出来るソフトが限られる。

Permalink | 記事への反応(0) | 13:34

2022-12-17

■anond:20220731205144

ウルトラファインバブルも定期的に復活するよな

Permalink | 記事への反応(0) | 19:37

2022-11-26

■絵描き AI、飽きられるのが早くて開発や運用にかかるコスト回収できなさそう

Midjourneyが出て話題になり、Stable Diffusion Ver.1.xはオープンになって話題になったけど、

クオリティに難ありで、一通り触ったら使わなくなった人が多かったかと思う。

日本的にはWaifu Diffusion、NovelAI、（他もあるが省略）など出てきて話題になったものの、

1ヶ月課金して終了する人、という段階があった。

promptで何処まで出せるかというのが、ネット民のマンパワーで探られていたが、

そこまで広がらなかったのではないだろうか。

元素法典のようなものも出てきたが一瞬だっただろう。

独自にファインチューニングする人もそこそこ居たが、そちらもすぐに飽きられた印象だ。

Stable Diffusion Ver.2.0は出てきたが、それほど進化したわけでもなかった。

(ものすごい金をかけているのに）

無料なら使うが、毎月金払って使い続ける層は何かしらかの方法で費用回収している人だけな気がする。

そしてその費用回収する道が、現状珍しさだけが売りで、Midjourney、NovelAIが示しているように一瞬で飽きられる。

絵が飽きられるので常に開発しないといけない、

運用コストもハイエンド GPUを多数使うので運転資金もかかる。

Permalink | 記事への反応(1) | 11:07

2022-10-20

■

https://birdmanikioishota.blog.fc2.com/blog-entry-12.html

なるべく元画像を保ったまま編集する

面白いけど入力画像ごとにいちいちモデルをファインチューニングさせられるのがキツイ

Permalink | 記事への反応(0) | 02:43

2022-10-14

■じじばば向けの介護 飲料って強そう

朝に筋トレしたくて、手早く取れる朝食ないかなと考えていた。

よく例として挙がるのはバナナなんだが、まめにスーパーまで買いに行かないといけない時点で却下。引きこもりを舐めるな！

家にはBASE BREADって完全栄養食を謳うパンがあるんだけど、

ワイって食べるの遅いから、朝の乾ききった口でもしゃもしゃパンを食べるのが正直苦痛なんだよね。

じゃあ飲むだけで栄養が取れるってやつがいいなと思い、

COMPという完全栄養パウダーを売ってるところを思い出した。

あれはたしか溶かした後の商品も売ってて、

冷蔵庫から出してコップに注ぐ→ごくごく飲んで朝ごはん終わり、ってのができるはず

んで値段を見てみたら、1000ml×6本で7,800円！！！

栄養バランスは考えられているけど、200kcal摂取するのに260円。

う～ん…

そして完全栄養飲料みたいな単語で検索かけてると

もう体が弱って量を食べられない高齢者向けの通販サイトが引っ掛かる。

そこにそういう人たち用の高カロリー飲料が売っている。

エプリッチドリンクとかファインケアとかってやつ。

125mlの小さい紙パック飲料で200kcalが採れて、栄養バランスもそこそこ考えられている。

商品にもよるが1個で145円ぐらい。

いいじゃん！

と思い、まだまだ30代で元気だけど

じじばば向けの濃厚流動食を買った私なのでした。

Permalink | 記事への反応(2) | 12:57

2022-10-08

■anond:20221008230231

まあ近い将来教師あり学習を持ち上げてたバカどもがいたらしいぜってなる気はする

次の進歩に必要なのはオープンソースでファインチューニングじゃなく今できてることを捨てることなんだろうな

Permalink | 記事への反応(2) | 23:31

2022-09-29

■anond:20220929060301

ほぼ画像検索が嫌なら、画像数枚を用意してファインチューニングの学習データ作って結果を縛り、img2imgで全体像指定して、生成画像からのimg2imgで方向性と結果の取捨選択をし、部分的な画像再生成で細かく調整するような全力の手間をかけてもいいんだよ？

特定のイラストを生成させるファインチューニングに必要なのは所詮は画像数枚なんで、なんなら自作でもこだわりの生成画像でもいいんだし、権利的に今までとそこまで変わるとも思えないよ。使い手次第。

Permalink | 記事への反応(0) | 19:07

2022-09-23

■AIで絵を描くの、限界を感じる

Reddit、Discord、Twitter、prompt検索サイトなどを漁って、色々promptを試して最初よりかはまともな画像が出るようになったが、

そこまでになっている。

特に75トークンという文字数制限がキツく、時間をかければ、少しずつ良くしていけるって感じがしない。

限界感じて、制限していたアーティスト名も入れてみるようになったが、

世界中に色んなアーティストがいて、Noodle Soup Promptsというprompt支援ツールに登録されている、アーティスト名が1000超えていたり、

感情の名前が100超えていたりして、組み合わせが多そうに見えるが、

結局の所、自分に刺さるのがあまりない。

というか、それほど真似したものが出てくるわけでもないし、なにより自由度が低い。構図が少ない。

他の人のpromptで参考になることが、ちょっと前より少なくなった。

既に試したものが多くなってきている。

海外勢は、textual Inversionやファインチューニングなどし始めているようだが、いかんせんGPU メモリーが足りない。

Permalink | 記事への反応(0) | 18:39

2022-09-13

■[稀ドメインはてブ]2022年 8月滅多にホットエントリを出さないドメイン からのホットエントリ

ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからのホットエントリ、ブクマ数順トップ30

anond:20210804000508 でやってみたものと同じ。滅多にホットエントリを出さないサーバからのホットエントリと言ったほうが正確なのかな。

ブクマ数	タイトル	ドメイン
1187	腕に針を刺して体内の血糖値を常時記録する「フリースタイルリブレ」で糖質と血糖値の関係を徹底的に調査した	manualog.net
1097	新型コロナ後遺症チートシート（対策一覧）	longcovid.jp
980	ひろゆきとガーシーとFC2 高橋氏について - 続・はてなポイント３万を使い切るまで死なない日記	kawango.hatenablog.com
929	ひろゆきの賠償金未払いの真相について（追記あり） - 続・はてなポイント３万を使い切るまで死なない日記	kawango.hatenablog.com
888	やっぱ「邦ロック」聴いても音楽聴いたことにならなくない？という話──サマソニにおける差別的な言動を通して - 屋上より	leoleonni.hatenablog.com
817	Readable	readable.joisino.net
755	peco、パートナー・ryuchellの告白に思いつづる「最高の彼氏だったし、最高の旦那さんだった」 - モデルプレス	mdpr.jp
695	インターネット番組「ポリタス TV」の出演休止/降板について	kyokotominaga.com
664	Mac ユーザーにおすすめしたいアプリ 2022年 8月 - loveMac .jp	lovemac .jp
650	集英社りぼん公式サイト	ribon.shueisha.co.jp
624	「ラジオライフ」2022年 10月号の有害図書に関する記事｜三才ブックス	www.sansaibooks.co.jp
595	専門家「死ぬまでもう見られない」と評する歴史的偉業…昆虫大好き小学生が国内3例目の“トゲナナフシのオス”発見｜東海テレビ NEWS	www.tokai-tv.com
573	なれのはてブ - 嫁のはてブが閉鎖しツラいので作りました。	narenohatebu.jp
523	「異世界おじさん」でたかふみはなぜUR 団地に住んでるのか？【こだわりの公団住宅描写】 : さざなみ壊変	sazanami.net
509	日本のアニメ総合データベース「アニメ大全」	anime100.jp
504	SPA 認証トークンはlocalStorageでもCookieでもない、Auth0方式はいいねというお話 - @mizumotokのブログ	mizumotok.hatenablog .jp
495	同人音声がすごいことになっている2022 - セミになっちゃた	xcloche.hateblo.jp
474	追悼　安倍晋三元首相～国葬にあたり、広く社会で弔意を～｜クラウドファンディング - White Canvas	sankei.en-jine.com
463	mimic（ミミック）	illustmimic.com
456	SEOの学び方～ SEO 初心者から上級者への道 - SEM リサーチ	www.sem-r.com
450	ソフトウェア開発者は徹夜してはいけない - ソフトウェア工学研究の日々	ishiotks.hatenablog.com
447	Stable Diffusionをいらすとやでファインチューニングする	birdmanikioishota.blog.fc2.com
423	Google Mapsがレビュー数を伸ばすための取り組みとサービスデザイン考察記事｜坪田朋	blog.tsubotax.com
418	安倍晋三さんが命がけで開いた戦後レジームからの脱却　統一教会問題はこう解決せよ【山本一郎】	web-willmagazine.com
405	COCOA ログを詳細分析できる「COCOA ログ .jp」	cocoalog.jp
405	おかっぱ美少年データベース - 蓮のうてなで君を待つ	grace-3023.hatenablog.com
381	画像生成AI「Stable Diffusion」をGoogle Colabで動かしたメモ - ただいま村	ima.hatenablog .jp
370	八木啓代のひとりごと本当に怖い統一教会の実態〜　ラテンアメリカでの暗躍	nobuyoyagi.blog16.fc2.com
362	ハードワークで人は成長するか - SaaS 企業で働くプロダクトマネージャーのブログ	www.blockchainengineer.tokyo
352	Stable Diffusion メモ: キャンバスの縦横比は構図にどれくらい影響するか - jt_noSke's diary	jtnoske.hateblo.jp