「ファイン」を含む日記 RSS

はてなキーワード: ファインとは

2023-01-26

画像生成AI流行ってることをお前に教える2(階層マージ・LoRA編)

前回:anond:20221129215754

前回の投稿から状況がめまぐるしく変わっている。

前回紹介したAnythingv3を投稿者が削除したり関係の無い第三者Anythingv4や4.5を勝手リリースしたり…(しかマージモデルだとか)

増田も追いかけきれていないが追いかけてるぶんは自分のためにここでまとめておく。

基本モデル

NAIリークモデルAnythingv3に関しては前回を参照。

インスタモデル

Instagram投稿されている画像学習させたモデル総称

実在人物画像学習しているため人物の体型をより正確に描画させることができる。

cafe-instagramやzeipher-f222など複数存在し、Basil_Mixのようなアジア人に特化したもの存在する。

後述するマージモデルベースの一つ。

マージモデル(階層マージ)

モデル同士を混ぜるマージモデルに進展があった。

U-NET階層ごとにマージを行う階層マージというマージ手法が考案されたからだ。

これにより実写モデルベースに見た目をアニメ風にマージするという方法が採れるようになった。

流行っているモデルシリーズを二つ挙げてみる。

AbyssOrangeMixシリーズ

5chなんU(なんJもしくはなんGのパートスレ向けの板でVIPに対するパー速のような板)の住民作成した階層マージモデル

現在はBasil_MixとAnythingv3を階層マージしている。

このモデルには派生版があり、nsfw版やhard版は上記マージモデル(通称base)にNAIリークモデルやGape60を混ぜたものらしい。

Gapeについては前回の記事を参照。

 

NAIのように長いネガティブプロンプトを設定しなくても綺麗な絵を出すことができる。

7th_layerシリーズ

リアルよりになったAbyssOrangeMixを漫画アニメ向けにファインチューンしたモデル

Abyss→深界七層(メイドインアビス)→7th_layerということらしい。

アニメ寄りなA、漫画寄りなB、より漫画寄りで破綻やすいCの三種類がある。

Anything系のような中華で好まれる独特の厚塗りではなく比較的パキっとした塗りの絵が出るので個人的には一番好き。

 

他にもいろんなマージモデルがあるが、だいたいがNAIリークモデルAnythingv3と実写系モデルを混ぜたりそれにファインチューンをかけたりしたモデルだ。

Anythingv3もNAIリークモデルベースからなんだかんだいってNovelAIが作ったモデルはまさに特異点的な存在なのだろう。

LoRA

Low-rank Adaptation for Fast Text-to-Image Diffusion Fine-tuningの略で、

Dreamboothの簡易版のようなものとされているが実はDBとは似て非なる技術らしい。

DBよりも短い時間かつ省メモリ環境学習可能で、生成されるファイルも30~200MB程度とHypernetworkとそこまで変わらず一定以上のクォリティで追加学習を行えるようになった。

何よりもVRAMが8GB程度のグラボでも学習できるようになったのが大きい。

現在目的ごとに大きく分けて3種類のLoRAがある。

Style

特定の作者の画像学習させることでその画風を再現するためのLoRA。

従来はHypernetworkで行っていた。

Concept

特定のものやこと(例:ふたなり)を学習させるためのLoRA。

NovelAIやその派生モデルでは困難だった種付けプレスや断面図などの構図の再現可能となった。

Character

キャラクター再現するLoRA。

従来は主にDBで行っておりモデルの配布に苦労していたがLoRAによって配布が非常に楽になった。

 

なお、LoRAは同時に複数適用させることもできるため

士郎正宗風の絵柄でふたなりナンジャモ」という画像を生成することもできる。

 

またLoRAはHypernetworkのようにモデルを選ばないが、NAIリークモデル学習ベースにすると破綻しづらいらしい。

というか今流行っているモデルはほぼNAIリークモデル血筋が入っているので馴染みやすいんだろう。

そのほか

HuggingFace

https://huggingface.co/

アメリカの謎のベンチャー企業通称🤗。

同社が運営しているHuggingFace HUBユーザ登録すれば無料無限AI学習モデル(1ファイル2GB~7GB)をアップロードできる上回線も異常に高速であるため重宝されている。

モデルマージなどでストレージが圧迫されているローカル民にとっては救世主のような存在

資金源は謎だが、2022年5月に2億ドル調達しているのでストレージ無尽蔵に増やせるらしい。知らんけど。

SAFETENSOR

HuggingFaceが考案したモデルファイルファイル形式

実行コードを含んでいることもあり従来のckptモデルしょっちゅうトロイの誤検出が起きていたが、

SAFETENSOR形式モデルは実行コードを含まないため安全であるとされる。

🎈

スカトロ、転じてウンコのもののこと。由来は割愛する。

Baloon_MIXというスカトロ特化のマージモデルもあるらしい。

VPS自宅サーバーにインストールしたいSaaS代替Webアプリ38選

シェアウェア(という表現はおいておいてのやつ。https://anond.hatelabo.jp/20230124045812)の記事面白かったので、自分の得意分野の領域でいろいろ紹介します。

基本的に、SaaSサービスは便利だけど、あれもこれもと契約していったらサブスク破産するので、

ものによってはセルフホストした方がいいと思ってる派。

Dropbox/GoogleDrive/box代替

NextCloud

もともとownCloudっていうDropbox代替があったんだけど、そこから分派して今も機能開発が続いている。

興味深いのはLAMP構成なので、VPS自宅サーバーじゃなくても、レンサバで動くのがいいよね。

データ保存領域オブジェクトストレージ(S3互換)も利用できるので、例えばWasabiなんかと契約してお安く済ませてしまうのも全然アリかと。

Trello代替

Wekan

最近カンバンシステムって、単体で使うんじゃなくていろんなアプリの中で使われる印象なので、今更Trelloだけ使いたい、なんてニーズはないかもだけど、

そこまで複雑でなく小規模なプロジェクトとかだと、意外とTrelloだけでいいよね、みたいなこともあるかな

そういう時は、これを使うといいかも。

Slack代替

Mattermost

ちょっとUI雰囲気が違うだけで、まんまSlackです。絵文字の追加もできるし、APIもあるし。人によって好き嫌い分かれるスレッド機能も、まあ、あのスレッド機能のまま。

その他のSlack代替選択肢
  • Rocket.chat
  • Zulip

この2つは使ったことないので、名前だけ挙げておきます

Zapier/IFTTT/Make代替

n8n

n8nと書いてnodemationと読ませるらしい。初見殺しすぎんだろ。

Zapier使ったことある人はすぐわかると思います

ZapierやIFTTT無料枠あるけど、あれもこれもやり出すとすぐ無料枠埋まっちゃうので、これ結構いいと思うんだけどな。

その他のZapier/IFTTT/Make代替
  • Huggin
  • Windmill

kintone代替

Exment

kintone使ってる会社増えてると思うんだけど、まだまだ1ユーザー1500円ってのは高いので、零細企業は導入し辛いと思う。

で、それの代替になるのがExment。UIがkintoneとは少し違うので代替と言い切れないかもしれないが、

やれることはkintoneのソレと全く同じなので、用途代替はできる。

開発も日本企業なので、UI日本語化されている。LAMP構成なので、レンサバでも動くよ!

Airtable代替

NocoDB

そもそもAirtableって何やねんって人もいるかもしれないけど、kintoneとGoogleスプレッドシートをいいとこ取りして、Trelloとガントチャートを足した感じ。

これのOSS版です。結構再現度高いので良い感じ。

ZoomGoogleMeet・Microsoft Teams代替

Jitsi

これもまあまあいい感じでZoom再現してますZoomの方が新機能の追加早いけど、Jitsiも頑張って追いついている感じです。

ただ、やる内容が複数人でのリアルタイム動画配信なので、サーバースペック回線スペックはまあまあ必要なので要注意。

BigBlueButton

こちらは使ったことないんだけど、よりオンライン授業向けらしい。

Calendly代替

Cal.com

最近よく見かけるようになった、オンラインミーティングとかの予定をブッキングさせるSaaS

あれのはしりがCalendlyで、日本でもいくつかそれのSaaSができてますね。

あれらも無料枠だと1カレンダーだけしかできなかったりするんだけど、これなら好きなだけブッキングさせられます

Intercom、Zendesk代替

Chatwoot
Papercups

ECサイトとか、Webマーケティングを重視してるサイトによくある、画面右下に吹き出しアイコンがあって、チャットウインドウがぴょこっと出てくるやつ。

日本ではWeb接客とか言われてるけど、あれの代表的SaaSがIntercom。Zendeskは、どちらかというと内部ツール向きかな。

これのOSS版がChatwootとPapercups。自社サイトWeb接客入れたいけど、費用抑えたい、って時にどうぞ。

Backlog/Asana代替

OpenProject

この手のツールがないと仕事にならないという人も多いと思います

これまでだとRedmineがそれのOSS版的立ち位置でしたが、さすがにイマドキあのUIはないなぁ、と。

OpenProjectは、Microsoft Projectの代替イメージしてるみたいですが、

ガントチャートカンバンデフォルトで使えるので、BacklogやAsanaの代替にはちょうど良いでしょう。

ただ、そんな高度なことしてるわけではないのに、サーバー要求スペックちょっと高めなのでご注意を。

Google Analytics代替

Matomo

UA廃止GA離れが始まってるとも聞きますが、疎開先として有名。

PHPで動くので、PHPWordPressでできたサイトに一緒に入れちゃってもいいと思う。

HeadlessCMS関連

HeadlessCMSは、データ表示を持たず、フロントエンドAPIを通じてデータを渡すタイプCMSのこと。

このジャンルでは、SaaSだとContentfulが有名だけど、OSSでもいろいろある。

Strapi

Node.js製。歴史があるので、結構いろんなことができる。

WordPressのGutenbergエディターを取り込んだプラグインなんかもある。

User認証も持ってるので、CGM的なサイトを作ろうと思ったらできなくもない。

Directus

これもNode.js製。利用できるDBが幅広く、既存データベース活用できる。

なので、既にPostgresSQLとかでデータを持ってるんだけど、

非エンジニアにもデータを触らせるためのフロントエンドが欲しい、ってニーズに良いかも。

こちらもUser認証デフォルトで持ってる。

Cockpit CMS

PHP製。SQLiteMongoDBで利用可能MySQL/PostgreSQL使えないのがちょっと残念。

Shopify代替

Medusa.js

近年、本腰入れて自社ECサイトをやろうと思うと必ず選択肢に上がるShopify。

インテグレートパートナー向けのエコシステムも充実してるので、取り組み始めるエンジニアシステム会社も多い。

ヘッドレスコマースや越境ECには向いているものの、これをセルフホストしたい、というニーズに応えたのがmedusa.js

ざっと見てみただけだけど、モダン構成で、今時のフロントバックエンドを分けた構成でやりたい、というのには向いている。

プラグインmedusa-marketplace.jsというのもあり、Amazon的なマーケットプレイスも実現可能

Figma代替

Penpot

昨年、Adobeに買収され、デザイナーたちを驚愕させたFigma

先日はAdobe XD終了のお知らせとなり、UIデザイナーたちの不安は募るばかり。

そんな提供企業に振り回されたくないなら、このPenpotでUIデザインしよう。

Figmaほど機能実装はされていないが、まあまあ一通りのことはできる。

Figma代が嵩むとお嘆きの制作会社なんかは、一考の余地あるんじゃなかろうか。

Google Form代替

Oh My Form

企業によっては、コンタクトフォームをたくさん作りたいという会社もある。

例えばセミナーを頻繁に開く企業だったりとか、

人材採用フォーム職種別に細かく分けたい(しかも頻繁に募集職種が変わるとか)

などの要望によって、GUIフォームを作りたい局面がある。

Google Formで大体解決しそうだけど、それをGoogleに頼りたくないならこちら。

まあまあ機能豊富なので、人によってはGoogleFormよりもこちらを好むかも。

Gmail代替

Mailu

DockerベースWebメールUI。送受信に必要ものを、丸っとDockerで用意してくれているので便利。

SalesForce/HubSpot代替

SuiteCRM
Mautic
Erxes

HubSpotは、いわゆるMarketing AutomationCRMを一体にしたツール無料枠もあるが、かなり限定されている。

上記でいうと、Erxesが単体で一番近い機能を持っている。

MauticはMarketing Automationよりの機能が多く、ユーザーサイト上での回遊をビジュアル化してくれたりする。

SuiteCRMはザ・CRMという感じ。SalesForceデフォルトで使う感じに近い。

ツールが分かれてしまうのは辛いところだけど、それぞれにAPIがあるので、うまく繋げられると強力なツールになってくれるはず。

Sendgrid/Mailgun代替

Postal

Webサービス作ってると、メールの通知や一斉配信などがあると思う。

通常これらはSendGridや、AWS SESなどで処理すると思うが、これらにもOSS代替がある。

PostalDockerメール周りのもの全部用意してくれているので、かなり楽。

Jimdo/Wix代替

Microweber

WordPressモダンにしたような感じで、EC機能デフォルトでついてる。マルチサイトも標準。

Jimdo/Wix代替と書いたが、もちろん自分サイトをMicroweberで作ってもいいが、

自前ホスティングして、JimdoWixのようなサービスを始めることもできる。

テンプレートをいくつか作っておいて、Stripeを仕込んでおけば、今日からあなたJimdo/Wixのような事業を始められるわけだ。

STUDIO/Webflow代替

Webstudio

JImdo/WixSTUDIO/Webflowは一緒くたに語られがちだが、明確な違いがある。

前者はプリディファインドなブロックGUI構成するのに対し、後者DOM要素ベースで構築していく。

まりよりHTML/CSSによる細かなデザインコントロールがしやすく、Webデザイナーが親しみやすい。

それのOSS版がWebstudio。まだアルファ版だが、フロントエンドはそれなりによくできているので、

バックエンドを自前で用意してStripeを仕込んでおけば、今日からあなたも(以下略

Facebook代替

friendica

Facebookなんか使わねーよ、っていう人も多いかもしれないが、

特定コミュニティの中でコミュニケーション取るには、FacebookUI機能は優れていると思う。

なので、サークルとか同窓会、あと自治会とかPTAなんかにいいんじゃないだろうか。

LAMPなので、レンサバでもいけると思う。

Netflix代替

Jellyfin

Netflix代替って、Amazon Primeとかじゃねーの、と思われるのかもしれないが、そうではなくて、

あなたNetflixみたいな商売したいならこれを使うといいよ、というのがJellyfin。

いや、そんな商売しないよ、と思うかもしれないが、

使いようによっては、おじいちゃんおばあちゃん向けの子動画配信サービスとして構築するとか、

Stripeと連携して、劇団バンドオリジナル配信サイトを構築するなんかも面白いと思う。

YouTube/Vimeo代替

PeerTube

今更誰もYouTubeVimeoの後追いをしようとはしないでしょうが

複数ユーザーから動画のアップを受け付けて、それを閲覧したい用途もあると思う。

例えば、軽音部で複数バンド練習風景を録画したのを定期的にアップしたりとか。

学習塾で、授業の録画を授業ごとにアップしていったりとか。

YouTube Live/Facebook Live/ニコ生/Twitch代替

Owncast

ZoomGoogle Meetのような双方向ではなく、一対多の一方通行配信

個人的には、企業のウェビナーツールとしての可能性を感じる。(Zoomのウェビナープランとか高いもん)

メールワイズ/Re:lation代替

FreeScout

つのメールドレス複数人運用したい時のツールメールワイズとRe:lationどちらも日本SaaS

FreeScoutはOSSだけど、海外製。一応日本語化もされてるっぽい。

ECサイト顧客問い合わせや、営業チームのプライマリ対応なんかに良いと思う。

Bubble代替

Budibase
AppSmith
ToolJet

Bubbleってなんぞ? という人のためにお伝えしておくと、ノーコードベースWebアプリ開発ツール

データエンティティ設計したら、自動的CRUDを作ってくれて、フォームを配置するというような感じ。

Bubbleはそれ系の老舗で、歴史が長い分ノウハウも溜まっており、連携できるサービスも多い。

ただ、ベンダーロックインされるし、季節的なキャンペーンとかでは、アプリ使用しない期間もサブスク費用がかかる。

Budibaseは、Bubbleの思想に一番近い感じ。凝ったUI必要なければ、ざっくりコレでなんでも作れちゃう

AppSmithも同じような感じだが、これはDBをあらかじめスキーマ定義しておかないといけないところが若干不便かな。

ToolJetはルーティングURL概念がなく、本格使用を諦めたんだけど、最近アップデートしたらしいので、そこのところどうなってるかまた確認ときたい。

他にもこの手のやつあったら、いろいろ教えて欲しい。単純に好きなので。

「こういう用途のやつ、ある?」みたいな質問も歓迎。

見つかったら追記します。

2023-01-24

会話ってキャッチボールじゃないのか

会話ってキャッチボールじゃないの!!!

マッチングアプリでもゲームのフレンド募集でもこっちが会話投げたら投げ返してくれる人がいなさすぎるんだが!!!!?

休み何してますか?って聞いて家で寝てます!ってやつ相手にどうやって会話広げればいいんだよ

せめてあなたは?って聞き返すこともできんのか?

中学校英語時間にやっただろ!アイムファインサンキュー、アンジュー?って!

まあこんなのに手を出してる時点で負けてんだよな

負け犬同士傷を舐め合うしかない

2023-01-22

GPT医療現場で使われる可能性について聞いてみた (つづき2)

「つづき」で気になった箇所を深掘り。確認するに、専門家の監修体制の構築はそれほど難易度は高いように思えなかった。やはり「つづき」で応えてくれた「医療用の学習データGPT側で定期的に用意できるか」が今後の発展のポイントになりそうだ。

まずはAttention機構の深掘り

Me:

GPTのAttention機構って何?

GPT:

Attention機構は、自然言語処理タスクにおいて、入力文の中から重要な部分を選択し処理するためのアルゴリズムです。GPTは、Transformerと呼ばれるモデルアーキテクチャ使用しています。Transformerは、Attention機構を利用して、入力文中の各単語関係性を学習します。これにより、モデル入力文全体を理解し、より質の高い出力を生成することができます

Me:

GPT医療知識が弱いと聞くけど、このAttention機構の仕組みと関係ある?

GPT:

GPTは、学習データに基づいて学習されます。そのため、学習データ医療に関する知識が少ない場合GPT医療に関するタスクに対して劣る結果を生成する可能性があります。Attention機構は、入力文中の各単語関係性を学習するために利用されていますしかし、Attention機構自体は、学習データに基づいて学習されるため、学習データ医療に関する知識が少ない場合、Attention機構医療に関するタスクに対して劣る結果を生成する可能性がありますしかしながら、GPTには大量のテキストデータ学習し、自然言語処理タスクに対して高い性能を発揮する能力があり、知識を持っていない領域でも新しい知識を得る能力を持っています。そのため、医療に関するタスクGPTに与える場合は、十分な医療に関する学習データを与えることで、GPT医療に関するタスクに対しても高い性能を発揮することが期待できます

Me:

ポイントは、Attention機能医療用にチューニングするのではなく、医療データ学習データとして与えることが、GPT医療分野への強化に繋がるんだね。

GPT:

そうですね。Attention機構は、入力文中の各単語関係性を学習するためのアルゴリズムです。GPTは、学習データに基づいて学習されます。そのため、学習データ医療に関する知識が少ない場合GPT医療に関するタスクに対して劣る結果を生成する可能性があります。それに対して、十分な医療に関する学習データを与えることで、GPT医療に関するタスクに対しても高い性能を発揮することが期待できます。そのため、Attention機能医療用にチューニングするのではなく、医療データ学習データとして与えることが、GPT医療分野への強化に繋がるということになります


次ぎに専門家の監修について深掘り

Me:

GPT医学的な正確性や専門性を獲得するには、意思決定者としての専門家の監修が必要という認識だけど、仮にそれが可能になった場合GPT医療現場で使われるようになると思う?

GPT:

GPTは、大量のテキストデータ学習し、自然言語処理タスクに対して高い性能を発揮する能力がありますしかしながら、GPT人間主観判断力を持っていません。そのため、GPTが生成する出力は必ずしも正確であるとは限りません。そのため、医療現場GPT使用する場合は、専門家による監修が必要です。専門家は、GPTが生成する出力が正確であるかどうかを判断し、必要に応じて修正を行うことができます。これにより、GPTが生成する出力が正確であることが保証され、安全かつ効果的な医療提供することができます。そういった意味で、GPT医療現場で使われるためには、専門家による監修が必要であり、GPTはその監修に基づいた情報提示などに利用されることが考えられます

Me:

ユースケースとしては何が考えられる?

GPT:

GPTは、自然言語処理タスクに対して高い性能を発揮する能力があるため、医療現場での様々なタスクに利用することが考えられます。例えば、医療文書自動生成や翻訳、診断支援治療プランの生成、疾患の予防に関するアドバイスの生成などが挙げられます。また、GPTは大量のテキストデータ学習することで、新しい知識を得る能力を持っているため、医学研究や新しい薬物の開発にも利用することができます。ただしながら、これらのタスクにおいてもGPTが生成する出力は必ずしも正確であるとは限らないため、専門家による監修が必要です。

Me:

専門家の監修は、GPTユースケースの内、どのフェーズ必要になると思う?

GPT:

GPTが生成する出力が正確であることを確認するために、専門家による監修が必要になります。そのため、GPTを利用する各フェーズ専門家の監修が必要になることが考えられますこれにより、GPTが生成する出力が正確であることが保証され、安全かつ効果的な医療提供することができます

Me:

フェーズごとにその適用難易度を教えて。

GPT:

フェーズごとに適用難易度は異なりますが、概ね以下のようになりますただし、これらは一般的な話であり、実際には、専門家がそれぞれのフェーズにおいて監修するために必要スキル知識は、それぞれのアプリケーションタスクによって異なります

Me:

しかに生成フェーズにおける出力のパターンは他のフェーズと比べ管理しづらそうだけど、その難易度を調節するための工夫はあったりするの?

GPT:

生成フェーズにおいて、GPTが生成する出力を確認し、修正するための難易度を調節するための工夫には以下のようなものがあります:これらの工夫により、GPTが生成する出力を確認し、修正するための難易度を調節することができます。また、専門家確認する作業効率化することで、より多くのGPTが生成する出力を確認することができ、正確性や適切性が高い出力を得ることができます


最後に出力フォーマットの深掘り

Me:

GPTが生成する出力のフォーマット定義するにはどうすれば良いの?

GPT:

GPTが生成する出力のフォーマット定義するには、次のような方法がありますこれらの方法を組み合わせることで、より正確かつ適切なフォーマット定義することができます

Me:

GPTの出力テンプレート使用方法を教えて。

GPT:

GPTの出力テンプレート使用するには、以下のような手順を踏むことができます
  1. 出力テンプレート作成: GPTが生成する出力のフォーマット定義し、テンプレート作成します。例えば、診断書フォーマットや手術手順の書き方など。
  2. GPTテンプレート学習させる: GPTに、作成したテンプレート学習させます
  3. GPT入力を与える: GPTに、入力として必要情報を与えます
  4. GPTが生成する出力を確認: GPTが生成した出力が、事前に定義したテンプレートに沿っていることを確認します。
  5. 修正を行う: GPTが生成した出力が、事前に定義したテンプレートに沿っていない場合は、修正を行います
このように、GPTの出力テンプレート使用することで、GPTが生成する出力のフォーマットを明確に定義することができ、専門家確認する作業を簡略化することができます。また、テンプレート学習させることで、GPTが生成する出力が予め定義したフォーマットに沿っていることを保証することができます

Me:

GPTテンプレートスキーマの違いを教えて。また、プリセットと何が違うのかも教えて。

GPT:

GPTテンプレートスキーマは、出力フォーマット定義するための方法であり、それぞれ異なる特徴がありますまりテンプレート文章フォーマット定義するのに、スキーマデータ構造定義するのに、使用します。プリセットは、テンプレートスキーマのような事前に定義したパターンデータ構造使用することができます。ただし、プリセットは、具体的には何を指すかは定義が異なります

Me:

Pythonのopenaiライブラリテンプレートスキーマを再定義することは可能?

GPT:

はい、openaiライブラリは、新しいトレーニングデータテンプレートスキーマを含むように、GPTモデルファインチューニングすることができます。 openai.Completion.create()メソッド使用して、GPTモデルファインチューニングすることができ、トレーニングデータテンプレートスキーマファインチューニングパラメータ指定することができます。また、openaiは既にテンプレートスキーマが組み込まれモデル提供しており、それらを直接使用することができます

Me:

`openai.Completion.create()` メソッドテンプレートスキーマを再定義する方法を教えて。

GPT:

openai.Completion.create()メソッド使用して、GPTモデルファインチューニングするには、次のようにします。このように、openai.Completion.create()メソッド使用して、GPTモデルファインチューニングし、テンプレートスキーマを再定義することができます。ただし、学習データとして適切なものを選び、ファインチューニングパラメータを調整する必要がありますので、注意が必要です。また、トレーニングデータとして使用するテンプレートスキーマによっては、モデルの性能が改善しないこともあるため、適切なものを選ぶことが重要です。また、ファインチューニングを行うためには、足りないデータ時間計算リソース必要です。

Me:

当該メソッド用のファインチューニングパラメータは `prompt` を使うんだよね?

GPT:

はい、openai.Completion.create()メソッドでは、promptパラメータ使用して、GPTモデルに対して、生成したい文章フォーマットデータ構造指定することができます。このpromptによって、GPT指定されたフォーマットデータ構造に従って文章を生成するように学習します。このpromptには、テンプレートスキーマを含む文章指定することで、GPT学習させることができます

2023-01-21

AIって、自分じゃカスタマイズできないってなっていくのか?

ファインチューニングゼロショットって技術があるのは知っているが、実際やってみるとそれなりにデータ必要で、かつ良いデータ必要だったりする。

他にそのそもAIにやって欲しいのはそれじゃないんだよなってのがある。

RPAはまだわかる。

ノーコードは出来るとは思ってないけど、マウスなどで動かしているのをキャプチャしてコードに吐いてくれれば、

関数は調べられるようになる。

でもな、今のAIってそんな感じじゃないんだよな。


あとやっぱりクラウドになりそうでな。

ローカルで動かしたい、カスタマイズしたい。

2023-01-17

今のパソコンの性能、中途半端なんだよな

AIが色々出てくるが、学習ファインチューニングしようとすると性能が足りない。

個人パソコンで出来る範囲学習させると、それほど便利な物が出来ない。


メモリーは128GBまでなら個人でも買える価格だが、多くが使い道がない。

仮想環境何個も立ち上げる人くらいか

かといってGPUのVRAMになると容量が全然足りない。

24GB程度か、頑張って40GB程度だろう。


動画だと、エンコードでの画素数を増やすって方向はいいけど、

演出エフェクトを多用するって方向だと、あまり恩恵がない。


レイト話題になったが、ゲームでも拡大して見比べないと違いがわからない程度。

かといって本格的なフォトリアルものだと性能が足りず、未だに8個のGPUレンダリングファームで借りるとかになる。


CPUのコア数増えても、ベンチ以外でフル活用出来るソフトそもそもない。

かと思ったらAIだとCPU全然使われて無くてGPU性能で決まる。

Raw現像くらいかCPU使うの。

ただRaw現像ソフト進化止まってるんだよな。


音楽だとDAWオーケストラなんてやろうとすると何故かまだ止まる。

性能足りてそうなのにリアルタイムが悪いのか、ソフトが悪いのか。


GPU2個以上にしようとすると、コンセントワット数超えるしさ。

2台以上のパソコンクラスタ分散処理ってなると、出来るソフトが限られる。


2022-11-26

絵描きAI、飽きられるのが早くて開発や運用にかかるコスト回収できなさそう

Midjourneyが出て話題になり、Stable Diffusion Ver.1.xはオープンになって話題になったけど、

クオリティに難ありで、一通り触ったら使わなくなった人が多かったかと思う。

日本的にはWaifu Diffusion、NovelAI、(他もあるが省略)など出てきて話題になったものの、

1ヶ月課金して終了する人、という段階があった。


promptで何処まで出せるかというのが、ネット民マンパワーで探られていたが、

そこまで広がらなかったのではないだろうか。

元素法典のようなものも出てきたが一瞬だっただろう。


独自ファインチューニングする人もそこそこ居たが、そちらもすぐに飽きられた印象だ。


Stable Diffusion Ver.2.0は出てきたが、それほど進化したわけでもなかった。

(ものすごい金をかけているのに)


無料なら使うが、毎月金払って使い続ける層は何かしらかの方法費用回収している人だけな気がする。

そしてその費用回収する道が、現状珍しさだけが売りで、Midjourney、NovelAIが示しているように一瞬で飽きられる。


絵が飽きられるので常に開発しないといけない、

運用コストハイエンドGPUを多数使うので運転資金もかかる。

2022-10-14

じじばば向けの介護飲料って強そう

朝に筋トレしたくて、手早く取れる朝食ないかなと考えていた。

よく例として挙がるのはバナナなんだが、まめにスーパーまで買いに行かないといけない時点で却下引きこもり舐めるな!

 

家にはBASE BREADって完全栄養食を謳うパンがあるんだけど、

ワイって食べるの遅いから、朝の乾ききった口でもしゃもしゃパンを食べるのが正直苦痛なんだよね。

 

じゃあ飲むだけで栄養が取れるってやつがいいなと思い、

COMPという完全栄養パウダーを売ってるところを思い出した。

あれはたしか溶かした後の商品も売ってて、

冷蔵庫から出してコップに注ぐ→ごくごく飲んで朝ごはん終わり、ってのができるはず

んで値段を見てみたら、1000ml×6本で7,800円!!!

栄養バランスは考えられているけど、200kcal摂取するのに260円

う~ん…

 

そして完全栄養飲料みたいな単語検索かけてると

もう体が弱って量を食べられない高齢者向けの通販サイトが引っ掛かる。

そこにそういう人たち用の高カロリー飲料が売っている。

エプリッチドリンクとかファインケアとかってやつ。

125mlの小さい紙パック飲料で200kcalが採れて、栄養バランスもそこそこ考えられている。

商品にもよるが1個で145円ぐらい。

いいじゃん!

 

と思い、まだまだ30代で元気だけど

じじばば向けの濃厚流動食を買った私なのでした。

2022-10-08

anond:20221008230231

まあ近い将来教師あり学習を持ち上げてたバカどもがいたらしいぜってなる気はする

次の進歩必要なのはオープンソースファインチューニングじゃなく今できてることを捨てることなんだろうな

2022-09-29

anond:20220929060301

ほぼ画像検索が嫌なら、画像数枚を用意してファインチューニング学習データ作って結果を縛り、img2imgで全体像指定して、生成画像からのimg2imgで方向性と結果の取捨選択をし、部分的画像再生成で細かく調整するような全力の手間をかけてもいいんだよ?

特定イラストを生成させるファインチューニング必要なのは所詮画像数枚なんで、なんなら自作でもこだわりの生成画像でもいいんだし、権利的に今までとそこまで変わるとも思えないよ。使い手次第。

2022-09-23

AIで絵を描くの、限界を感じる

RedditDiscordTwitter、prompt検索サイトなどを漁って、色々promptを試して最初よりかはまともな画像が出るようになったが、

そこまでになっている。

特に75トークンという文字数制限がキツく、時間をかければ、少しずつ良くしていけるって感じがしない。


限界感じて、制限していたアーティスト名も入れてみるようになったが、

世界中に色んなアーティストがいて、Noodle Soup Promptsというprompt支援ツール登録されている、アーティスト名が1000超えていたり、

感情名前が100超えていたりして、組み合わせが多そうに見えるが、

結局の所、自分に刺さるのがあまりない。

というか、それほど真似したものが出てくるわけでもないし、なにより自由度が低い。構図が少ない。


他の人のpromptで参考になることが、ちょっと前より少なくなった。

既に試したものが多くなってきている。


海外勢は、textual Inversionやファインチューニングなどし始めているようだが、いかんせんGPUメモリーが足りない。

2022-09-13

[]2022年8月滅多にホットエントリを出さなドメインからホットエントリ

ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからホットエントリブクマ数順トップ30

anond:20210804000508 でやってみたものと同じ。滅多にホットエントリを出さなサーバからホットエントリと言ったほうが正確なのかな。

ブクマタイトルドメイン
1187腕に針を刺して体内の血糖値を常時記録する「フリースタイルリブレ」で糖質血糖値関係を徹底的に調査したmanualog.net
1097新型コロナ後遺症チートシート対策一覧)longcovid.jp
980ひろゆきとガーシーとFC2高橋氏について - 続・はてなポイント3万を使い切るまで死なない日記kawango.hatenablog.com
929ひろゆき賠償金未払いの真相について(追記あり) - 続・はてなポイント3万を使い切るまで死なない日記kawango.hatenablog.com
888やっぱ「邦ロック」聴いても音楽いたことにならなくない?という話──サマソニにおける差別的言動を通して - 屋上よりleoleonni.hatenablog.com
817Readablereadable.joisino.net
755peco、パートナー・ryuchellの告白に思いつづる「最高の彼氏だったし、最高の旦那さんだった」 - モデルプレスmdpr.jp
695インターネット番組「ポリタスTV」の出演休止/降板についてkyokotominaga.com
664Macユーザーおすすめしたいアプリ2022年8月 - loveMac.jplovemac.jp
650集英社 りぼん 公式サイトribon.shueisha.co.jp
624ラジオライフ2022年10月号の有害図書に関する記事三才ブックスwww.sansaibooks.co.jp
595専門家死ぬまでもう見られない」と評する歴史的偉業…昆虫大好き小学生国内3例目の“トゲナナフシのオス”発見東海テレビNEWSwww.tokai-tv.com
573なれのはてブ - 嫁のはてブが閉鎖しツラいので作りましたnarenohatebu.jp
523異世界おじさん」でたかふみはなぜUR団地に住んでるのか?【こだわりの公団住宅描写】 : さざなみ壊変sazanami.net
509日本アニメ総合データベースアニメ大全」anime100.jp
504SPA認証トークンはlocalStorageでもCookieでもない、Auth0方式はいいねというお話 - @mizumotokのブログmizumotok.hatenablog.jp
495同人音声がすごいことになっている2022 - セミなっちゃxcloche.hateblo.jp
474追悼 安倍晋三元首相 ~国葬にあたり、広く社会で弔意を~ | クラウドファンディング - White Canvassankei.en-jine.com
463mimic(ミミックillustmimic.com
456SEOの学び方 ~ SEO初心者から上級者への道 - SEMリサーチwww.sem-r.com
450ソフトウェア開発者徹夜してはいけない - ソフトウェア工学研究の日々ishiotks.hatenablog.com
447Stable Diffusionをいらすとやファインチューニングするbirdmanikioishota.blog.fc2.com
423Google Mapsレビュー数を伸ばすための取り組みとサービスデザイン考察記事|坪田 朋blog.tsubotax.com
418安倍晋三さんが命がけで開いた戦後レジームからの脱却 統一教会問題はこう解決せよ【山本一郎web-willmagazine.com
405COCOAログを詳細分析できる「COCOAログ.jpcocoalog.jp
405おかっぱ美少年データベース - 蓮のうてなで君を待つgrace-3023.hatenablog.com
381画像生成AI「Stable Diffusion」をGoogle Colabで動かしたメモ - ただいま村ima.hatenablog.jp
370八木啓代ひとりごと 本当に怖い統一教会実態 〜 ラテンアメリカでの暗躍nobuyoyagi.blog16.fc2.com
362ハードワークで人は成長するか - SaaS企業で働くプロダクトマネージャーブログwww.blockchainengineer.tokyo
352Stable Diffusion メモ: キャンバスの縦横比は構図にどれくらい影響するか - jt_noSke's diaryjtnoske.hateblo.jp

anond:20220907202129

2022-09-02

anond:20220902065000

ファインアートは生き残るよ。

写真だのグラビア印刷だのの時点で死ななかったわけだし。

2022-09-01

anond:20220901141635

ファインチューニングだって秒ではできん

それに表面ちょっと捻じ曲げる程度であってAIであることは変えられない

なあ、本当にやってみたことあるか?

AIアプリ作る奴はバカ

他人が作ったモデルファインチューニングさせただけでAIエンジニア名乗ってるクソみたいな日本人ども

2022-08-28

anond:20220828084341

TwitterでStable Diffusionで検索をかけてもpromptを公開している人は殆どおらず、何がいいかからない。

そうなんだよね。

みんな、びっくりするほどpromptを公開していない。

もっと公開して集合的ファインチューニングしていく方が良いと思うし、

制作者の方もそういうのを期待してオープンにしていると思うんだけどなあ。

Stable Diffusionは日本語Web全然違うのか、難しい

Stable Diffusionを触った感想を書いていく。


人物について、日本人っぽさを出すのは難しい。(写真でも絵でも)

Japaneseを入れた場合、表情がおかしい事になる。(変顔みたいなもの

どこから学習データを引っ張ってきているかしらないが、CJKは全部一緒なのかもしれない。

着物といった海外で受けている日本っぽいものを入れたとしても、英語圏向けに活躍している中国人アーティストっぽいのが入る。

ラーメンに関しても、日本ラーメンではなく、欧州中国人韓国人がやっている日本料理屋のラーメンが出てくる。

説明が難しいが具材やらが違う)


アニメ絵を出したいが、正直難しい。

ポケモンドラゴンボールといった米国流行っているのがわかっている作品については、それっぽいのが出てくる。

アニメ絵を出すために、ghibli、shinkai makotoというマジックワードを入れるというノウハウがあるが、

それくらいしか分類に対して単語定義されてないということだろう。


写真しろアニメ絵しろ日本人かわいいと思う感じにはならない。

kawaiiを入れたとしても「?」と悩みそうなのも出てくる。

そもそもkawaiiが指す物にゆらぎがあるので当然だ。

自分が考える「かわいい」に近づけようとして、promptを大量につけたとしても、指す言葉が足りなく感じる。

目が細いので「目を大きく」と指定すると猫目の奇妙な物が生まれる。

目、鼻、口のバランス言葉指定するのを試してみたが、どれも変になった。

言葉で指示出来ない微妙バランスによって成り立ってる物は、調整も難しいのだと思う。

あと指定を多くすればするほど画像クオリティが低くなり破綻している箇所が多くなる。


あとはケモナーも難しかった。

ファンタジーな感じにならない。

獣度が違うというのか?

動物が服を着ている、2足歩行している、顔や腕の毛の量といったのが、

かわいい感じにはならない。


全体的に、Stable Diffusionで簡単に出ることがわかっている物はいいが、

コンセプトやイメージが明確な時は、調整が効かない。

ファインチューニングしたサービス待ちか。



どんな画像を出したいかを指示するpromptについて

他の人のpromptを探していると、「なんでこんな事を書いているんだ?」と思うことがあるが、

おそらく「The-DALL·E-2-prompt-book-v1.02.pdf」という資料に沿っているようだ。

Stable Diffusion用ではないので、どこまで効いているかはわからない。

(実際同じpromptで、DALL-EとStable Diffusionで微妙に傾向が違う)


lexicaで他人のpromptを探すことが出来るが、少し古いっぽい。8月13日付近とか。


TwitterでStable Diffusionで検索をかけてもpromptを公開している人は殆どおらず、

何がいいかからない。

2022-07-11

anond:20220711063944

本気で選ぶセガサターンミニ収録タイトル予想2022夏 - 分析編2

サターンの読者レースから予想を立てる

BEEP! メガドライブ』の後継誌『セガサターンマガジン』にも読者レースは引き継がれた。採点の出典は『サターンゲーム世界ちぃぃぃ! サタマガ読者レース全記録』。

メガドラ時代に較べて全体的に採点がインフレ傾向にあることもあってかソフトの数がとにかく多い。

2022-06-05

安田記念買い目

anond:20220605020950

続き

色々考えたけど、ヴィクトリアマイル組の勝ちはないとすることにした

そういう決め打ちがないと買えん

ヴィクトリアマイルそもそもソダシが圧勝で、レイパレスタートでつまずかなければ勝ち負けしただろう

ソングラインファインルージュもレシステンシアもソダシのレベルにはないでしょう

ヴィクトリアから安田記念勝つなんて、アーモンドアイもグランアレグリアもできなくて、ウオッカしかできてないことが、ヴィクトリア実質6着のソングラインにできるとは思わない


勝つ可能性があるのはカフェファラオダノンキッド、イルーシパンサー、シュネルマイスターの4頭にしぼる

そして連対可能性があるのはこの4頭+レシステンシア、ファインルージュソングライン牝馬勢ということにする

セリフォスはそもそも今まで勝ててないし、クラシック前の評価なんてそこまで信頼してない

3歳のチャンピオンホースってわけでもないんだから、昨年のシュネルマイスター同様、よくて3着では

というわけで、

カフェファラオダノンキッド、イルーシパンサー、シュネルマイスターを軸

それに+レシステンシア、ファインルージュソングラインを足した7頭がヒモの、馬連にする

上3種を3枚、次点の3種を2枚ずつ買えばガミにならない

2700

なお、買うかはまだ迷ってる


追記

15時21分

いま上の通り買ったわ

安田記念予想

こんばんは

今週の競馬安田記念ですね

ダービーで満足しちゃったんで安田記念は余裕な気持ちでできます

鳴尾記念では勝負3連単を外してしまったので、3連複回収だけで230円トリガミとなって泣きました

朝までプラスになるオッズだったのよ

まあ、8レースエルパソ単勝で勝ったから微プラスなのでいいんです

さて、安田記念ですが、色々吟味した結果、スルー推奨となりました

テレビの予想家もあやふやなことしか言ってない

アンカツ含むネットの予想家も、斤量軽い方がワンチャン、とかその程度の話しかしない

結局のところ、実力が抜きん出た馬がいなくて、レース展開や当日の馬の気分次第でどうとでもなるレースって感じがしま

10時間を戻してやり直したら、10回とも違う着順になるでしょう

そんなレースに予想なんか無意味です

というわけで、なるべくすり抜けが出ない買い方だけ探すことにしました

3連複で考えると100通りだか出てくるので、お買い上げが1万円個えそうです

わからんレースに1万賭けるのはいやなので、これはなしです

となるとまずは枠連です

ファオンルージュとイルーシパンサーの入った4枠

ソングラインソウルラッシュセリフォスの入った7枠が中心

そして調子さえよければ本命間違いなしのシュネルマイスターの5枠

この組み合わせ、4-7. 4-5. 5-7. 7-7. 4-4は、4-7さえ2つ買えばトリガミになりません

全部で6口、最低払い戻し7.0倍なので、600円で最低100円、最大1470円儲かる見通し

比較的堅い結果になればこれでおーけー

ですが、一発穴あけで勝ちまであるカフェファラオダノンキッド、レシステンシア、ナランフレグあたりをケアできません

このへんの馬を切れる人は枠連でいいでしょう

でもさすがに切れないよね


次に複勝

上の枠連600円に、カフェファラオ複勝1点添えてもガミらない

またはナランフレグ複勝つけてもガミらない

でも、ダノンキッド複勝つけたらガミる

システンシアも

そうすると上記の枠買いと絡まず、本命枠以外の複勝だけで攻める案

カフェファラオ6.0倍、ダノンキッド3.8倍、レシステンシア4.3倍、ナランフレグ6.9倍

どれか諦めないとうまくいかなそう

諦めてもいいんだけどねー



で、

次に考えたのはこれ

ヴィクトリアマイルから安田記念は、あのアーモンドアイもグランアレグリアも取りこぼしてる

エロリットもそう

いくらソングラインファインルージュが強くても、グランアレグリアを超える馬とは思えない

てことはさすがに勝てないでしょ

一週長いだけのNHKマイルカップセリフォスも善戦まりと思う

そうすると必然的に、買い方としては単勝を狙うことになる

ヴィクトリアマイルNHKマイルカップ組は勝てないとするなら、勝つのは別路線の十分間隔が空いた有力馬


今回は、カフェファラオダノンキッド、イルーシパンサー、シュネルマイスターソウルラッシュナランフレグあたりかと思う

この6頭の単勝だけ勝っても、どれかが勝てばガミらない

カフェファラオ1枚、ダノンキッド2枚、イルーシパンサー3枚、シュネルマイスター4枚、ソウルラッシュ2枚、ナランフレグ1枚で、総額1300円、ガミらず最低350円、最大1900円の儲けになる

もっと攻めるなら、

カフェファラオ4枚、ダノンキッド5枚、イルーシパンサー11枚、シュネルマイスター13枚、ソウルラッシュ6枚、ナランフレグ2枚

とかで、計4100円でどれも2000円前後の儲け

これはありかなーって思ったけど知らんわ


多分、買わないと思います

買った人は各々の考えとおすすめ教えてください!

ログイン ユーザー登録
ようこそ ゲスト さん