「ファイン」を含む日記 RSS

はてなキーワード: ファインとは

2023-06-19

唐突名前を伏せたLoRAモデル出会った

正確にはLoRAモデルじゃないけど。

クズの夜さん( https://twitter.com/hoshikuzu_yoru )の絵でファインチューニングしたであろうモデルを見かけた。

https://huggingface.co/chenxluo/QteaMix

https://civitai.com/models/50696/qteamix-q

https://pixai.art/model/1625831821812984094

ちちぷいやAIクターズみたいな感じのサイトって海外にもあるのかしらと調べて、

PixAIというサイトがあるのかとなって回っていると、たまたま知ってる人のを見かけたので複雑。。

追記

調整がなされ、若干似ない形になった。うーん…

2023-06-15

AIイラストって進歩緩やかになった感がある

絵が出力出来ても、お金にならないからなのか、面倒なことが多いからなのか、

ChatGPTインパクトが大きすぎたのか、GPTに向かう人が多くなった。

なんJ見ててももう飽きてそう


静止画はもうチューニングばかり。

一番最初モデルが良ければ、ファインチューニングで絵柄などを差し替えが出来るが出来ないものは出来ない。

BLIP+U-netでの制御だともう似たようなのばかりになる。Controlnet制御も変になることが多い。


写真風もライティングが似たようなのばかり。

2023-05-24

anond:20230524130343

言いたいことはわかる、1+1=レベルの初歩的な内容ですら彼らは間違えることはある

ただ、AI分野では(人間と逆で)抽象思考よりも直接的な問題の方が難易度が高いって発見もある

生物にとって必要身体動作や、シンプル思考の方に人間の脳は発達しているからとされてる

なので「最終的に」それらの問題を間違えなくなれば、そしてプラグインファインチューニング専門性付与すれば、

どれほど遠回りでも解決自体は同様に可能なんじゃないか? と思ってる

まぁ、膨大な計算量・学習量を確保すれば規模だけでも力押しで解決可能なのがスケーリング則だから人類の全情報量学習し切ったらどうなるかとかあるし、

別に最適解ではないかもしれないけど

https://twitter.com/ktakahashi74/status/1637759332677980162

anond:20230524125423

人間が「確率的な思考」をしていないかというとそうでもないと思う

しろ曖昧なこと、どうでもいいことに対しては常に確率的だし

GPT-3.5からGPT-4にただ学習量を増やしただけで論理的整合性が大きく向上した辺り、別に今のやり方+プラグイン目的ファインチューニングで十分到達すると思う

まぁ実際的には「無限計算量・無限学習量」は存在しないから、その辺りとの兼ね合いもあるし、別のやり方が出て来る方が先かもしれないけど

明確に教えた重要なことは優先して判断するから確率的な齟齬が減る、っていうのも人間別に同じだから

2023-05-18

anond:20230518102224

かに見た目で判断したのはある。

かっつりババアとおばさんだったので勝手IT知らないと決めてかかってた。

あのなりでファインチューニングだとか、Googleコラブとかでローラ作ってたりするのかもしれん。

2023-04-10

anond:20230409193020

ただまあ、スラブ叙事詩デカいだけで退屈な作品だよね。実際に見に行ったらガッカリした。

スラブナショナリズム西洋芸術文法で描いたらああなるってのは分かるけど、20世紀にもなってやることじゃないよ。

わざわざファインアート時代限界に入り込む必要は無かった。

2023-03-31

AIは、AI学習させるためのデータセットを作るのを楽にしてくれるだろうか

ネットスクレイピングしてきたデータを単純に学習させればAIは賢くなって良い感じの出力出してくれるんでしょ?

と思っていたのだけど、どうも調べていると違っている。


例えば絵描きAIのStableDiffusionで、追加学習させるLoRAがあるが、

顔を中心に切り抜きをする、背景を切り抜くといった手作業必要となっている。

また画像に偏りがあると、それに引きずられる。

キャラクターだと、同一キャラクターを色んな角度から描いた複数枚の画像必要になるが、

ある角度ばかり多いとそれに引きずられるといった感じだ。


写真だと、オブジェクト検出くらいだと、人や建物くらいの大雑把なカテゴリー検出では既に駄目で、

写真ピクセル範囲を検出してタグを付けないといけないし、

髪型名前や、ファッション名前など、タグ付けするのに知識限界を感じる。

(ググれバカ、ChatGPTに聞けばいいという人は是非とも網羅的にタグ付けしたデータセットを出して人類に貢献して欲しい)


そして、ネットにはそれほど高品質データは、案外ないのではないか

フォトリアル人物写真を出したいとした場合、光をどのように当てるのかという知識は、普通の人には無い。

ストロボ直射、MoLAのようなオパライトなのか、白ホリで2,3mディフューザーで撮ったのか、画像範囲のものから推測しないといけない。

タグ付け出来るものだろうか。


ChatGPTの質疑応答が凄いというので、オープンモデルも出てきているが、

ファインチューニングするのに、質問と回答をセットにしたデータセットを作らないといけないというのを見た。

単純にドキュメント食わせれば、良い感じに質問答えてくれるようになるんじゃないの?

と思ってたら違ってたわけだ。


本当にAIAI学習させるためのデータセットを楽に作るためのツールを作ってくれるだろうか

2023-03-07

anond:20230307160949

ファインチューニングしたモデルには勝てないと思うよ

少なくともパラメータ数が人間シナプス数を超えるまでは

人間世界に最強最高万能の天才は現れず「専門家」がいる理由

まあ人間シナプスも全部が知的作業やってるわけじゃなくて8割くらい筋肉内臓制御に使われてたりするかもしれんけど

もうこれからは何らかの申請書は提出前に日本語特化GPTモデルを通すことになるだろう

報告書GPTに書かせりゃいい

イイ感じにファインチューニングできたら税金チューチュー団体に売れそう

2023-03-06

Stable Diffusionって、画像から物の形状どうやって認識してるのだろう

DreamBoothでファインチューニングする時は、既に学習しているモデル認識しているので、

学習させたい画像キャプションを食われば良いってのはわかる。


新しいキャラクター学習させる場合でも、もう殆どのパーツは既にモデル認識していて、

形状なり色が違うだけだから、それに差し替えるって感じだと理解している。


からないのは、まっさらモデル場合、512x512pixのうち、単語がどの場所を指しているかからないと思うんだよな。

一回、誰かピクセル単位アノテーションしたのだろうか。

生成AI人間の探求心への信頼

現状の生成系のソフトウェアの仕組みと限界理解している者であっても、これら生成AIがもたらす利害の見積全然合わないのなんでだろう?と思っていた。その原因の一つが何となくわかった。

かつてOSSソフトウェア進化を加速させたように、アートにおいても技術の共有が進化を促すという展望を持てるかどうかだ。

OSS流行っても先進的なソフトウェアを書ける人や、プログラム自分で書き始める人が絶えることはなかった。一部のAI開発者たちは同じことがアートの分野でも起きると信頼している。

先進アーティストは生成AI進歩必要作品(生成AIがまだ知らない芸術)を開発し続け、生成AIはそれを強制的OSSとして取り込み、取り込んだ生成AIベースにまた新たなアート生まれる。

本当にそんな事が起きるだろうか?

俺はそれを信じることができない。特にファインアートの分野において。

生成AI時代最先端に追いつけるのに、生成AI+1を作る技術を磨く人は現れるだろうか。プログラマープログラムの書き方を学ぶことは収入を得る手段を学ぶことでもあったが、生成AI場合AIを使う技術+1を目指す技術はかなりジャンルが違う。+1を目指す行為道楽となり、進化が減速するのではないか

また生成AIで作れるものに、人々は価値を感じるのであろうか。プログラム生産性を上げるための手段であり、コピーされれば世の仕事が減るという価値を自ら持っていた。アートにその機能は無い。アート価値は鑑賞者に与える感情などの情報にあり、その面ではむしろ「誰でもは作れない」ことは有利に働いた。ありふれたもの感情的な価値を人は感じられず、時代遅れのものとして忘れ去られるのではないか

あとはまあ、一つ目と若干被るのだがアート基本的に衆目に公開されるものである以上、AIが生まれ現代以降のアートは目に見える部分の技術すべてをAI学習される。そのような環境OSSのような良いサイクルが起きるかは激しく疑問。それができるならすべてのソフトウェアプログラムは公開されるべきだが、事実そうなっていないし。


こういった不安人間技術の探求をやめてしまうことへの懸念が生成AIに対する態度の差の原因の一つだろう。

より商業的、より応用美術的な分野においては生成技術が魅力的なのは確かなのだが。

2023-02-14

ChatGPTがプロパガンダ利用される未来

「ChatGPTが年収2400万円のレベル3エンジニアとして合格する」から導き出したい主張は「お前よりも給料が高いからお前よりも優秀であり、言っていることはお前より正しい」であり、もちろんこの主張は詭弁

bingに組み込まれAIに対して、特定政治勢力にとって都合の良い主張をするようにファインチューニングされることは容易に予想でき、頭の悪い層はコロッとAIに騙されてしまう。

2023-02-11

anond:20230210203737

服はミニマムにしたくて、今のシャツパンツは、①UNIQLO エクストラファインコットン オーバーサイズ スタンドカラーシャツ(3枚)、②UNIQLOタックテーバードパンツワイドフィット)黒とダークグレー1本ずつ……のみになっています

俺の服なんか、誰も気にしていない。

毎日とても楽です。

2023-02-06

[] AGIって結局どうなったの?

誇大広告現実の違いを理解する必要がある」これはAIしろ量子コンピュータしろ言えることだ。

ロケットに関しても、火星移住するようなレベルに達するのかというと、それよりも地球上で様々な問題顕在化するのが先だろう。

AGIについては、誰もその方法を知らないと言える。ここ10年で起こったことを踏まえたら、それはヒントにはなるだろうが、その多くは非常に単純な技術である

2030年にAGIが誕生する可能性はどのぐらいあるのか。50%でも希望的観測だと考えている。

ディープフェイク、チャットボット音声合成画像生成など色々あるように思うが、本質は「transformerにポン」だ。進歩しているのは莫大な計算資源を扱う人間スキルであり、数学的な進歩はそれほどあったとは思わない。

シンギュラリティ!」と発狂しながら言っている他界系は沢山いるが、「特定能力を持ったAI仕事配備して何でも自動化する」ということが可能になる範囲には確かに興味がある。

例えば「新しい漫画を作りたい、そのために必要リソースを設定してアウトプットを出してくれ。ストーリーは大体こんな感じだ」とAI命令する。「リソース見積もりができました。それを実行するためには500ドル必要です。支払いますか」「はい。支払いますポチ」「しばらくお待ちください...出力がダウンロードできます」みたいなものだ。

現在アレクサやらSiriやらは全然ダメで、特殊化されすぎているし、仕様もなんとなく投げやりである。この方向ではAGIにはなりそうもない。「人の声」なんてインターフェイス部分は本質ではない。

GPTなどの巨大言語モデルは、学習後のパラメータが巨大ではあるものの、ソースコードはとても単純で短い。

まり今後進歩が望めるとすれば、一つはハードウェア的な進歩であり、1)ハードウェア能力, 2)ハードウェア価格, 3)ハードウェアが誰でも使いやすくなる、といった方向だろう。

AI最先端企業で働く連中は「集団思考」に陥っており、それを避けるために独立して研究開発する人々もいる。投資先としての魅力があるかはわからないが、一つは潤沢にハードウェアを使えるかどうかが鍵だろう。

しかダメ投資先とは、「OpenAIAPIを使ってちょっぴりファインチューニングして画像生成とテキスト生成をしました」というタイプの連中だ。これは一時的炎上資金は貰えるかもしれないが、優位性がすぐに失われる。

優位性という意味では、メインストリームではないアイデア模索しているところも投資先としては魅力的かもしれない。

2023-02-02

anond:20230202214419

ワークマン。笑

フィールドコアとか書いてある服ダザダサのダサで着てられないでしょうが。笑

ファインドアウトじゃあなんいんだよ

ファインドアウトなんて書いてある服着てるのファインドアウトされたら社会的死ぬしょうが!笑

2023-01-26

画像生成AI流行ってることをお前に教える2(階層マージ・LoRA編)

前回:anond:20221129215754

前回の投稿から状況がめまぐるしく変わっている。

前回紹介したAnythingv3を投稿者が削除したり関係の無い第三者Anythingv4や4.5を勝手リリースしたり…(しかマージモデルだとか)

増田も追いかけきれていないが追いかけてるぶんは自分のためにここでまとめておく。

基本モデル

NAIリークモデルAnythingv3に関しては前回を参照。

インスタモデル

Instagram投稿されている画像学習させたモデル総称

実在人物画像学習しているため人物の体型をより正確に描画させることができる。

cafe-instagramやzeipher-f222など複数存在し、Basil_Mixのようなアジア人に特化したもの存在する。

後述するマージモデルベースの一つ。

マージモデル(階層マージ)

モデル同士を混ぜるマージモデルに進展があった。

U-NET階層ごとにマージを行う階層マージというマージ手法が考案されたからだ。

これにより実写モデルベースに見た目をアニメ風にマージするという方法が採れるようになった。

流行っているモデルシリーズを二つ挙げてみる。

AbyssOrangeMixシリーズ

5chなんU(なんJもしくはなんGのパートスレ向けの板でVIPに対するパー速のような板)の住民作成した階層マージモデル

現在はBasil_MixとAnythingv3を階層マージしている。

このモデルには派生版があり、nsfw版やhard版は上記マージモデル(通称base)にNAIリークモデルやGape60を混ぜたものらしい。

Gapeについては前回の記事を参照。

 

NAIのように長いネガティブプロンプトを設定しなくても綺麗な絵を出すことができる。

7th_layerシリーズ

リアルよりになったAbyssOrangeMixを漫画アニメ向けにファインチューンしたモデル

Abyss→深界七層(メイドインアビス)→7th_layerということらしい。

アニメ寄りなA、漫画寄りなB、より漫画寄りで破綻やすいCの三種類がある。

Anything系のような中華で好まれる独特の厚塗りではなく比較的パキっとした塗りの絵が出るので個人的には一番好き。

 

他にもいろんなマージモデルがあるが、だいたいがNAIリークモデルAnythingv3と実写系モデルを混ぜたりそれにファインチューンをかけたりしたモデルだ。

Anythingv3もNAIリークモデルベースからなんだかんだいってNovelAIが作ったモデルはまさに特異点的な存在なのだろう。

LoRA

Low-rank Adaptation for Fast Text-to-Image Diffusion Fine-tuningの略で、

Dreamboothの簡易版のようなものとされているが実はDBとは似て非なる技術らしい。

DBよりも短い時間かつ省メモリ環境学習可能で、生成されるファイルも30~200MB程度とHypernetworkとそこまで変わらず一定以上のクォリティで追加学習を行えるようになった。

何よりもVRAMが8GB程度のグラボでも学習できるようになったのが大きい。

現在目的ごとに大きく分けて3種類のLoRAがある。

Style

特定の作者の画像学習させることでその画風を再現するためのLoRA。

従来はHypernetworkで行っていた。

Concept

特定のものやこと(例:ふたなり)を学習させるためのLoRA。

NovelAIやその派生モデルでは困難だった種付けプレスや断面図などの構図の再現可能となった。

Character

キャラクター再現するLoRA。

従来は主にDBで行っておりモデルの配布に苦労していたがLoRAによって配布が非常に楽になった。

 

なお、LoRAは同時に複数適用させることもできるため

士郎正宗風の絵柄でふたなりナンジャモ」という画像を生成することもできる。

 

またLoRAはHypernetworkのようにモデルを選ばないが、NAIリークモデル学習ベースにすると破綻しづらいらしい。

というか今流行っているモデルはほぼNAIリークモデル血筋が入っているので馴染みやすいんだろう。

そのほか

HuggingFace

https://huggingface.co/

アメリカの謎のベンチャー企業通称🤗。

同社が運営しているHuggingFace HUBユーザ登録すれば無料無限AI学習モデル(1ファイル2GB~7GB)をアップロードできる上回線も異常に高速であるため重宝されている。

モデルマージなどでストレージが圧迫されているローカル民にとっては救世主のような存在

資金源は謎だが、2022年5月に2億ドル調達しているのでストレージ無尽蔵に増やせるらしい。知らんけど。

SAFETENSOR

HuggingFaceが考案したモデルファイルファイル形式

実行コードを含んでいることもあり従来のckptモデルしょっちゅうトロイの誤検出が起きていたが、

SAFETENSOR形式モデルは実行コードを含まないため安全であるとされる。

🎈

スカトロ、転じてウンコのもののこと。由来は割愛する。

Baloon_MIXというスカトロ特化のマージモデルもあるらしい。

VPS自宅サーバーにインストールしたいSaaS代替Webアプリ38選

シェアウェア(という表現はおいておいてのやつ。https://anond.hatelabo.jp/20230124045812)の記事面白かったので、自分の得意分野の領域でいろいろ紹介します。

基本的に、SaaSサービスは便利だけど、あれもこれもと契約していったらサブスク破産するので、

ものによってはセルフホストした方がいいと思ってる派。

Dropbox/GoogleDrive/box代替

NextCloud

もともとownCloudっていうDropbox代替があったんだけど、そこから分派して今も機能開発が続いている。

興味深いのはLAMP構成なので、VPS自宅サーバーじゃなくても、レンサバで動くのがいいよね。

データ保存領域オブジェクトストレージ(S3互換)も利用できるので、例えばWasabiなんかと契約してお安く済ませてしまうのも全然アリかと。

Trello代替

Wekan

最近カンバンシステムって、単体で使うんじゃなくていろんなアプリの中で使われる印象なので、今更Trelloだけ使いたい、なんてニーズはないかもだけど、

そこまで複雑でなく小規模なプロジェクトとかだと、意外とTrelloだけでいいよね、みたいなこともあるかな

そういう時は、これを使うといいかも。

Slack代替

Mattermost

ちょっとUI雰囲気が違うだけで、まんまSlackです。絵文字の追加もできるし、APIもあるし。人によって好き嫌い分かれるスレッド機能も、まあ、あのスレッド機能のまま。

その他のSlack代替選択肢
  • Rocket.chat
  • Zulip

この2つは使ったことないので、名前だけ挙げておきます

Zapier/IFTTT/Make代替

n8n

n8nと書いてnodemationと読ませるらしい。初見殺しすぎんだろ。

Zapier使ったことある人はすぐわかると思います

ZapierやIFTTT無料枠あるけど、あれもこれもやり出すとすぐ無料枠埋まっちゃうので、これ結構いいと思うんだけどな。

その他のZapier/IFTTT/Make代替
  • Huggin
  • Windmill

kintone代替

Exment

kintone使ってる会社増えてると思うんだけど、まだまだ1ユーザー1500円ってのは高いので、零細企業は導入し辛いと思う。

で、それの代替になるのがExment。UIがkintoneとは少し違うので代替と言い切れないかもしれないが、

やれることはkintoneのソレと全く同じなので、用途代替はできる。

開発も日本企業なので、UI日本語化されている。LAMP構成なので、レンサバでも動くよ!

Airtable代替

NocoDB

そもそもAirtableって何やねんって人もいるかもしれないけど、kintoneとGoogleスプレッドシートをいいとこ取りして、Trelloとガントチャートを足した感じ。

これのOSS版です。結構再現度高いので良い感じ。

ZoomGoogleMeet・Microsoft Teams代替

Jitsi

これもまあまあいい感じでZoom再現してますZoomの方が新機能の追加早いけど、Jitsiも頑張って追いついている感じです。

ただ、やる内容が複数人でのリアルタイム動画配信なので、サーバースペック回線スペックはまあまあ必要なので要注意。

BigBlueButton

こちらは使ったことないんだけど、よりオンライン授業向けらしい。

Calendly代替

Cal.com

最近よく見かけるようになった、オンラインミーティングとかの予定をブッキングさせるSaaS

あれのはしりがCalendlyで、日本でもいくつかそれのSaaSができてますね。

あれらも無料枠だと1カレンダーだけしかできなかったりするんだけど、これなら好きなだけブッキングさせられます

Intercom、Zendesk代替

Chatwoot
Papercups

ECサイトとか、Webマーケティングを重視してるサイトによくある、画面右下に吹き出しアイコンがあって、チャットウインドウがぴょこっと出てくるやつ。

日本ではWeb接客とか言われてるけど、あれの代表的SaaSがIntercom。Zendeskは、どちらかというと内部ツール向きかな。

これのOSS版がChatwootとPapercups。自社サイトWeb接客入れたいけど、費用抑えたい、って時にどうぞ。

Backlog/Asana代替

OpenProject

この手のツールがないと仕事にならないという人も多いと思います

これまでだとRedmineがそれのOSS版的立ち位置でしたが、さすがにイマドキあのUIはないなぁ、と。

OpenProjectは、Microsoft Projectの代替イメージしてるみたいですが、

ガントチャートカンバンデフォルトで使えるので、BacklogやAsanaの代替にはちょうど良いでしょう。

ただ、そんな高度なことしてるわけではないのに、サーバー要求スペックちょっと高めなのでご注意を。

Google Analytics代替

Matomo

UA廃止GA離れが始まってるとも聞きますが、疎開先として有名。

PHPで動くので、PHPWordPressでできたサイトに一緒に入れちゃってもいいと思う。

HeadlessCMS関連

HeadlessCMSは、データ表示を持たず、フロントエンドAPIを通じてデータを渡すタイプCMSのこと。

このジャンルでは、SaaSだとContentfulが有名だけど、OSSでもいろいろある。

Strapi

Node.js製。歴史があるので、結構いろんなことができる。

WordPressのGutenbergエディターを取り込んだプラグインなんかもある。

User認証も持ってるので、CGM的なサイトを作ろうと思ったらできなくもない。

Directus

これもNode.js製。利用できるDBが幅広く、既存データベース活用できる。

なので、既にPostgresSQLとかでデータを持ってるんだけど、

非エンジニアにもデータを触らせるためのフロントエンドが欲しい、ってニーズに良いかも。

こちらもUser認証デフォルトで持ってる。

Cockpit CMS

PHP製。SQLiteMongoDBで利用可能MySQL/PostgreSQL使えないのがちょっと残念。

Shopify代替

Medusa.js

近年、本腰入れて自社ECサイトをやろうと思うと必ず選択肢に上がるShopify。

インテグレートパートナー向けのエコシステムも充実してるので、取り組み始めるエンジニアシステム会社も多い。

ヘッドレスコマースや越境ECには向いているものの、これをセルフホストしたい、というニーズに応えたのがmedusa.js

ざっと見てみただけだけど、モダン構成で、今時のフロントバックエンドを分けた構成でやりたい、というのには向いている。

プラグインmedusa-marketplace.jsというのもあり、Amazon的なマーケットプレイスも実現可能

Figma代替

Penpot

昨年、Adobeに買収され、デザイナーたちを驚愕させたFigma

先日はAdobe XD終了のお知らせとなり、UIデザイナーたちの不安は募るばかり。

そんな提供企業に振り回されたくないなら、このPenpotでUIデザインしよう。

Figmaほど機能実装はされていないが、まあまあ一通りのことはできる。

Figma代が嵩むとお嘆きの制作会社なんかは、一考の余地あるんじゃなかろうか。

Google Form代替

Oh My Form

企業によっては、コンタクトフォームをたくさん作りたいという会社もある。

例えばセミナーを頻繁に開く企業だったりとか、

人材採用フォーム職種別に細かく分けたい(しかも頻繁に募集職種が変わるとか)

などの要望によって、GUIフォームを作りたい局面がある。

Google Formで大体解決しそうだけど、それをGoogleに頼りたくないならこちら。

まあまあ機能豊富なので、人によってはGoogleFormよりもこちらを好むかも。

Gmail代替

Mailu

DockerベースWebメールUI。送受信に必要ものを、丸っとDockerで用意してくれているので便利。

SalesForce/HubSpot代替

SuiteCRM
Mautic
Erxes

HubSpotは、いわゆるMarketing AutomationCRMを一体にしたツール無料枠もあるが、かなり限定されている。

上記でいうと、Erxesが単体で一番近い機能を持っている。

MauticはMarketing Automationよりの機能が多く、ユーザーサイト上での回遊をビジュアル化してくれたりする。

SuiteCRMはザ・CRMという感じ。SalesForceデフォルトで使う感じに近い。

ツールが分かれてしまうのは辛いところだけど、それぞれにAPIがあるので、うまく繋げられると強力なツールになってくれるはず。

Sendgrid/Mailgun代替

Postal

Webサービス作ってると、メールの通知や一斉配信などがあると思う。

通常これらはSendGridや、AWS SESなどで処理すると思うが、これらにもOSS代替がある。

PostalDockerメール周りのもの全部用意してくれているので、かなり楽。

Jimdo/Wix代替

Microweber

WordPressモダンにしたような感じで、EC機能デフォルトでついてる。マルチサイトも標準。

Jimdo/Wix代替と書いたが、もちろん自分サイトをMicroweberで作ってもいいが、

自前ホスティングして、JimdoWixのようなサービスを始めることもできる。

テンプレートをいくつか作っておいて、Stripeを仕込んでおけば、今日からあなたJimdo/Wixのような事業を始められるわけだ。

STUDIO/Webflow代替

Webstudio

JImdo/WixSTUDIO/Webflowは一緒くたに語られがちだが、明確な違いがある。

前者はプリディファインドなブロックGUI構成するのに対し、後者DOM要素ベースで構築していく。

まりよりHTML/CSSによる細かなデザインコントロールがしやすく、Webデザイナーが親しみやすい。

それのOSS版がWebstudio。まだアルファ版だが、フロントエンドはそれなりによくできているので、

バックエンドを自前で用意してStripeを仕込んでおけば、今日からあなたも(以下略

Facebook代替

friendica

Facebookなんか使わねーよ、っていう人も多いかもしれないが、

特定コミュニティの中でコミュニケーション取るには、FacebookUI機能は優れていると思う。

なので、サークルとか同窓会、あと自治会とかPTAなんかにいいんじゃないだろうか。

LAMPなので、レンサバでもいけると思う。

Netflix代替

Jellyfin

Netflix代替って、Amazon Primeとかじゃねーの、と思われるのかもしれないが、そうではなくて、

あなたNetflixみたいな商売したいならこれを使うといいよ、というのがJellyfin。

いや、そんな商売しないよ、と思うかもしれないが、

使いようによっては、おじいちゃんおばあちゃん向けの子動画配信サービスとして構築するとか、

Stripeと連携して、劇団バンドオリジナル配信サイトを構築するなんかも面白いと思う。

YouTube/Vimeo代替

PeerTube

今更誰もYouTubeVimeoの後追いをしようとはしないでしょうが

複数ユーザーから動画のアップを受け付けて、それを閲覧したい用途もあると思う。

例えば、軽音部で複数バンド練習風景を録画したのを定期的にアップしたりとか。

学習塾で、授業の録画を授業ごとにアップしていったりとか。

YouTube Live/Facebook Live/ニコ生/Twitch代替

Owncast

ZoomGoogle Meetのような双方向ではなく、一対多の一方通行配信

個人的には、企業のウェビナーツールとしての可能性を感じる。(Zoomのウェビナープランとか高いもん)

メールワイズ/Re:lation代替

FreeScout

つのメールドレス複数人運用したい時のツールメールワイズとRe:lationどちらも日本SaaS

FreeScoutはOSSだけど、海外製。一応日本語化もされてるっぽい。

ECサイト顧客問い合わせや、営業チームのプライマリ対応なんかに良いと思う。

Bubble代替

Budibase
AppSmith
ToolJet

Bubbleってなんぞ? という人のためにお伝えしておくと、ノーコードベースWebアプリ開発ツール

データエンティティ設計したら、自動的CRUDを作ってくれて、フォームを配置するというような感じ。

Bubbleはそれ系の老舗で、歴史が長い分ノウハウも溜まっており、連携できるサービスも多い。

ただ、ベンダーロックインされるし、季節的なキャンペーンとかでは、アプリ使用しない期間もサブスク費用がかかる。

Budibaseは、Bubbleの思想に一番近い感じ。凝ったUI必要なければ、ざっくりコレでなんでも作れちゃう

AppSmithも同じような感じだが、これはDBをあらかじめスキーマ定義しておかないといけないところが若干不便かな。

ToolJetはルーティングURL概念がなく、本格使用を諦めたんだけど、最近アップデートしたらしいので、そこのところどうなってるかまた確認ときたい。

他にもこの手のやつあったら、いろいろ教えて欲しい。単純に好きなので。

「こういう用途のやつ、ある?」みたいな質問も歓迎。

見つかったら追記します。

2023-01-24

会話ってキャッチボールじゃないのか

会話ってキャッチボールじゃないの!!!

マッチングアプリでもゲームのフレンド募集でもこっちが会話投げたら投げ返してくれる人がいなさすぎるんだが!!!!?

休み何してますか?って聞いて家で寝てます!ってやつ相手にどうやって会話広げればいいんだよ

せめてあなたは?って聞き返すこともできんのか?

中学校英語時間にやっただろ!アイムファインサンキュー、アンジュー?って!

まあこんなのに手を出してる時点で負けてんだよな

負け犬同士傷を舐め合うしかない

2023-01-22

GPT医療現場で使われる可能性について聞いてみた (つづき2)

「つづき」で気になった箇所を深掘り。確認するに、専門家の監修体制の構築はそれほど難易度は高いように思えなかった。やはり「つづき」で応えてくれた「医療用の学習データGPT側で定期的に用意できるか」が今後の発展のポイントになりそうだ。

まずはAttention機構の深掘り

Me:

GPTのAttention機構って何?

GPT:

Attention機構は、自然言語処理タスクにおいて、入力文の中から重要な部分を選択し処理するためのアルゴリズムです。GPTは、Transformerと呼ばれるモデルアーキテクチャ使用しています。Transformerは、Attention機構を利用して、入力文中の各単語関係性を学習します。これにより、モデル入力文全体を理解し、より質の高い出力を生成することができます

Me:

GPT医療知識が弱いと聞くけど、このAttention機構の仕組みと関係ある?

GPT:

GPTは、学習データに基づいて学習されます。そのため、学習データ医療に関する知識が少ない場合GPT医療に関するタスクに対して劣る結果を生成する可能性があります。Attention機構は、入力文中の各単語関係性を学習するために利用されていますしかし、Attention機構自体は、学習データに基づいて学習されるため、学習データ医療に関する知識が少ない場合、Attention機構医療に関するタスクに対して劣る結果を生成する可能性がありますしかしながら、GPTには大量のテキストデータ学習し、自然言語処理タスクに対して高い性能を発揮する能力があり、知識を持っていない領域でも新しい知識を得る能力を持っています。そのため、医療に関するタスクGPTに与える場合は、十分な医療に関する学習データを与えることで、GPT医療に関するタスクに対しても高い性能を発揮することが期待できます

Me:

ポイントは、Attention機能医療用にチューニングするのではなく、医療データ学習データとして与えることが、GPT医療分野への強化に繋がるんだね。

GPT:

そうですね。Attention機構は、入力文中の各単語関係性を学習するためのアルゴリズムです。GPTは、学習データに基づいて学習されます。そのため、学習データ医療に関する知識が少ない場合GPT医療に関するタスクに対して劣る結果を生成する可能性があります。それに対して、十分な医療に関する学習データを与えることで、GPT医療に関するタスクに対しても高い性能を発揮することが期待できます。そのため、Attention機能医療用にチューニングするのではなく、医療データ学習データとして与えることが、GPT医療分野への強化に繋がるということになります


次ぎに専門家の監修について深掘り

Me:

GPT医学的な正確性や専門性を獲得するには、意思決定者としての専門家の監修が必要という認識だけど、仮にそれが可能になった場合GPT医療現場で使われるようになると思う?

GPT:

GPTは、大量のテキストデータ学習し、自然言語処理タスクに対して高い性能を発揮する能力がありますしかしながら、GPT人間主観判断力を持っていません。そのため、GPTが生成する出力は必ずしも正確であるとは限りません。そのため、医療現場GPT使用する場合は、専門家による監修が必要です。専門家は、GPTが生成する出力が正確であるかどうかを判断し、必要に応じて修正を行うことができます。これにより、GPTが生成する出力が正確であることが保証され、安全かつ効果的な医療提供することができます。そういった意味で、GPT医療現場で使われるためには、専門家による監修が必要であり、GPTはその監修に基づいた情報提示などに利用されることが考えられます

Me:

ユースケースとしては何が考えられる?

GPT:

GPTは、自然言語処理タスクに対して高い性能を発揮する能力があるため、医療現場での様々なタスクに利用することが考えられます。例えば、医療文書自動生成や翻訳、診断支援治療プランの生成、疾患の予防に関するアドバイスの生成などが挙げられます。また、GPTは大量のテキストデータ学習することで、新しい知識を得る能力を持っているため、医学研究や新しい薬物の開発にも利用することができます。ただしながら、これらのタスクにおいてもGPTが生成する出力は必ずしも正確であるとは限らないため、専門家による監修が必要です。

Me:

専門家の監修は、GPTユースケースの内、どのフェーズ必要になると思う?

GPT:

GPTが生成する出力が正確であることを確認するために、専門家による監修が必要になります。そのため、GPTを利用する各フェーズ専門家の監修が必要になることが考えられますこれにより、GPTが生成する出力が正確であることが保証され、安全かつ効果的な医療提供することができます

Me:

フェーズごとにその適用難易度を教えて。

GPT:

フェーズごとに適用難易度は異なりますが、概ね以下のようになりますただし、これらは一般的な話であり、実際には、専門家がそれぞれのフェーズにおいて監修するために必要スキル知識は、それぞれのアプリケーションタスクによって異なります

Me:

しかに生成フェーズにおける出力のパターンは他のフェーズと比べ管理しづらそうだけど、その難易度を調節するための工夫はあったりするの?

GPT:

生成フェーズにおいて、GPTが生成する出力を確認し、修正するための難易度を調節するための工夫には以下のようなものがあります:これらの工夫により、GPTが生成する出力を確認し、修正するための難易度を調節することができます。また、専門家確認する作業効率化することで、より多くのGPTが生成する出力を確認することができ、正確性や適切性が高い出力を得ることができます


最後に出力フォーマットの深掘り

Me:

GPTが生成する出力のフォーマット定義するにはどうすれば良いの?

GPT:

GPTが生成する出力のフォーマット定義するには、次のような方法がありますこれらの方法を組み合わせることで、より正確かつ適切なフォーマット定義することができます

Me:

GPTの出力テンプレート使用方法を教えて。

GPT:

GPTの出力テンプレート使用するには、以下のような手順を踏むことができます
  1. 出力テンプレート作成: GPTが生成する出力のフォーマット定義し、テンプレート作成します。例えば、診断書フォーマットや手術手順の書き方など。
  2. GPTテンプレート学習させる: GPTに、作成したテンプレート学習させます
  3. GPT入力を与える: GPTに、入力として必要情報を与えます
  4. GPTが生成する出力を確認: GPTが生成した出力が、事前に定義したテンプレートに沿っていることを確認します。
  5. 修正を行う: GPTが生成した出力が、事前に定義したテンプレートに沿っていない場合は、修正を行います
このように、GPTの出力テンプレート使用することで、GPTが生成する出力のフォーマットを明確に定義することができ、専門家確認する作業を簡略化することができます。また、テンプレート学習させることで、GPTが生成する出力が予め定義したフォーマットに沿っていることを保証することができます

Me:

GPTテンプレートスキーマの違いを教えて。また、プリセットと何が違うのかも教えて。

GPT:

GPTテンプレートスキーマは、出力フォーマット定義するための方法であり、それぞれ異なる特徴がありますまりテンプレート文章フォーマット定義するのに、スキーマデータ構造定義するのに、使用します。プリセットは、テンプレートスキーマのような事前に定義したパターンデータ構造使用することができます。ただし、プリセットは、具体的には何を指すかは定義が異なります

Me:

Pythonのopenaiライブラリテンプレートスキーマを再定義することは可能?

GPT:

はい、openaiライブラリは、新しいトレーニングデータテンプレートスキーマを含むように、GPTモデルファインチューニングすることができます。 openai.Completion.create()メソッド使用して、GPTモデルファインチューニングすることができ、トレーニングデータテンプレートスキーマファインチューニングパラメータ指定することができます。また、openaiは既にテンプレートスキーマが組み込まれモデル提供しており、それらを直接使用することができます

Me:

`openai.Completion.create()` メソッドテンプレートスキーマを再定義する方法を教えて。

GPT:

openai.Completion.create()メソッド使用して、GPTモデルファインチューニングするには、次のようにします。このように、openai.Completion.create()メソッド使用して、GPTモデルファインチューニングし、テンプレートスキーマを再定義することができます。ただし、学習データとして適切なものを選び、ファインチューニングパラメータを調整する必要がありますので、注意が必要です。また、トレーニングデータとして使用するテンプレートスキーマによっては、モデルの性能が改善しないこともあるため、適切なものを選ぶことが重要です。また、ファインチューニングを行うためには、足りないデータ時間計算リソース必要です。

Me:

当該メソッド用のファインチューニングパラメータは `prompt` を使うんだよね?

GPT:

はい、openai.Completion.create()メソッドでは、promptパラメータ使用して、GPTモデルに対して、生成したい文章フォーマットデータ構造指定することができます。このpromptによって、GPT指定されたフォーマットデータ構造に従って文章を生成するように学習します。このpromptには、テンプレートスキーマを含む文章指定することで、GPT学習させることができます

2023-01-21

AIって、自分じゃカスタマイズできないってなっていくのか?

ファインチューニングゼロショットって技術があるのは知っているが、実際やってみるとそれなりにデータ必要で、かつ良いデータ必要だったりする。

他にそのそもAIにやって欲しいのはそれじゃないんだよなってのがある。

RPAはまだわかる。

ノーコードは出来るとは思ってないけど、マウスなどで動かしているのをキャプチャしてコードに吐いてくれれば、

関数は調べられるようになる。

でもな、今のAIってそんな感じじゃないんだよな。


あとやっぱりクラウドになりそうでな。

ローカルで動かしたい、カスタマイズしたい。

2023-01-17

今のパソコンの性能、中途半端なんだよな

AIが色々出てくるが、学習ファインチューニングしようとすると性能が足りない。

個人パソコンで出来る範囲学習させると、それほど便利な物が出来ない。


メモリーは128GBまでなら個人でも買える価格だが、多くが使い道がない。

仮想環境何個も立ち上げる人くらいか

かといってGPUのVRAMになると容量が全然足りない。

24GB程度か、頑張って40GB程度だろう。


動画だと、エンコードでの画素数を増やすって方向はいいけど、

演出エフェクトを多用するって方向だと、あまり恩恵がない。


レイト話題になったが、ゲームでも拡大して見比べないと違いがわからない程度。

かといって本格的なフォトリアルものだと性能が足りず、未だに8個のGPUレンダリングファームで借りるとかになる。


CPUのコア数増えても、ベンチ以外でフル活用出来るソフトそもそもない。

かと思ったらAIだとCPU全然使われて無くてGPU性能で決まる。

Raw現像くらいかCPU使うの。

ただRaw現像ソフト進化止まってるんだよな。


音楽だとDAWオーケストラなんてやろうとすると何故かまだ止まる。

性能足りてそうなのにリアルタイムが悪いのか、ソフトが悪いのか。


GPU2個以上にしようとすると、コンセントワット数超えるしさ。

2台以上のパソコンクラスタ分散処理ってなると、出来るソフトが限られる。


2022-11-26

絵描きAI、飽きられるのが早くて開発や運用にかかるコスト回収できなさそう

Midjourneyが出て話題になり、Stable Diffusion Ver.1.xはオープンになって話題になったけど、

クオリティに難ありで、一通り触ったら使わなくなった人が多かったかと思う。

日本的にはWaifu Diffusion、NovelAI、(他もあるが省略)など出てきて話題になったものの、

1ヶ月課金して終了する人、という段階があった。


promptで何処まで出せるかというのが、ネット民マンパワーで探られていたが、

そこまで広がらなかったのではないだろうか。

元素法典のようなものも出てきたが一瞬だっただろう。


独自ファインチューニングする人もそこそこ居たが、そちらもすぐに飽きられた印象だ。


Stable Diffusion Ver.2.0は出てきたが、それほど進化したわけでもなかった。

(ものすごい金をかけているのに)


無料なら使うが、毎月金払って使い続ける層は何かしらかの方法費用回収している人だけな気がする。

そしてその費用回収する道が、現状珍しさだけが売りで、Midjourney、NovelAIが示しているように一瞬で飽きられる。


絵が飽きられるので常に開発しないといけない、

運用コストハイエンドGPUを多数使うので運転資金もかかる。

ログイン ユーザー登録
ようこそ ゲスト さん