「api」を含む日記 RSS

はてなキーワード: apiとは

2024-06-07

anond:20240607124959

いいえ、その説明は正確ではありません。MidjourneyとDALL-Eを単純に比較することは適切ではありません。

1. 価格:

- MidjourneyとDALL-Eは異なる料金体系を持っています

- MidjourneyにはDiscordベース無料プランと、商用利用向けの有料プランがあります

- DALL-Eは、APIを通じて利用が可能で、使用量に基づいた料金体系となっています

- したがって、「Midjourneyは、DALL-Eの安価バージョン」という説明は適切ではありません。

2. 技術:

- MidjourneyとDALL-Eは、異なる技術アプローチ実装採用しています

- 両者の詳細な技術的特徴は公開されていませんが、アーキテクチャ学習手法に違いがあると考えられます

- したがって、一方が他方のバージョンであるとは言えません。

3. 画像生成の特性:

- MidjourneyとDALL-Eは、生成する画像特性や傾向が異なります

- Midjourneyは、幻想的でアーティスティックイラストを得意としています

- DALL-Eは、より幅広いスタイル画像生成が可能で、写真のようにリアル画像生成にも強みがあります

4. 開発主体:

- MidjourneyはMidjourney社によって開発されたのに対し、DALL-EはOpenAI社によって開発されました。

- 両者は独立した企業であり、相互に関連するものではありません。

したがって、「MidjourneyはDALL-Eの安価バージョン」という説明は、技術的にも概念的にも正確ではありません。両者は独自の特徴を持つ画像生成AIであり、単純に比較することは適切ではないでしょう。

2024-06-05

状況認識:今後10年の展望 -- はじめに

X (twitter) で SITUATIONAL AWARENESS: The Decade Ahead https://situational-awareness.ai/ というのが回ってきて非常に示唆に富むものだったので、DeepL (無料API経由) で訳してみた。

レオポルド・アッシェンブレナ2024年6月

サンフランシスコに行けば、まず未来が見える。

この1年で、街の話題100億ドルコンピュート・クラスターから1000億ドルクラスター、そして1兆ドルクラスターへと移り変わってきた。半年ごとに、役員室の計画にまたゼロが追加される。その裏では、残りの10年間に利用可能なすべての電力契約と、調達可能なすべての電圧変圧器を確保しようとする熾烈な争いが繰り広げられている。アメリカ大企業は、アメリカ産業力を結集させるために、何兆ドルもの資金を注ぎ込む準備を整えている。ペンシルベニア州シェールフィールドからネバダ州太陽光発電所まで、何億ものGPUが稼働する。

AGI競争が始まったのだ。私たち思考し、推論できるマシンを作りつつある。2025年から26年にかけて、これらのマシンは多くの大学卒業生凌駕するだろう。10年後までには、これらのマシンは私やあなたよりも賢くなり、本当の意味での超知性を手に入れるだろう。その過程で、この半世紀には見られなかったような国家安全保障の力が解き放たれ、やがて「プロジェクト」が始動する。運が良ければ、中国共産党との全面的競争になり、運が悪ければ全面戦争になる。

今、誰もがAIについて話しているが、何が自分たちを襲おうとしているのか、かすかな光明を感じている人はほとんどいない。Nvidiaアナリストは、まだ2024年ピークに近いと考えている。主流派評論家たちは、「次の言葉予測するだけだ」という故意盲目に陥っている。彼らが見ているのは誇大広告といつも通りのビジネスだけで、せいぜいインターネット規模の新たな技術革新が起こるのを楽しむ程度なのだ

やがて世界は目を覚ますだろう。しかし、今現在、状況認識を持っているのはおそらく数百人で、そのほとんどはサンフランシスコAI研究所にいる。運命不思議な力によって、私はその中に身を置くことになった。数年前、このような人々はクレイジーだと揶揄されたが、彼らはトレンドラインを信頼し、過去数年間のAI進歩を正しく予測することができた。この人たちが今後数年についても正しいかどうかはまだわからない。しかし、彼らは非常に賢い人々であり、私がこれまでに会った中で最も賢い人々である。おそらく、彼らは歴史の中で奇妙な脚注となるか、あるいはシラードやオッペンハイマーテラーのように歴史に名を残すだろう。もし彼らが未来を正しく見ているとしたら、私たちはとんでもないことになる。

私たちが見ているものを教えよう。

目次

エッセイはそれぞれ独立したものですが、シリーズ全体として読むことを強くお勧めします。全エッセイPDF版はこちら。

はじめに 【このページ】

歴史サンフランシスコで生きている

I.GPT-4からAGIへOOM(Orders of Magnitude)を数える

2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは~未就学児から~賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドライントレースすると、2027年までに再び未就学児から高校生サイズ質的ジャンプが起こると予想される。

II.AGIから超知能へ:知性の爆発

AI進歩人間レベルでは止まらない。何億ものAGIがAI研究自動化し、10年に及ぶアルゴリズム進歩(5以上のOOM)を1年以下に圧縮することができる。私たちは、人間レベルから超人的なAIシステムへと急速に進化することになる。超知能の威力危険性は劇的なものとなるだろう。

III.課題
IIIa.兆ドルクラスタへの競争

驚異的な技術資本の加速が始まっている。AI収益が急増するにつれ、10年末までに何兆ドルもの資金GPUデータセンター、電力の増強に投入されるだろう。米国の電力生産を数十%増加させるなど、産業界の動員は激しくなるだろう。

IIIb.研究所の封鎖AGIのセキュリティ

米国の主要なAI研究所は、セキュリティを後回しに扱っている。現在、彼らは基本的にAGIの重要な機密を銀の皿に載せて中国共産党に渡している。AGIの秘密とウェイトを国家機関の脅威から守るには膨大な努力必要であり、我々はその軌道に乗っていない。

IIIc.スーパーアライメント

我々よりもはるかに賢いAIシステムを確実に制御することは、未解決技術問題である解決可能問題ではあるが、急速な知能の爆発が起きれば、物事簡単にレールから外れてしまう。これを管理することは非常に緊張を強いられるだろう。

IIId.自由世界勝利しなければならない

スーパーインテリジェンスは、経済的にも軍事的にも決定的な優位性をもたらすだろう。中国はまだゲームから抜け出してはいない。AGIをめぐる競争では、自由世界の存亡がかかっている。我々は権威主義的な大国に対する優位性を維持できるのか?そして、その過程で自滅を避けることができるのだろうか?

IV.プロジェクト

AGIへの競争が激化するにつれ、国家安全保障が関与してくる。アメリカ政府は眠りから覚め、27~28年までに何らかの形で政府によるAGIプロジェクトが立ち上がるだろう。どんな新興企業も超知能を扱うことはできない。SCIFのどこかで、終盤戦が始まるだろう。

V.おわりに

もし我々が正しかったら?

――――――――

私はかつてOpenAIで働いていたが、これはすべて一般に公開されている情報私自身のアイデア一般的な現場知識、あるいはSFゴシップに基づいている。

Collin Burns、Avital Balwit、Carl Shulman、Jan Leike、Ilya Sutskever、Holden Karnofsky、Sholto Douglas、James Bradbury、Dwarkesh Patel、その他多くの方々の有益議論感謝する。初期の草稿にフィードバックをくれた多くの友人に感謝する。グラフィックを手伝ってくれたジョー・ローナン出版を手伝ってくれたニック・ウィテカーに感謝する。

イリヤスーツバーに捧ぐ。

続き I.GPT-4からAGIへ:OOMを数える(1) https://anond.hatelabo.jp/20240605203849

I.GPT-4からAGIへ:OOMを数える (5)

アルゴリズム効率

コンピュートへの大規模な投資が注目される一方で、アルゴリズム進歩も同様に重要進歩原動力であると思われる(そして、これまで劇的に過小評価されてきた)。

アルゴリズム進歩がどれほど大きな意味を持つかを理解するために、MATHベンチマーク高校生競技数学)において、わずか2年間で~50%の精度を達成するために必要価格が下がったことを示す次の図を考えてみてください。(比較のために、数学特に好きではないコンピュータサイエンスの博士課程の学生が40%のスコアを出したので、これはすでにかなり良いことです)。推論効率は2年足らずで3OOMs-1,000倍近く向上した。

https://situational-awareness.ai/wp-content/uploads/2024/06/math_inference_cost-1024x819.png

MATHのパフォーマンスを〜50%にするために必要な推論コストの概算。


これは推論効率だけの数字だが(公開データから推論するのが難しいトレーニング効率の向上と一致するかどうかはわからない)、アルゴリズム進歩は非常に大きく、また実際に起こっている。

この記事では、アルゴリズム進歩を2種類に分けて説明します。まず、「パラダイム内」でのアルゴリズムの改良を取り上げることにしま す。例えば、より優れたアルゴリズムによって、同じパフォーマンスを達成しながら、トレーニング計算量を10倍減らすことができるかもしれません。その結果、有効計算量は10倍(1OOM)になります。(後ほど「アンホブリング」を取り上げますが、これはベースモデル能力を解き放つ「パラダイム拡張/アプリケーション拡張」的なアルゴリズム進歩と考えることができます)。

一歩下がって長期的な傾向を見ると、私たちはかなり一貫した割合で新しいアルゴリズムの改良を発見しているようです。しかし、長期的なトレンドライン予測可能であり、グラフ上の直線であるトレンドラインを信じよう。

アルゴリズム研究ほとんど公開されており、10年前にさかのぼデータがある)ImageNetでは、2012年から2021年までの9年間で、計算効率が一貫して約0.5OOM/年向上しています

https://situational-awareness.ai/wp-content/uploads/2024/06/pareto_frontiers_imagenet_epoch-1024x349.png

アルゴリズム進歩を測定することができます。同じ性能のモデルを訓練するために必要計算量は、2012年比較して2021年にはどれくらい少なくなっているのでしょうか?その結果、アルゴリズム効率は年間0.5 OOMs/年程度向上していることがわかります。出典Erdil and Besiroglu 2022.

これは非常に大きなことです。つまり、4年後には、~100倍少ない計算量で同じ性能を達成できるということです(同時に、同じ計算量ではるかに高い性能も達成できます!)。

残念ながら、研究室はこれに関する内部データ公表していないため、過去4年間のフロンティアLLMのアルゴリズム進歩を測定することは難しい。EpochAIは、言語モデリングに関するImageNetの結果を再現した新しい研究を行っており、2012年から2023年までのLLMのアルゴリズム効率トレンドは、同様に~0.5OOM/年である推定しています。(しかし、これはエラーバーが広く、また、主要なラボアルゴリズム効率公表を停止しているため、最近の上昇を捕捉していません)。

https://situational-awareness.ai/wp-content/uploads/2024/06/llm_efficiency_epoch-1-1024x711.png

Epoch AIによる言語モデリングにおけるアルゴリズム効率推定。この試算によると、私たちは8年間で~4OOM効率向上を達成したことになります

より直接的に過去4年間を見ると、GPT-2からGPT-3は基本的に単純なスケールアップでした(論文によると)が、GPT-3以降、公に知られ、公に干渉可能な多くの利益がありました:

最近リリースされたGemini 1.5 Flashは、"GPT-3.75レベル "とGPT-4レベルの間の性能を提供する一方で、オリジナルGPT-4よりも85倍/57倍(入力/出力)安い(驚異的な利益!)。

公開されている情報総合すると、GPT-2からGPT-4へのジャンプには、1-2 OOMアルゴリズム効率向上が含まれいたことになります

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute_algos-1024x866.png

GPT-4に続く4年間はこの傾向が続くと予想され、2027年までに平均0.5OOMs/年の計算効率、つまりGPT-4と比較して~2OOMsの向上が見込まれます計算効率の向上は、低空飛行の果実を摘み取るようになるにつれて難しくなる一方、新たなアルゴリズムの改良を見出すためのAIラボ資金人材への投資は急速に増加しています。 (少なくとも、公開されている推論コスト効率化は、まったく減速していないようだ)。ハイエンドでは、より根本的な、トランスフォーマーのようなブレークスルーが起こり、さらに大きな利益が得られる可能性さえある。

これらをまとめると、2027年末までには(GPT-4と比較して)1~3OOMアルゴリズム効率向上が期待できることになります

続き I.GPT-4からAGIへ:OOMを数える(6) https://anond.hatelabo.jp/20240605205754

2024-06-04

anond:20240604094937

昔はブラウザ機能拡張でどこにでも付けられたし、いまでもAPIを使えば付けられるはず。

スターが廃れたので目につくところにスターボタンが無くなって、いまでははてブロブクマページくらいにしか残ってない、というだけ。

2024-05-22

anond:20240522193634

別に最初はそれでもいいじゃん。何かの問題課題解決するのにChatGPTのAPIだけ使って解決できるならそれでいいし、足りないならその時また調べるでしょ。

学術的な文脈上記のノリで来られたらオイオイってなるけど、必要性とかの観点で言うならアルゴリズムどうこうは枝葉の話。

だけど老婆心というか古参兵として言いたい事はめっちゃわかるし、今でも情報工学系はやり直したいとは思ってるけど、そのステージではない人に言うのは老害ムーブじゃね?って思ってる。

ワイがおっさん化しつつあるので、初心者や中級者の「やりたい気持ち」はメチャクチャ大事にしたい所存。

anond:20240522190203

俺はね、応用力を身につければそれが最短ルートだって言ってんのよ

atcoderをやるのでもいいしオリジナルWEBサービスを作るのでもいいけど、さすがにchatgptのAPIを使う程度じゃ何も学習してねぇよな

anond:20240522185750

既製APIがないと何もできませんではちょっと複雑な要件出会ったら何もできなくなるって話ね

よくある推薦システム実装だって線形代数ぐらい知らないと話にならんし

anond:20240522183316

例えばさ、ドット積や行列積の演算関数があるとして、それらの関数への入出力の渡し方なんてのは初歩的すぎて話にならないでしょ

バックプロパゲーションフルスクラッチ効率的実装するには?みたいな話だとAPI仕様知識だけじゃ対応できないんだよね

anond:20240522183203

numpyのような基本的演算仕様を知っててもプログラミングはできない

なぜなら数学アルゴリズム知識必要から

数学こそが応用力ある知識であり、APIポローンなんてのは学ばなくてもできる

お前のレベルは低いね

anond:20240522183030

異性もAPIとかシステムコールがあれば、今頃モテモテになれたかもしれないのに…😔

anond:20240522182742

アルゴリズム実装するときにも結局そこで利用する関数命令APIを調べてそれを組み合わせることになるんだけどね

anond:20240522182118

自分がやりたいことを実現する機能を持った関数命令、エンドポイントとその入出力を調べ、利用できるようになること」ができないと、

言語組み込み関数アセンブリ命令セットを正しく効率的に利用することもできないので、

APIを調べてその出力を別のAPIに投げる」というのはアルゴリズムよりも応用の効く能力である

anond:20240522181410

ChatGPTに限らずライブラリフレームワーク機能を呼ぶにしても

APIを調べてそいつが返してくる結果を別のところ(UIやまた別のAPI)に投げる」はプログラミングで一番つかうところだよなあ

高度なアルゴリズムを考えて実装なんて仕事をするのは一握りの人間だけだし、

そういう一握りの人間でも自分アルゴリズムをくみ上げるのはプログラム全体からみればごく一部で、

ほとんどの部分で「APIを調べてそいつが返してくる結果を別のところ(UIやまた別のAPI)に投げ直す」の組み合わせを書いている

anond:20240522180626

api叩いて結果を目的の形で表示できる能力が応用の効かないものだとしたら、何が応用の効くスキルなのか……

anond:20240522173206

まずお前に必要なのはcssでもreactでもなくchatgptのapiの使い方を調べることと、入力されたら出力するだけの簡単アプリの作り方を知ることだ

htmljsという特定分野ではない

ファイルの参照方法dbの使い方だ

pythonとか使えばめんどいuiは省略してターミナルで出来るだろ

やることがぼやけてると一生身につかないぞ

2024-05-19

anond:20240519181101

それだけ動かすのにどれくらいコストかかるんだろう。botは凍結されるだろうから返信はAIに頼るとして、API代はかかるな。後はPythonで何とかなると思うが、アカウント500個動かすのに必要パソコンスペックはどんなもんか。

2024-05-15

世の中にはウンコのようなシステムがあるが、その最たるものとしては複数アプリケーションDBを共有するものだ。

まさに今取り組んでいるプロジェクトがその典型例だ。データ一貫性整合性がとれないようなシステムおむつに包んで汚物入れにいれるべきだ。

DB複数アプリケーションから共有するな。これだけのことを何度言わせるのか。

上記問題解決するために、他のソリューションを導入したりする。

ちがう、そこじゃないんだ。データアプリケーションで閉じろって話だ。

根本的な問題は、要求事項から最適なシステムを作る人の不在だ。

REST API設計も酷いもので、エンドポイントDBテーブルそのままを表しており、トランザクションもクソもない。

そもそもREST APIになってない。

APIデータベースの構造に過度に依存しており、データベースの変更が直接API修正に繋がる。このため、些細な変更でも広範囲に影響が及ぶことになる。

なんでこんな感じにしてしまったのか、正気か?

2024-05-11

デバイス情報: システム & CPU 情報

Device Info は、高度なユーザー インターフェースウィジェット使用してモバイルデバイスに関する完全な情報提供するシンプルで強力な Android アプリケーションです。たとえば、デバイス情報/ 電話情報には、CPURAMOSセンサストレージバッテリーSIMBluetoothネットワークインストール済みアプリシステム アプリディスプレイカメラ温度などに関する情報が含まれます。また、デバイス情報/ 電話情報は、ハードウェア テストデバイスベンチマークを行うことができます

中身 : 👇 👇

👉 ダッシュボード : RAM、内部ストレージ、外部ストレージバッテリーCPU、利用可能センサインストール済みアプリ & 最適化

👉 デバイス : デバイス名、モデルメーカーデバイスボードハードウェアブランド、IMEI、ハードウェア シリアルSIM シリアルSIM サブスクラバーネットワークオペレータネットワークタイプWiFi Mac アドレスビルドフィンガープリント & USB ホスト

👉 システム : バージョン、コード名、API レベルリリース バージョン、1 つの UI バージョン、セキュリティ パッチ レベルブートローダー、ビルド番号、ベースバンドJava VMカーネル言語ルート管理アプリGoogle Play サービスバージョン、Vulkan のサポート、Treble、シームレス更新OpenGL ES およびシステム稼働時間

👉 CPU : Soc - システム オン チッププロセッサCPU アーキテクチャサポート対象ABICPU ハードウェアCPU ガバナー、コア数、CPU 周波数、実行中のコア、GPU レンダラーGPU ベンダー & GPU バージョン

👉 バッテリー : ヘルスレベルステータス、電源、テクノロジー温度電圧と容量

👉 ネットワーク : IP アドレスゲートウェイ、サブネット マスクDNSリース期間、インターフェイス周波数リンク速度

👉 ネットワーク : IP アドレスゲートウェイ、サブネット マスクDNSリース期間、インターフェイス周波数リンク速度

👉 ディスプレイ : 解像度密度フォント スケール物理サイズサポートされているリフレッシュレート、HDRHDR 機能、明るさのレベルモード、画面のタイムアウト、向き

👉 メモリ : RAMRAM タイプRAM 周波数ROM、内部ストレージ、外部ストレージ

👉 センサー : センサー名、センサベンダーライブセンサ値、タイプ、電力、ウェイクアップセンサダイナミックセンサ、最大距離

👉 アプリ : ユーザーアプリインストール済みアプリアプリバージョン、最小 OSターゲット OSインストール日、更新日、アクセス許可アクティティサービスプロバイダレシーバー抽出アプリ Apk

👉 アプリアナライザー : 高度なグラフ使用して、すべてのアプリケーション分析します。また、ターゲット SDK、最小 SDKインストール場所プラットフォームインストーラ、および署名によってグループ化することもできます

👉 デバイス テスト

ディスプレイマルチタッチ懐中電灯、ラウドスピーカー、イヤースピーカーマイク、耳近接、光センサ加速度計、振動BluetoothWI-Fi指紋、音量アップボタン、音量ダウンボタンテストできます

👉 温度 : システムによって指定されたすべての温度ゾーンの値

👉 カメラ : カメラサポートするすべての機能

👉 テーマ : ダークテーマカスタムカラーサポート

👉 カスタマイズ可能ウィジェット : 最も重要情報を表示する 3 つのサイズの完全にカスタマイズ可能ウィジェット

👉 レポートエクスポートカスタマイズ可能レポートエクスポートテキストレポートエクスポートPDF レポートエクスポート

権限 👇 👇

READ_PHONE_STATE - ネットワーク情報を取得するには

CAMERA - 懐中電灯テスト

RECORD_AUDIO - マイクテスト

BLUETOOTH_CONNECT - Bluetooth テスト

READ_EXTERNAL_STORAGE - イヤースピーカーとラウドスピーカーテスト

WRITE_EXTERNAL_STORAGE - アプリ抽出

2024-05-10

Togetter>>>>>任天堂SONY

任天堂にもSONYにもXのAPI料金は払えないのに

Togetterが続いてるのはすごくね

2024-05-05

anond:20240505130439

自分10年以上かつ同規模の垢があるのでわかる。

オタク女が多いのでジャンル替えアカウント転生も多く、実質の固定メンバーは300いないくらいだと思うが…)

さすがに見続けるのはキツいくなっちゃったアカウントは、リムーブかフォロー維持のままミュートしてる。

見続けることで影響されるというより、ネットウォッチ気分で面白がってる方が自分精神に影響がある気がしてる。

昔はそういう人ほどツール使ってリムーブしたアカウント特定してはぐちぐち文句を言ったり粘着したりしてたんで相互だったらミュー一択だったけど

イーロンがAPI殺してくれたおかげでリムーブできるようになった。イーロン・マスク唯一の功績。

2024-05-01

[] It doesn't work...why?

ソースコードに間違いが見つからないのに想定される出力をしない。あるいはソースコード修正を加えていないのにいきなり想定出力を返すようになった。」

こういう経験がある人はいるはずだ。なぜこれが起こるのか。一つの原因を見つけた。

それは環境変数設定ファイル存在する。デプロイ時には設定ファイル特定の値に修正してから、ということがあるだろう。

開発環境コーディングする人が、デプロイ時の設定ファイルには関与せず、デプロイ担当者がそれを把握している。

開発者セキュリティ上の理由デプロイ時の設定ファイルの内容を見ることができない。

この場合設定ファイルの内容が間違っていても、開発者が原因が正しく特定できないケースがあるのである

対処方法は以下である。まず事前にやっているであろう対処は以下である

事前にやっていない可能性がある対処は以下である

 

追記:

他に遭遇したケースは、環境アップグレードによってphp特定関数廃止したというケースだ。

インフラ要員がアップグレードを行うので開発者は原因がわからなくなる。

2024-04-28

anond:20240428223313

4,5あたりがオライリーだと思う。

6,7以降は個別APIだのSDKだのを調べてどうにかする。

anond:20240428125045

はいMDN Web Docsではブラウザ仕様を見ることができます

MDN Web Docs開発者向けのリソースで、CSSHTMLJavaScriptなどのウェブ技術についての情報豊富に揃っています

Web APIの詳細な仕様を見ることができます。これらのページでは、各API使用方法パラメーター、戻り値などが詳しく説明されています

また、ブラウザ自体仕様については、MDN用語集で「ブラウザ」の項目を参照すると、ブラウザがどのようにウェブページを取得して表示し、ユーザーハイパーリンクを通じて他のページにアクセスできるようにするかについて説明されています

ログイン ユーザー登録
ようこそ ゲスト さん