はてなキーワード: 入力データとは
現代のAIはモデルって呼ばれてる奴は重みが調整された巨大なデータ構造です。
データ構造は多分ニューラルネット的なやつが一般的なのでは。知らんけど。あ、私素人ですので、あまり真面目に聞かないでください。
そんでこのモデルは入力に応じて出力が変わります。LLMなら猫っていれたら、猫について語りだして猫この特徴や可愛らしさや、猫にまつわる人間の感情についての文章が出力されるだろうし、画像生成なら猫の画像が出てきます。
モデルは多くの場合関数として振る舞うので、出力方向からこの出力結果を入力すると(お尻にバイブを刺すのと一緒です。)元の入力データが復元できます。猫にまつわる説明文を後ろから入力したら「猫」って言葉が出るし、猫の画像を後ろから入力したら「猫」って言葉が取り出せます。
画像認識AIがやっていたことが全く同じことで、画像認識AIと画像生成AIは裏表の関係になっています。
ところで人間の場合は多くの人が、猫を識別できるにも関わらず、猫の絵を描くことが出来ません。
人間の脳は、これらAIが獲得している何かの機能を削ぎ落としているようです。
なんかそのへんが一方向性ハッシュっぽさあるよなーって思った。この辺のアイディアを組み合わせたらなにか、劇的にAIの計算コストを下げれそうよね。
あとは発話とかの人類共通の計算をハードウェアにしてしまうとか、世界モデルのベースをハードウェアに落とし込むとか色々計算効率化はありそうな気がしている。
人力イラストは、目から入ってハッシュ化され脳に記録されたデータ、もしくは頑張ってハッシュを行わずに保存されてるデータからの手を使った画像復元処理って感じだろうか。
アニメとか漫画のイラストとか絵を見るとき脳の効率を使わずに気分良く見れるのは、脳内の削ぎ落とされたデータに近い形での表現だからだろうなって思いました。
こうなってくるとハッシュはいいすぎててたんに情報量を落としたデータだな。
公金の流れについてはCDBCができたら解決する。現金からデジタル通貨に変えたいという動機を国は持ってるから、システム運用にかかる費用について悩む必要もなくなる。CDBC上の取引は相手がいる実際の取引だから、別台帳で管理する場合に起き得る入力データの改竄も起きない。過去データの改竄は起き得るが、口座のマークルツリーのハッシュをどこかのパブリックブロックチェーンに定期的に記録しておけばよい。CBDC自体はブロックチェーンである必要はない。
公文書についてはパブリックブロックチェーンをタイムスタンプサーバとして使えばいい。これもハッシュの仕組みで改竄の検知だけはできる。ハッシュデータのアップロードだけで済むから費用はそんなにかからないだろう。
https://illustmimic.com/illustmakers/?type=latest
昨日から新着のイラストメーカーを眺めているが4つぐらいしか増えてない。なぜなのか。
Twitterで検索してみると、なんだかんだで試している人はいるようだし、話題の規模からするともうちょっと増えててもおかしくはない。
多分全部違う気がする。
1: 公開・非公開の設定がある→恐らく違う。そうだとしてもう少し公開している人がいるはず
2: 学習に時間がかかっている→かかるにしてもここまでかからないはず。入力データの顔部分抽出の部分はほとんど一瞬でやってくれた(学習と抽出では負荷が全然違うというのはそう)
3: 誰もデータをアップロードしていない→されているはず。アップロードしたがステータスが作成中で止まっている。同じ状態の人を何人か見かける
使えなくなったら捨てればいい話だろ
作る側より、出来たものに安易に乗っかろうとする側に文句言ってくれよ。
10万件越えのデータの分類をExcelで手作業でやってたとかバカじゃねぇのと思って
分類用のスクリプト書いたけど、後生大事に部門で抱え込む必要なんかないと思ってる。
一応入力データのフォーマットが変わってもある程度使いまわせるように作ったけど
メンテが続くとも思ってないし、他人の書いたスクリプトを読み解きながらメンテするより
たとえ手間が増えても後任が楽な方法を取った方がマシだと思ってる。
各人が自分の手間が減る方法を考えりゃいいんだけど、その考えることを放棄してるというか
そういうこと考えられる余裕が失われてる職場が多いな、とは思う。
よんでみました。多くの文章を誤読しているので、これを元に論文を判断しないように。
元論文は: https://www.frontiersin.org/articles/10.3389/frobt.2019.00032/full
この論文は、30年間の気象データを学習データにし、その後の10年間で平均気温が上がるまたは下がることの予測を試みた。
学習には、文字識別で高い判別精度をだしたLeNet(CNN)を用いた。
著者らはまず、30年分の月間平均気温データをRを用いて画像化した(fig.1)。
画像化の際に、描画方法を3種類の描画方法でデータを作成し、それぞれの場合での学習機を作成した。
その結果、defaultを用いると最も良い予測ができている。
つぎに、データを10年ごとに区切った場合そして、地域でデータを区切っった場合の学習機を作成した。
正答の精度をそれぞれの学習機で計測している。
会社で新しいシステムを買ってきて、これまで使ってきた色々なシステムと繋げる検討をしている。
そのうち1つのシステムの実装を担当している先輩のおもりをするのが面倒臭すぎるという愚痴です。
やれ関数の返りがなんだ、入力データのバイト数がどうした、初期化関数のサンプルが私が担当しているシステムと違うだ、
買ってきたシステム側の細かい所から、どうでも良いところまで聞いてくるけど、筋の良い質問はない。
そんなことメーカーから提供されているドキュメントに書いてありますよ?サンプルもありますよ?
書いてある通りに自分でサンプルを弄って、試しに実装して、検討してみて下さいよ。
正直、それほど制約が強いシステムでも無いんだから、自分の手を動かしてみてくださいよ。
今は相手方のシステムと自由に繋げるように準備してあるんだからさ。
アクセス方法もドキュメント作りましたよね?操作マニュアルもあるんですよ?
知らないシステムに対して知らないまま実装しようとするから、解決できない疑問がたくさん出てくるだけでしょ?
一度もシステムにアクセスしたことが無いとかどうかしてるだろ。
あなたの帰りが早くなった分、私の帰りは3倍遅くなってるっての。
私、この人と仕事したくないなぁ。
2012年ぐらいのOSXは画像フィードをスクリーンセーバに入力するという方法で自分のtumblrをスクリーンセーバ化するというのが出来たけど(たぶん)Mavericks以降は,それが無くなってしまったので代替方法について書きたいと思う。
まず tumblub を開き「staff」に自分のtumblr IDを入れる。「Random」のチェックボックスをチェックし「Photo size」を500, 「Animation speed:」をslowとチェックしshowボタンを押す。以下はサンプルとして作成したotsune氏のtumblr IDを入力したスクリーンセーバの入力データだ。女性の尻がいっぱい出てくるので職場のMacのスクリーンセーバにすると軽くアナーキー感が出て良いと思う。
speedは好みで変えて良い。ぼくは14400くらいが良いと思っているのでクエリストリングのところをそんぐらいに手で変更して使っている。
Screensaver Ninja - Never miss important information again という任意のwebページをスクリーンセーバとして表示できるツールがある。1200円。本来はなんらかのビジネスのダッシュボードなどを表示する用っぽい。
購入しアクティベーションしてScreensaver Ninjaを起動し「Add new site」する。先ほどのURLを追加する。
「システム環境設定」から「デスクトップとスクリーンセーバ」を選び「Ninja」を選ぶ。これで女性の尻がどんどん流れてくるスクリーンセーバの完成である。
もちろん自分のtumblrをスクリーンセーバにする事も可能だ。
普段肌色をreblogするのにも緊張感が走るし,肌色が離席中の職場Macに出てきてしまったらしまったで同僚の人とかと会話も弾んで良いと思うのでみなさん,どんどんスクリーンセーバを設定すれば良いと思う。
トラックバックしてくれた人に教えてもらったがbrockgr/websaveというScreensaver Ninjaと同等のことができる無料ツールがあるのでそれを使おう。
Releases · brockgr/websaver からWebSaver-X.X.zipをDownloadする。
解凍する。FinderからWebSaver.saver をダブルクリックする。開発元が未確認のため開けませんとか言われたら、「システム環境設定」→「セキュリティとプライバシー」の「一般」から「このまま開く」を押す。そんで「今すぐインストール」をやる。「デスクトップとスクリーンセーバ」からWebSaverを選び先ほどのURLを追加する。
なるほど。
ここでいう「シミュレーション」とは、要するに「バックテスト」「フォワードテスト」と俗に言われているやつ。過去の株価のみを入力データとして、完全に自分でコードを書いて実験してみるもの。既存のシミュレーターは儲かると勘違いするようにできてると思う(ましてや、証券会社が提供するようなものは)。
なるほど、単純に過去のデータを利用するだけでは、「希望価格で約定できないというリスク」は評価できない。そのリスクが定量的にどのくらいなのかは、実際にやってみたい。
例えば、
このとき、P - Q の値は分布する。もしこの分布が正規分布とか、その他の計算可能な分布であれば、それもシミュレーションに含めることができる。これはやってみたい。
まあとにかく実際に数万円でやってみます。
あと、俺が口座を作った証券会社のシステムだと、単元未満株は翌日の始値で売買されることがあらかじめ決まっているらしいので、この場合なら過去の株価のみで情報は全部揃っている。まぁ本格的にやるなら単元未満株は使わないと思うけど。
どうでもいいけど「約定」を「やくてい」だと思ってた。恥ずかし。