はてなキーワード: 入力データとは
自然界の法則の探索は、一般相対性理論と量子力学の発展の中で行われてきた。
相対性理論はアインシュタインの理論だが、これによれば、重力は時空の曲率から生じることになり、リーマン幾何学の枠組みで与えられる。
相対性理論においては、時空はアインシュタインの方程式に従って力学的に発展することになる。
すなわち初期条件が入力データとして与えられていたときに、時空がどのように発展していくかを決定することが物理学の問題になるわけである。
相対性理論が天体や宇宙全体の振る舞いの理解のために使われるのに対し、量子力学は原子や分子、原子を構成する粒子の理解のために用いられる。
粒子の量子論(非相対論的量子力学)は1925年までに現在の形が整えられ、関数解析や他の分野の発展に影響を与えた。
しかし量子論の深淵は場の量子論にあり、量子力学と特殊相対性理論を組み合わせようとする試みから生まれた。
場の量子論は、重力を除き、物理学の法則について人類が知っているほどんどの事柄を網羅している。
反物質理論に始まり、原子のより精密な記述、素粒子物理学の標準模型、加速器による検証が望まれている予言に至るまで、場の量子論の画期性は疑いの余地がない。
数学の中で研究されている多くの分野について、その自然な設定が場の量子論にあるような問題が研究されている。
その例が、4次元多様体のドナルドソン理論、結び目のジョーンズ多項式やその一般化、複素多様体のミラー対称性、楕円コホモロジー、アフィン・リー環、などが挙げられる。
現代のAIはモデルって呼ばれてる奴は重みが調整された巨大なデータ構造です。
データ構造は多分ニューラルネット的なやつが一般的なのでは。知らんけど。あ、私素人ですので、あまり真面目に聞かないでください。
そんでこのモデルは入力に応じて出力が変わります。LLMなら猫っていれたら、猫について語りだして猫この特徴や可愛らしさや、猫にまつわる人間の感情についての文章が出力されるだろうし、画像生成なら猫の画像が出てきます。
モデルは多くの場合関数として振る舞うので、出力方向からこの出力結果を入力すると(お尻にバイブを刺すのと一緒です。)元の入力データが復元できます。猫にまつわる説明文を後ろから入力したら「猫」って言葉が出るし、猫の画像を後ろから入力したら「猫」って言葉が取り出せます。
画像認識AIがやっていたことが全く同じことで、画像認識AIと画像生成AIは裏表の関係になっています。
ところで人間の場合は多くの人が、猫を識別できるにも関わらず、猫の絵を描くことが出来ません。
人間の脳は、これらAIが獲得している何かの機能を削ぎ落としているようです。
なんかそのへんが一方向性ハッシュっぽさあるよなーって思った。この辺のアイディアを組み合わせたらなにか、劇的にAIの計算コストを下げれそうよね。
あとは発話とかの人類共通の計算をハードウェアにしてしまうとか、世界モデルのベースをハードウェアに落とし込むとか色々計算効率化はありそうな気がしている。
人力イラストは、目から入ってハッシュ化され脳に記録されたデータ、もしくは頑張ってハッシュを行わずに保存されてるデータからの手を使った画像復元処理って感じだろうか。
アニメとか漫画のイラストとか絵を見るとき脳の効率を使わずに気分良く見れるのは、脳内の削ぎ落とされたデータに近い形での表現だからだろうなって思いました。
こうなってくるとハッシュはいいすぎててたんに情報量を落としたデータだな。
公金の流れについてはCDBCができたら解決する。現金からデジタル通貨に変えたいという動機を国は持ってるから、システム運用にかかる費用について悩む必要もなくなる。CDBC上の取引は相手がいる実際の取引だから、別台帳で管理する場合に起き得る入力データの改竄も起きない。過去データの改竄は起き得るが、口座のマークルツリーのハッシュをどこかのパブリックブロックチェーンに定期的に記録しておけばよい。CBDC自体はブロックチェーンである必要はない。
公文書についてはパブリックブロックチェーンをタイムスタンプサーバとして使えばいい。これもハッシュの仕組みで改竄の検知だけはできる。ハッシュデータのアップロードだけで済むから費用はそんなにかからないだろう。
https://illustmimic.com/illustmakers/?type=latest
昨日から新着のイラストメーカーを眺めているが4つぐらいしか増えてない。なぜなのか。
Twitterで検索してみると、なんだかんだで試している人はいるようだし、話題の規模からするともうちょっと増えててもおかしくはない。
多分全部違う気がする。
1: 公開・非公開の設定がある→恐らく違う。そうだとしてもう少し公開している人がいるはず
2: 学習に時間がかかっている→かかるにしてもここまでかからないはず。入力データの顔部分抽出の部分はほとんど一瞬でやってくれた(学習と抽出では負荷が全然違うというのはそう)
3: 誰もデータをアップロードしていない→されているはず。アップロードしたがステータスが作成中で止まっている。同じ状態の人を何人か見かける
使えなくなったら捨てればいい話だろ
作る側より、出来たものに安易に乗っかろうとする側に文句言ってくれよ。
10万件越えのデータの分類をExcelで手作業でやってたとかバカじゃねぇのと思って
分類用のスクリプト書いたけど、後生大事に部門で抱え込む必要なんかないと思ってる。
一応入力データのフォーマットが変わってもある程度使いまわせるように作ったけど
メンテが続くとも思ってないし、他人の書いたスクリプトを読み解きながらメンテするより
たとえ手間が増えても後任が楽な方法を取った方がマシだと思ってる。
各人が自分の手間が減る方法を考えりゃいいんだけど、その考えることを放棄してるというか
そういうこと考えられる余裕が失われてる職場が多いな、とは思う。
よんでみました。多くの文章を誤読しているので、これを元に論文を判断しないように。
元論文は: https://www.frontiersin.org/articles/10.3389/frobt.2019.00032/full
この論文は、30年間の気象データを学習データにし、その後の10年間で平均気温が上がるまたは下がることの予測を試みた。
学習には、文字識別で高い判別精度をだしたLeNet(CNN)を用いた。
著者らはまず、30年分の月間平均気温データをRを用いて画像化した(fig.1)。
画像化の際に、描画方法を3種類の描画方法でデータを作成し、それぞれの場合での学習機を作成した。
その結果、defaultを用いると最も良い予測ができている。
つぎに、データを10年ごとに区切った場合そして、地域でデータを区切っった場合の学習機を作成した。
正答の精度をそれぞれの学習機で計測している。
会社で新しいシステムを買ってきて、これまで使ってきた色々なシステムと繋げる検討をしている。
そのうち1つのシステムの実装を担当している先輩のおもりをするのが面倒臭すぎるという愚痴です。
やれ関数の返りがなんだ、入力データのバイト数がどうした、初期化関数のサンプルが私が担当しているシステムと違うだ、
買ってきたシステム側の細かい所から、どうでも良いところまで聞いてくるけど、筋の良い質問はない。
そんなことメーカーから提供されているドキュメントに書いてありますよ?サンプルもありますよ?
書いてある通りに自分でサンプルを弄って、試しに実装して、検討してみて下さいよ。
正直、それほど制約が強いシステムでも無いんだから、自分の手を動かしてみてくださいよ。
今は相手方のシステムと自由に繋げるように準備してあるんだからさ。
アクセス方法もドキュメント作りましたよね?操作マニュアルもあるんですよ?
知らないシステムに対して知らないまま実装しようとするから、解決できない疑問がたくさん出てくるだけでしょ?
一度もシステムにアクセスしたことが無いとかどうかしてるだろ。
あなたの帰りが早くなった分、私の帰りは3倍遅くなってるっての。
私、この人と仕事したくないなぁ。