「機械学習」を含む日記 RSS

はてなキーワード: 機械学習とは

2023-10-14

[] モデルの作り方

1. コーパスを作る

2. コーパスの語録を適当なEmbedding(例えばlabseなど)でベクトル化しておく

3. ベクトル化されたもの適当機械学習アルゴリズム学習 (負例は匿名ダイアリー内のランダムな文)

4. 作成された分類器を任意の文へ適用

 

なお、他のバリエーションとしては以下の使い方があります

 

1. コーパスを作る。

2. 「以下の引用文を○○という方法分析して、コメントをください」などとAIに依頼する。

3. AIから様々なバリエーションコメントを貰う。

2023-10-12

[] アノテーション基準

自称インテリ語録は自分コーパス作成のために行っています

意図は、箴言における「嘲る者(自分を賢いとみなし、他者を見下す傲慢な人)」を機械学習で見分けるモデル作成です。

以下はアノテーション基準です。

厳密なアノテーション基準はありませんが、アノテータがある程度の裁量判断します。

著作権侵害では?」と思われるかもしれませんが、差別社会的に相応しくないため、コーパス作成公益性があると判断し、また創作性のないものに絞っており、自己責任でやっております

元々は自分の「自称インテリ」の概念の精密化のために行っておりましたが、Bing AIによって様々な分析をさせることが可能であることがわかったため、自然言語資源を作るという目標に変わりました。

2023-09-28

anond:20230919141733

Pythonの初歩を学ぶ→機械学習サンプル(mnistなど)を少し動かす→機械学習に興味を持つ→機械学習を学ぶ

機械学習に興味が出なかった場合、上で作ったmnist+αなコードAWS Lambdaで動かす。javascriptを学んで、推論する画像アップロードして、結果をwebブラウザ上で表示してみる。

この時、サーバサイドの実装に興味を持ったかAWSの動かし方に興味を持ったかwebブラウザに表示する部分に興味を持ったか、3通りくらいいると思う。

次はその技術を使って、別のものを作ってみる。AWSなら別のAWSマネージドサービスや、Auth0で認証系を作ってサービス拡張してみる。CloudformationやCDKをいじってみる。

サーバサイドの実装に興味を持ったら、機械学習結果をDBに保存したり、いろんな学習モデルを実行できるAPIを作ってみる。

javascriptならリッチな見栄えのUIを目指してみる、Next.jsなりに置き換えてみる。

こうやって、少しずつ拡張してみるのを続けると1020年すぐ時間が飛ぶよ。

そして、これだけ楽しめたら潰しがきいたことにならないかな。

2023-09-24

気軽にオンライン診断してほしい

機械学習でとりあえずこれっぽくね?みたいなところまででいいよ

その後は病院推奨するよーXX科いってねーくらい。

あったよね。勝手妄想してた。

既存医療業界のクソジジイ共が邪魔してできないと思ってたけどぐぐったらいくつかでてきたからとりあえず使ってみてから

文句があれば改めて文句行ってやろうと思う。

2023-09-16

anond:20230916160238

回答する側は、損得で回答するかを選んでいるのかも...。

機械学習に興味あるような人はAIに聞いているのか、流行を追いかけているだけ人なのか...。

anond:20230916160238

機械学習理解してるやつがいいからやで

みんなライブラリ呼び出してなんとなくやっとるだけや

プログラミング一般質問に対する回答は多いけど、機械学習に関する回答は少ないのはなんでかなといつも疑問に思う

なのでQ&Aサイトとかで機械学習関連の0回答の質問を見つけると、いつも一番乗りで回答できる

2023-09-10

ジャニーズ事務所はいますAIジャニさんを機械学習させて謝罪するべき

どうしてしょうもないAI釈迦に歌わせてみたみたいなもんばっかり作ってこういうことにテクノロジーを使わないのか。

AIジャニさんが性被害をして申し訳なかった、もっと愛を持って接するべきでしたと謝罪する動画被害を受けたジャニーズの子にみせることで、深層意識を癒すことが可能かもしれない。深層意識バカなので勘違いさせられると思う。

ジャニさんはなんでこんなことしたか。おそらく彼も小さい時そういう被害にあった可能性はあると思う。大事なのは悪いとかそういうんじゃなくて、そういう人達を癒す方法を考えなくては。

から小さい時のトラウマテクノロジーを使って癒して第2のジャニさんを発生させないようにするんだ。

2023-09-03

anond:20230903120925

機械学習に使ってる人が少ないのが致命的。

プログラミング言語って、最後最後は、みんなが使ってるから人気。にしかならんので、

使われないとダメなんだわ。

2023-08-27

生成AI勉強する気がおきない

仕事始めた頃は機械学習とか信号処理とかよく勉強してたけど、生成AIみたいなぽっとでの俺より若い技術を真面目に勉強するのが何かしゃく

2023-08-25

趣味機械学習コードを書き直したらバグだらけだった

ライブラリっぽく書き直したら、もとの結果を再現しなくなってしまった。

ろくに確認もせずにそのコードを使ってパラメータ探索をしていたから、時間無駄にしてしまった。

正常に動くことを確認しながら実装するのはまじで大切だ。

テストケースを作って、少なくともそのケースではうまくいくことを確認しながら実装していこう。

2023-08-24

機械学習、少しアーキテクチャ変わると無駄になるの、改善されないんだろうか

から次へアーキテクチャ出てくるけど、その度に学習し直し。

2023-08-23

日本研究は広く浅くやるべきなのか

判断材料をChat GPT先生に教えてもらいました。

関連ブクマhttps://b.hatena.ne.jp/entry/s/mainichi.jp/articles/20230822/k00/00m/040/214000c

アメリカ日本で盛んな分野のトップ5は?

アメリカ日本大学における理系研究で、盛んな分野のトップ5をそれぞれ箇条書きにしてお答えします。

アメリカ大学で盛んな理系研究分野は以下の通りです。


日本大学で盛んな理系研究分野は以下の通りです。




アメリカ日本理系大学研究成果が経済に結びつきやすいのはどちら? その理由は?

一般的に言えば、アメリカの方が日本よりも大学研究経済に与える貢献度は高いと考えられます。その理由として、以下の点が挙げられます

アメリカでは、大学研究成果を産業界に移転する仕組みが整っており、特にベンチャー企業の創出や成長につながっています。例えば、スタンフォード大学マサチューセッツ工科大学MIT)などは、シリコンバレーボストンエリアといったイノベーションの中心地に位置し、多くのハイテク企業スタートアップ企業連携しています。また、大学発ベンチャーの成功事例としては、グーグルフェイスブックなどが有名です。

日本では、大学研究成果を産業界に移転する仕組みが十分ではなく、特にベンチャー企業の創出や成長につながっていません。例えば、日本大学発ベンチャーは、アメリカ欧州と比べて少なく、また規模も小さいです。その原因としては、日本大学知的財産管理ライセンス交渉能力が低いことや、日本産業界が新技術や新製品に対する需要が低いことなどが挙げられます

以上のことからアメリカでは大学研究経済に与える貢献度は高く、日本では低いと言えるでしょう。もちろん、これはあくま一般的な傾向であり、日本でも優れた大学発ベンチャーは存在しますし、アメリカでも大学研究経済に貢献しない場合もありますしかし、日本アメリカから学ぶべき点が多いと思います


日本アメリカにおいて、お金になりやす研究分野をそれぞれ挙げてください。

アメリカ日本において、お金を生みやす研究の分野は、それぞれ異なる傾向があります

一般的に、アメリカでは、医学生命科学コンピュータ情報科学工学などの分野研究開発費の多くを占めており、高い経済効果や社会的影響力を持っています1。

日本では、自動車ロボットなどの製造業に関連する分野研究開発費の大部分を占めており、国際競争力を高めていますしかし、日本研究開発費は、GDP比で3.3%と先進国の中で低い水準にとどまっており、基礎研究や新領域研究に対する投資が不足しているという課題があります。そのため、日本では、エネルギー環境生命科学医療人工知能ビッグデータなどの分野において、イノベーションを生み出すための研究開発費の拡充が必要とされています

2023-08-22

anond:20230822133249

AI」と「研究」を並べてる人は全員ペテン師だと思ったほうがいいぞ。

自称研究者じゃなくてアカデミックでの実績がある人を参考にしたほうが良い。

というか機械学習入門の講義ネット上にいくらでもあるから、まずはそれを見るべき。

anond:20230822122409

lightgbmで足りるレベルAIやpretrained modelfine tuningレベルのことはできるけど。AIっていうより機械学習っていう感じでワクワクできないんだよな。chatgptとか最近画像動画音楽生成はすごいって思うけどそれ未満だとすごいって思えない。機械学習は今までも人間が苦手なことをできたけど、最近のは人間が得意なことを下手な人間より上手くできる

2023-08-17

anond:20230816112111

私がubuntu desktopを使う理由

emacs が速く動作する

・端末がすぐ出せる

snapソフト自動アップデートされる

機械学習計算がしやすい。環境構築がwindowsより簡単

anond:20230816164354

>> リモートワーク肯定派の奴らは自分たちけが得になるから賛成しているだけで他の人達が苦しんでいても関係ないって顔している

それはそうだろ。公僕でもあるまい、他の人に構っているほど人生は長くない。リモートワークをしている人たちだけが得をしてて他の人たちが苦しんでいるという構図は、一方的かつ真偽不明すぎて理解に苦しむ。リモートワークで今まで水道光熱費会社負担していたのに、自宅勤務で手当もないので自腹になったって人もいるのでは?リモートワークで損をする反例は枚挙に暇がないと思うが。

>> 世の中には現場に出なければいけない仕事があるのに損する人たちを無視して声のでかい奴らだけの意見が通っていく

職業選択の自由憲法で認められているのだから、損をする自覚があって忸怩たる思いをしているのなら、とっとと得をする仕事自由に選べば良いのでは?

>> リモートワークしている奴らが楽している

それってあなた感想ですよね?

>> 一方でそのツケは現場労働者が払わされているのが現状

現場労働者が払わされているツケって具体的になんですか?

>> 一度リモートワークをゼロにして1から公平な制度考え直すべきだろ

これだけ色々破綻している上で考え直すという公平な制度を是非拝聴してみたいところ。他人任せすぎだろ。

別件で議論から外れるがコメントが多かったので補足。

エッセンシャルワーカーの待遇を良くしろというのは、個人的には賛成である。そのために医療費負担を上げても、それは国民が今まで我儘言っていたツケなので仕方がないと思う。ロボット機械学習AIなど、あらゆる自動化、省力化に関わる先進技術エッセンシャルワーカーのサポートができるようになるような分野に助成すればよい。お金がなくて医療が受けられず国家人口は減っても、それがそもそも妥当解であって、人類向上心に任せた成長という意味では、医療費を上げてもエッセンシャルワーカーとそれをサポートする産業に、国家が惜しみなく投資をすると良いと思う。

2023-08-11

人間運転するより自動運転車の方が事故が少なくなるのだから自動運転は開発すべきって、どこから出てきたんだろ

自動運転車システムが世の中になかったはずなので、数値としてのデータはなかったはずだ。

なのに、自動運転車が出来れば事故が減る、事故による死者が減るという意見が多かった。


数値計算プログラムなら間違わないが、機械学習はどこまでいっても間違えそうな気がしてならない。

2023-08-10

LK-99 にかこつけて物質探索としての機械学習

増田マテリアルインフォマティクス超伝導専門家ではないんだけど。

雲行きがあやしくなってきか

専門家からすると、常温ながら高圧下で超伝導存在ですら怪しいのに、高圧ですらない報告は眉につばも付けたくなるだろう。(LK-99は本当に常温常圧超伝導を達成しているのか - 理系のための備忘録)

Cu_2S の一次転移を常温超伝導と見間違えたのでは?との報告が上がっている。(https://twitter.com/tjmlab/status/1689076343114493957])

機械学習物質探索

LK-99に関連して、常温超伝導を示す物質機械学習を使って見つけられないのかという疑問をはてなブックマークTwitterなどで見かけた。

端的に述べると、機械学習を用いた物質探索は既に広く行われているが、今回のような未知の性質を有する物質の探索には不向きである

物質探索で機械学習が注目されるようになったのも最近のことだ。

2019年には選択性の高い触媒機械学習予測する研究がScience誌に投稿されている。(高選択的な不斉触媒系を機械学習で予測する | Chem-Station (ケムステ))

物質の探索の他にも、生データ帰属やそこから得られたデータ同士の解析などにも機械学習が用いられている。

暗黒大陸が広がっていた

機械学習によって、経験によると勘とマンパワーと一握りの運で支えられていた「予測→合成→測定→解析」のサイクルを早められるようになった。

その一方で、より広大な未踏の探索領域存在し、さらなるマンパワー必要であることが明確化された。

HUNTER×HUNTER暗黒大陸が明かされた状況に似ている。


機械学習暗黒大陸の道案内役になりうるが、より効率的な探索のために実験や測定の自動化必要となり、そのような研究も始められている。

予測した物質を合成できるか

機械学習が様々な物質予測しても、その合成できるかは別問題だ。これは機械学習に限った話ではない。

理論的にすばらしい性質が予想された物質であっても、技術的に合成できない、合成できても予想された性質を示さないことは科学世界ではあるあるだ。

原因は様々である解決のためには、技術進歩ブレイクスルー必要となるし、そもそも予想が間違っている可能だってある。

たとえば、2000年ノーベル化学賞を受賞したポリアセチレンは、古くから量子化学的に導電性を持つだろうと予想されていたが、合成する方法がなかった。

1958年にナッタらが開発した触媒によって初めて合成されるが、粉末しか得られず電気特性を測定することができなかった。得られた粉末は溶媒にも溶けず熱で溶融もしないためフィルムにできなかったのである

その後の1967年白川らがフィルム化に成功金属光沢を示すもののほぼ絶縁体であった。電気を流すにはドーピングという更なるブレイクスルー必要だった。

超伝導やばい

機械学習は、目的とする性質を持った物質を探索することは可能だが、全く新しい性質を示す物質予測には向いていない。

過去の結果から高い転移温度を有する物質類推可能だが、これまでの超伝導とはメカニズムが異なるであろう常温超伝導を示す物質を予想することはできない。せいぜい異常な振る舞いを予測するくらいだ。

超伝導の恐ろしいところは2000年以降も様々な性質が予想され発見されていることだ。

例えば、ワイル金属1937年予想、2016年発見)、トポロジカル絶縁体2005年提唱2007年確認)、ネマティック超伝導2016年発見)などなど。

全く新しいメカニズムによる性質に関するデータが無い以上、このような性質を示す物質機械学習で探索するのは無謀だ。

もちろん、既存データをよくよく洗い出してみると、新しいメカニズムで上手く説明できるケースもあるが、それを機械学習へ利用するには・・・・・・。

最後

というわけで、常温超伝導を示す物質機械学習で探すのは得策ではない。

2023-08-02

AIAVですか。他人仕事が無くなることには無頓着なんですね。

WEB3 のテキストに「将来は生成AIで好きな女と絡めるAVができることでしょう」って書いてあった。バカジャネーノ?どっから、その女のデータを作り出すのさ。統計的機械学習オマンコを作り出すんか?それやったらさ、制作側も全くメリットないじゃん。何度も取り直しする必要が無くなるってことは、彼らの仕事がなくなるんぞ。ポジティブってばっか書いてるけど、それはディストピアだぞ。きっと、この作者は働いたことないのだろうな。キモい発想はやめろって。キモいのは顔だけにしてろって。

2023-08-01

エンジニア勉強論だけどさ

勉強したい人はすればいいし勉強したくない人はしなけりゃいいんじゃない

勉強したい人はフロントもバックも機械学習IoTもいろんなことができるようになると思うし

勉強したくない人も一生Wordpressの改修要員やテスト打鍵要員で満足であればそれで構わないしそれを周りがどうこういう問題じゃないんじゃない

スキルスキル身につける気もないくせに勉強してますって騙って転職しようとするのはダメだけど

2023-07-31

anond:20230731104947

最近最前線から離れててあんまり追えてないけど、現役のとき2008年くらいか10年くらいの間で、仕事のやり方や設計の考え方が大きく変わったIT技術要素で、いまぱっと思い浮かぶのはこんな感じかな。

分野にもよるし、調査して試作した結果自分業務には採用しなかった技術とかもある。流行ると思って使えるようになったけど流行らなかった技術を入れるとたぶんもっとある。

あと、新機種が出てOSが新しくなったり、ミドルウェアの新バージョン対応テスト手法進化もけっこうカロリー高いけどここには書いてない。

自分フロントエンド専門でReactしかやらない」みたいに分野を絞れば大分減るけど、その技術が何年持つかわからいか普通リスクヘッジのために他の技術も齧らざるを得ないし、バックエンドとかの人と議論するのに結局他分野の知識もそれなりに必要

ソーシャルコーディング(GitHub)

スマホアプリ(iOS, Android)

NoSQL(memcached, Redis, Cassandra)

暗号通貨

クラウドアーキテクチャ、XaaS(AWS, Google Cloud, MicrosoftAzure)

CI/CD(Travis CI, CircleCI, Jenkins)

トランスパイラ(Browserify, webpack, CoffeeScript, TypeScript)

システム(Rust, TypeScript, Haskell)

テスト自動化(xUnitSelenium)

クリーンアーキテクチャ

コンテナDocker

オーケストレーション(Ansible, Kubernetes, Terraform)

機械学習(Python, MATLAB, 線形代数数学知識)

HTML5(WebGL, WebAudio他)

SPA(React, AngularJS, Ember.js, Vue.js)

マイクロサービスアーキテクチャ

3Dゲームエンジン(Unreal Engine無償化、Unity5)の他分野への普及

GraphQL

機械学習ライブラリ(Tensorflow, PyTorch, Chainer)

Jupyter Notebook

NFT

モバイルアプリフレームワーク(React Native, Flutter/Dart)

シングルサインオン

多要素認証生体認証

メタバース

IT仕事について6年目になって気付いたんだけどさ

大きなシステム大人数で作る能力

さなシステムを高速で作る能力って

結構別の能力だよね。

バスケバレーぐらい違う。水族館動物園ぐらい違う。タピオカドリンクとみたらし団子ぐらい違う。

もっと言えばフレームワーク自体検索エンジンとかエンジンを作り込む能力も上の2つと違う。

大学生の時に知っておきたかったな。

多分

モールプロダクト系の考え方で大規模プロジェクトを管理しようとすると大失敗するし

大規模プロジェクト系の考え方でスモールプロダクトに入ったら無能になる

前者の方が馴染むまでが早いと思うけど


同業にわかるように書くなら

大規模プロジェクトはプロジェクト管理工数管理連携部署との調整やセキュリティ設計DB設計監視設計、大量アクセスの際の耐久設計なんかが必要toB開発であれば規模が大きくなればなるほど業務に対する深い理解必要になってくる。ただこんなの全部できる人なんて居ないから、どうしてもどこかしらの領域に特化する人になる。他社連携含めた大人数のチームでの動き方も自然に身につかないといけない。

小規模プロジェクトは浅く広く知っておく必要がある。フレームワークだとかミドルウェアとか場合によってはSaaSの知見も必要。とにかく道具は多くもっておくことと基本的インフラ構成くらいは知っておく必要がある。フロントだとかバックだとか言ってられない、大量アクセスとか特殊設計とかは基本的不要

検索エンジンとか機械学習ゴリゴリ系は正直よく知らないけど、アルゴリズム機械学習手法知識だけでなく素早く手を動かして実験してとにかくプロトタイプを作ることが大事なんじゃないかと思う。知らないけど。Webフレームワークだとかインフラ構成だとかの知識も要らんし結構別の世界何じゃないかと思ってる。

全部デキるに越したことはないんだけど、一人の人間が全てを経験することなんてなかなかできないしね

2023-07-30

ジェネレータの意味多すぎ問題

ログイン ユーザー登録
ようこそ ゲスト さん