はてなキーワード: 自然言語処理とは
ツイッターで議論されていることを論理的に抽象化したら(自然言語処理的な意味で)アイデア生成機的に使えるのでは?と思ったのでブログでアノテーション作業を始めた。
https://tweetdiscussion.blogspot.com/2022/09/2022-072022-08ai.html
あんまし他の人から面白い行為に見えないかもしれないけど、自分としては面白いし暇つぶしにもなる。
アノテーションと言う割にルールの厳密性がなくて曖昧だが、将来的に巨大言語モデルに食わせる分にはそれでもいいとは思ってる。「自分の抽象化能力を再現できるか」という話。
例えば対象=お絵描きAI、対象A=AI、対象B=人間とすると以下のように議論を抽象化できる。(抽象化してるので、対象、対象A、対象Bに別のものを代入して色々と試せる)
はてブのホットエントリ(総合)で月内に数多く[あとで読む]タグを集めたエントリ
315あとで/2672users 零細企業買収して売却した話|reisaikigyou_ma|note
294あとで/2057users テクニカルライティングの基本 | Naohiro Nakata | SpeakerDeck
277あとで/2169users プログラマの心の健康 | 結城浩
257あとで/1306users GitHubの使い方を学ぶ「GitHub Skills」が無料公開。GitHubを実際に操作してMarkdown、Pages、Pull Requests、マージのコンフリクト解消などを体験 | Publickey
210あとで/1421users 総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai
206あとで/1271users 商用利用OKの音素材、600種以上無料公開 バトルの攻撃音も……「Springin’ Sound Stock」 | ITMedia
204あとで/1565users 「自分を愛するってどうしたらいいの?」──宇多田ヒカルの思考を辿るインタビュー、全文公開。 | VOGUE
189あとで/1536users 商用利用無料、国内のフリーイラスト素材の総まとめ | coliss
165あとで/1222users 著作権フリー素材がスゴすぎ…広重や夢二も全部無料 国立国会図書館の試みに「工作心がムズムズ」「活用しない手はない」|まいどなニュース
163あとで/1070users わずか数年で400億円も売り上げを伸ばしたカインズ ホームセンターのDXで、まず「顧客戦略」に着手した理由 | 株式会社メンバーズ | logmi
161あとで/1092users わかりやすいシステム構成図の書き方 - Qiita
158あとで/952users 大人の学びパターン・ランゲージ(略称まなパタ):IPA 独立行政法人 情報処理推進機構
152あとで/974users Webデザインの有料学習サイトが無料化 IllustratorやPhotoshop入門などが見放題 | ITMedia
145あとで/1638users 最近Amazonプライムで観た面白かったけど胸糞悪くて二度と観たくない邦画5選 - kansou
144あとで/704users 書籍「達人が教えるWebパフォーマンスチューニング」はチューニングの考え方を教えてくれる良本 - Gマイナー志向
144あとで/1072users ジョナサン・ハイトが解き明かす「アメリカ社会がこの10年で桁外れにバカになった理由」 | 「現代のバベルの塔」はいかにして建設され、崩されたのか | COURRiER
138あとで/1513users 【ウマすぎ注意報】料理研究家・リュウジさん考案「無限冷やしそうめん」がガチでラーメンより美味かった! | マイナビニュース
133あとで/673users 東京大学深層学習(Deep Learning基礎講座2022)深層学習と自然言語処理 | Hitomi Yanaka | SpeakerDeck
129あとで/980users ドキュメントに固執せよ - gfnweb
128あとで/846users 世界中のITエンジニアが悩まされている原因不明でテストが失敗する「フレイキーテスト」問題。対策の最新動向をJenkins作者の川口氏が解説(前編)。DevOps Days Tokyo 2022 | Publickey
127あとで/1632users 結城浩 on Twitter: "質問(簡単に教えてもらおうとする相手にイライラするようになった) あなたのおっしゃる「質問されるとイライラする感じ」はよく理解できますし、同じように感じる人はたいへん多いと思います。(続く) #結城浩に聞いてみよう… https://t.co/CKZMzVzHPN"
126あとで/622users コードを書いていてマネジメントもやるようになっちゃった人へ 背中で語っていた僕が、プロダクトとピープルに向き合うまで | 海老原昂輔 | logmi
124あとで/1032users 「女性同士のマウンティング」に関する研究論文が興味深くView数が少ないのがもったいないレベル 具体的なエピソードもなかなかすごい | Togetter
123あとで/1046users 戦略系コンサルタントがオススメする本(不定期更新)|とあるコンサルタント|note
122あとで/885users たった256文字のJavaScriptコードで描かれた街の風景アニメがスゴ過ぎて訳がわからない/解説ページを見てもわからないorz【やじうまの杜】 | 窓の杜
117あとで/924users 私は数学がなぜ苦手なのか?高校生が分析してあみ出した勉強法が効果抜群だった|高校生新聞オンライン|高校生活と進路選択を応援するお役立ちメディア
115あとで/701users 「ゲーム制作するなら、これだけは覚えておいたほうがいい」 プログラミングする上で重要な「対数」の考え方 | 安原祐二 | logmi
112あとで/879users 【初心者向け】iPhone3Dスキャンパーフェクトガイド|iwama|note
111あとで/524users 次世代Web通信プロトコル「HTTP/3」がついに標準化 ~有志による無償解説本が話題に/PDF形式の電子書籍がGitHubで公開中! 今後も更新される模様【やじうまの杜】 | 窓の杜
東大とか一ツ橋とかだろうから、センター科目はフル教科っぽい。
ということで、機械学習をサクッと「勉強」して習得。青空文庫のデータ突っ込んで何か作ってみよう。
まだ在学中なら自校の機械学習を学部マタギで取得するのがよい。
機械学習界隈のデータサイエンティストは、プログラムや数理モデルにはたけているが、分析対象のデータに詳しいわけではない。
http://www.traina.ai/solution/textmining/
野村総研では業界・商品種別の「感性辞書」が必要っていっていて、実際の企業が機械学習使おうとなると、ここでカスタマイズ費用をがっつり企業からとるんだ。
例えば音声認識。
・AI周りの設定が雑
これは一般客には興味ない気がする
他にもまともに見てたらツッコミどころ多くて
俺は「良いところと悪いところがある」と思っている。ツッコミどころだらけではなかった。
「AI」概念を都合よく混ぜるな。プログラム、ロボット、各種ハードウェアを全部「AI」という言葉で便利に表現していたのはちょっとモヤモヤした。
とはいえ、シオンの本質は物理的な「ヒューマノイド」ではなく、ネットワーク内に漂っているプログラムだった、という最後の結末を考えると意図的なのかもしれない。
他の企業が出てこないので作中で比較しようがないんだが、星間の存在が最大の謎だったりする。
まず「AI」の技術力という意味ではかなり高いという扱いを受けている(作中で)。現実世界でいうところのGAFAM、OpenAIみたいの水準なんだろう。
そしてロボティクス分野だとヒューマノイドを平気で量産しているし、そいつらの動作もかなりスムーズだ。ボストン・ダイナミクスみたいな技術力があるし、Tesla Botみたいな攻めの姿勢も感じられる。
あと、日本国内でAIのための実験都市を作ってる(借りてる?)という意味ではトヨタっぽさもある。政府や行政との調整がクッソ上手そう。
とりあえず、各企業の一番強いところを集めた「ぼくのかんがえたさいきょうの会社」ってことなんだと思う。
それにしてはJTBC感をちょくちょく出していてなんなんだ。いっそのことGoogleみたいなシリコンバレー企業感を出していても良かったと思うんだけどな。
サトミ母(美津子)は星間におけるシオンのプロジェクトをリードする立場で、研究面で数々の受賞をしたという描写がある。海外大学院でドクター取ったとかそういうタイプのエリートに見える。
だが、何故お前は星間にこだわるんだ?「この会社から見放されたら終わる」みたいなスタンスでずっと生きてる。メンヘラかよ。
どう考えてもお前は海外でも国内でも好きなところに転職できる立場と技術があるだろ。
もしかしたら「さいきょうの会社」が世界中に星間1社しかない世界観なんだろうか。ここがいまいち腑に落ちなかった。
これはマジで最高だった。すげえよかった。語彙がなくてごめんな。なんていうかな、無駄に「SFちっく」じゃないんだよ。
いまの俺らの生活もAlexaとかルンバとか自動運転車とか、20年前には考えられないような「AI」があちこちにいるわけよ。
でも暮らしぶりっていうとそんな昔と変わらなくない?全面が画面に取り囲まれたサイバーな空間で暮らしてるわけでもなく、普通にボロアパートで「OK, Google」とか言ってる、そんな感じじゃん。
アイうたはこの辺を上手く捉えてた。建物や人々の服装みたいな生活はそのままで、ちょっとした便利デバイスが追加されてる社会。
「今の生活の延長線上にあるAIとの暮らし」を上手く表現してたと思う。2030年代ってあんな感じになるんじゃね?くらいに思わせてくれた。
エンジニア、ガジェットオタクの目線から言っても「まあ、あり得るよな」の範囲で収まる描写が多かったしね。
正直、田植えロボットの合理性は疑問だけど、ボストン・ダイナミクスとTeslaの動きを見てるとそこまで異常ってわけでもないとは思う。Teslaが日本にあったら多分Tesla Botに田植えさせてると思うよ。
俺は前半の技術描写で感心してたわけよ。だけどこれが花火のミュージカルパートで怪しくなって冷めてしまった。
(正直、花火のシーンはどうでもいい。SFでミュージカルをやると現実的じゃなくなるからそこに文句はない。)
おもちゃ(組み込み機器)の自然言語処理AIが何故自己拡張できんの?そして自己複製して企業内ネットワークに遍在するようになる?超絶エリート集団の星間がどうしてこれを検知できない?
作中でも「ただの自然言語処理AIが」というセリフが登場するほどなのだが、何故か「そういうこともある」といった根拠のない感じで皆納得するようになる。
これまでが現実を強く意識させる描写だっただけに、ここの飛躍に頭が追いつかなかった。逆に最初の技術描写が優れていたからこそかもしれないが。
せめて作中世界のSF的論理でもいいから、エンベデッド機器のNLPプログラムが人格を持つようになった経緯は綺麗に説明してほしかったな。
他人のカードでセキュリティ室に入って何やってんだお前、完全にコンプラって概念ないだろ。まあ、最初から倫理観があまりないという意味では一貫してんのかな。
それにそんな危険人物を優秀だからといって企業に残す経営陣も狂ってるでしょ。
この暴走する役割は完全に高校生だけに押し付けるべきだったなと思う。暴走した高校生たちによって偶然にもサトミ母とシオンが再評価されて地位が回復する、とかね。
まあ、自分がこういうので楽しめなくなったクソつまらない人間になってしまった可能性は否めないけど。
とまあ文句は言ってるけど、重箱の隅をつついてるだけではある。
頭の中に声が響く。
「占い師に傾倒してたのどっちだったっけってのはピンとこないのよ」
「そもそもね、クワバタオハラのどっちかだったような気がしなくもない」
「オハラといえばスカーレット・オハラだけど微妙にカッコつかないよなオハラの部分が」
頭の中に愚にもつかない無数の呟きが木霊する。しかし、脳はそれを遮断できず、与えられたすべての情報を解釈し続ける。
精神世界で、声のもとを、声の主と思わしきモヤの首根っこを押さえる。指の隙間を風が吹き抜け、モヤは霧散する。
依然として声は降り止まず、精神世界にまで暗雲が立ち込める。やがて雷雨となり、雷は私の脳天から爪先までを穿った。
私は目が覚め、関連したすべてのシナプスは完全に繋がり、二人の芸能人を /(くわ|し)ばたりえ/ で表すことができるという知見を得た。
柴田理恵はあくまで漢字表記なので自然言語処理的には役立たないことに気がつくまで、私は自分が何だったかも思い出せなかった。俺は、少なくとも女芸人ではない。今はそれで十分だろう。
中で働いてるけど表面上の会計を良くするために人件費等を削りまくってる。
今年の出来事なんだけど、開発部の評価を一律で下げた件に主力開発商品のモビエージェントのリードエンジニアであるO氏が怒って人事と喧嘩した挙げ句退職してしまった事件があった。
それ以外に給与が上がらないので主力級のエンジニアがボロボロやめしまっているという現状がある。
さらにモビルスはそもそもScalaで開発していたが、元々いたScalaエンジニアやめる&Scalaエンジニアが採用できない、
しかも元社内にいたエンジニアが開発したxitrumという謎のマイナーフレームワークでほとんどの商品が開発されていた。もちろんその社員ももちろん退職している。
なので、プログラムのメンテがどんどんできなくなってしまっている。
じゃあ、他の言語で書き直せばいいんじゃない?って思うかもしれないがいまさら、大規模なリプレースはできないだろ。
そんだけ開発費を出したり、開発を止める余裕はないだろう。
SREをやろうとしてエンジニア、Goが好きなフルスタックエンジニア、アルメニアから女だてらに日本が好きだから働きに来てた人、QAのベトナム人達、皆やめてしまった。
ダイバーシティみたいなことを名乗っているが外国人比率はどんどん下がっている。
元々は外国人のほうが給与が安いみたいな理由で雇っていたが、今日本人のほうが安いからこうなってるんだろうな。外国人のほとんどは楽天にいったそうだ。
自分の部署も人はやめてるが補充はしない。仕事は増える一方だが給料は上がらない。
1年くらい前に上場を目指して大企業から役員や管理職が入ってきてから、いろんな事が変わってしまった。
人事はGithub禁止とか言い出すようになったし、セクショナリズムな急速に進んで、よその部署に責任をかぶせるみたいな話を聞くようになってしまった。
ベトナムとの架け橋を目指して土曜ににベトナム人に日本語を教えていたがそれもやめてしまった。
人件費が削られやめてしまったり、解雇される人がどんどん出たりするのを見てこれが会社が大きくなることなんだって思った。所詮会社は出資者と経営者、株主のものであり社員は雇われているのに過ぎない。会社の利益と社員の利益は一致しない。
これが収穫期のベンチャーって事なんだろうけど、待っているのは収益化を成し遂げたベンチャー、ドワンゴのようにずっと続く後退戦なんだろうなと思う。決して増えないリソースの元で数少ない利益を株主と経営者に還元し続けるという。
あとさらに、AIチャットボットのテック企業と銘打っているいるがその実、IBMのワトソンを利用しているだけであり内部に自然言語処理のエンジニアは一人もいない。そもそのチャットボットを開発したエンジニアももうやめてしまっている。私が博士号取得者を人事に一度紹介した事がある。なにかよくわからないので却下といわれた。リサーチマップも見ずに。
個人的に一番文学部について許せないのは、自分たちがもはや「文」学を研究できなくなっているという単純なスペック不足を認識もしていなければ論じてもいない事だ
人類が生み出すtextの量と流通速度は、加速度的に高まり続けている。
文学部をなのる人々が対象としている文のウエートは全体の量に対して比率が下がり続けている。
万葉集に万の歌は載ってなくて大体4500くらいだが、tweetがどれくらいの総量書かれ読まれているか。
マスとしての文章を今のところ取り扱えているのは自然言語処理系の研究者の方であろう。
読む価値のありうる文を人力では読みきれない時代に、ずいぶんと前からなっている。その事実を論じも研究もせず、に何が文学部なのか。
機械学習とかファジィ論理とか自然言語処理とかこれだけ発展した世界で、「俺アスペだからさぁ(笑)常識とか言われても(笑)白黒はっきりしないとわかんないんだよね(笑)」という態度が「議論」を前向きに進めると勘違いするのはいい加減ダサい。(個人の愚痴ならわかる。個人的にはとても共感する。でもそれって「お気持ち」だよね。)
ボトムアップとトップダウンの思考法に得手不得手は人それぞれあるだろうし、そこに優劣はないが、「ボトムとトップを繋げて議論ができるかどうか」はそうした個人の性質とは無関係だよ。
https://togetter.com/li/1727672
カギカッコ付きの「あってしかるべき」がどういう含みを持たせているのかわからないのは単純な読解能力の問題かと。
「我思う故に我あり」から一歩踏み出さないことには何も始まらないのよ。そこで満足してちゃダメ。
余談だが、発達障害者は共感力が乏しいとかつては言われてきたが、実際には「発達障害者同士では強く共感し合う」という現象も確認されているらしいね。
記入する項目の例
「やりたいこと、興味のある仕事・分野」記入例
開発環境について触れる
今まで小さなチームでインフラからフロントエンドまで全てを担当してきたが、次は少し大きなプロダクトでバックエンドのパフォーマンス改善に挑戦できるような環境で仕事がしたい。
------------------------------------------------------
興味のある分野・領域について触れる
Railsアプリケーション設計・開発から、Heroku, AWS, GCPなどのインフラ構築もできるような、Webアプリケーションエンジニアになりたいと思っています。興味のある分野は、医療・健康などです。現在転職活動中です。 ------------------------------------------------------
より具体的な記入例
例1
# 目標 新しい技術に柔軟に対応できるようにしたい 自社開発のサービスに携わり、常に機能の改善・拡張を考えながら開発がしたい
# 興味のある仕事 自然言語処理や画像分析など、データを扱うアプリケーションの開発
# 転職先に求めること 新しい技術に対して敏感に反応し、プロダクトにマッチする場合はどんどん導入してゆく風習があるような職場で働きたいです。
そう思っている。
結論から言えば、SIerで数年働いてウォーターフォールを身に刻みつつWeb技術を趣味で学ぶ。その後アジャイルを標榜しているWebスタートアップに転職すれば良い。
往々にして(少なくとも日本における)Webスタートアップのアジャイルは上手く行かない。なぜならアジャイルとはなんたるかをきちんと学ばず、「なんとなく楽そう」とか「今時でイケてそう」みたいな動機で採用するからだ。
あらゆるプロジェクトが炎上しまくった結果、ウォーターフォールに回帰する瞬間が必ずやってくる。しかしWeb系でウォーターフォールの上流工程ができる人材は割と限られていて、その中にSIer出身でコテコテの上流工程やってたエンジニアが入るとかなり重宝されるのである。
アジャイルは、ウォーターフォールの酸いも甘いも経験してその対比でこそ真の利点が見えてくる。そうしてウォーターフォールもアジャイルも分かってる人材になれば、それだけでそのスタートアップでは唯一無二の存在である。
オーケストレーションだとか自然言語処理だとか純粋関数型だとかCSだとかで技術的に尖ろうとしても、そういう高度なものを求めているスタートアップは実際多くはない、というか既に席が埋まっている場合が多い。
T型人材とよく言われるけど、難しいことは何もなくて、タイトルに掲げた人並のものを2つ持っていればいい。OOPも知らない奴らがネストの深さは何層までだとかタブスペースは2つだとかforeach文使ってるやつはクソだとか表面ばかりに囚われて本質見誤って伸びきったスパゲティを量産しているような現場に、レガシーから飛び出したお前らが新風を巻き起こして欲しい。
そんな私の年収は400万です。
AIでどうこうする前に、そのAI (分類モデル) に与えるデータを整備しないと難しいだろうね。
例えば、問い合わせをユーザーに自由な文章で書かせるのではなく、選択式 (インストール / 設定 / 操作 / ...など) にしたり、質問の入力欄を分けて、1つの欄には1つの質問しか書かせないようにするとか。
それから、正しく分類するには、あらかじめ正しい答えも必要。過去の問い合わせ履歴から、「こういう問いは、このカテゴリの質問」というセットをたくさん用意しなければならない。
データを整備して、答えを用意してはじめて、技術 (機械学習とか自然言語処理とか) でユーザーの入力を正しいカテゴリに分類できるAIが作れると思うよ。今なら、そのへんをまとめたクラウドサービスで、チャットボットが簡単に作れるから、技術のほうはあまり気にしなくてもいいよ。むしろ、いかに正しいデータを集めるか。