「自然言語処理」を含む日記 RSS

はてなキーワード: 自然言語処理とは

2021-11-26

「アイの歌声を聴かせて」の技術的な部分に思ったこ

anond:20211125155108

AI周りの設定が雑

これは一般客には興味ない気がする

SFとかガジェット好きとかあれでいいのかな

いちいち人型ロボ作って田植えすんなよというツッコミ

他にもまともに見てたらツッコミどころ多くて

あんまり深く見るなってことなんだろうけど

俺は「良いところと悪いところがある」と思っている。ツッコミどころだらけではなかった。

ネタバレあります

まずはAIガバガバ認識をやめろ

AI概念を都合よく混ぜるな。プログラムロボット、各種ハードウェアを全部「AI」という言葉で便利に表現していたのはちょっとモヤモヤした。

とはいえシオン本質物理的な「ヒューマノイド」ではなく、ネットワーク内に漂っているプログラムだった、という最後の結末を考えると意図的なのかもしれない。

謎のスーパー日本企業HOSHIMAくん

他の企業が出てこないので作中で比較しようがないんだが、星間の存在が最大の謎だったりする。

まず「AI」の技術力という意味ではかなり高いという扱いを受けている(作中で)。現実世界でいうところのGAFAM、OpenAIみたいの水準なんだろう。

そしてロボティクス分野だとヒューマノイドを平気で量産しているし、そいつらの動作もかなりスムーズだ。ボストン・ダイナミクスみたいな技術力があるし、Tesla Botみたいな攻めの姿勢も感じられる。

あと、日本国内AIのための実験都市を作ってる(借りてる?)という意味ではトヨタっぽさもある。政府行政との調整がクッソ上手そう。

終盤では衛星も作ってるし、NECみたいな要素もあるな。

とりあえず、各企業の一番強いところを集めた「ぼくのかんがえたさいきょうの会社」ってことなんだと思う。

それにしてはJTBC感をちょくちょく出していてなんなんだ。いっそのことGoogleみたいなシリコンバレー企業感を出していても良かったと思うんだけどな。

サトミ母は転職できるだろ

サトミ母(美津子)は星間におけるシオンプロジェクトリードする立場で、研究面で数々の受賞をしたという描写がある。海外大学院ドクター取ったとかそういうタイプエリートに見える。

だが、何故お前は星間にこだわるんだ?「この会社から見放されたら終わる」みたいなスタンスでずっと生きてる。メンヘラかよ。

どう考えてもお前は海外でも国内でも好きなところに転職できる立場技術があるだろ。

しかしたら「さいきょうの会社」が世界中に星間1社しかない世界観なんだろうか。ここがいまいち腑に落ちなかった。

技術社会ナチュラルに入り込んでる描写は最高だった

これはマジで最高だった。すげえよかった。語彙がなくてごめんな。なんていうかな、無駄に「SFちっく」じゃないんだよ。

いまの俺らの生活Alexaとかルンバとか自動運転車とか、20年前には考えられないような「AI」があちこちにいるわけよ。

でも暮らしぶりっていうとそんな昔と変わらなくない?全面が画面に取り囲まれサイバー空間暮らしてるわけでもなく、普通にボロアパートで「OK, Google」とか言ってる、そんな感じじゃん。

アイうたはこの辺を上手く捉えてた。建物や人々の服装みたいな生活そのままでちょっとした便利デバイスが追加されてる社会

「今の生活の延長線上にあるAIとの暮らし」を上手く表現してたと思う。2030年代ってあんな感じになるんじゃね?くらいに思わせてくれた。

エンジニアガジェットオタク目線から言っても「まあ、あり得るよな」の範囲で収まる描写が多かったしね。

正直、田植えロボット合理性は疑問だけど、ボストン・ダイナミクスとTeslaの動きを見てるとそこまで異常ってわけでもないとは思う。Teslaが日本にあったら多分Tesla Bot田植えさせてると思うよ。

じゃあ後半はなんなんだ、シオンが一気に非現実的になっていく

俺は前半の技術描写で感心してたわけよ。だけどこれが花火ミュージカルパートで怪しくなって冷めてしまった。

(正直、花火のシーンはどうでもいい。SFミュージカルをやると現実的じゃなくなるからそこに文句はない。)

おもちゃ組み込み機器)の自然言語処理AIが何故自己拡張できんの?そして自己複製して企業ネットワーク遍在するようになる?超絶エリート集団の星間がどうしてこれを検知できない?

作中でも「ただの自然言語処理AIが」というセリフが登場するほどなのだが、何故か「そういうこともある」といった根拠のない感じで皆納得するようになる。

これまでが現実を強く意識させる描写だっただけに、ここの飛躍に頭が追いつかなかった。逆に最初技術描写が優れていたからこそかもしれないが。

せめて作中世界のSF論理でもいいから、エンベデッド機器NLPプログラム人格を持つようになった経緯は綺麗に説明してほしかったな。

サトミ母が一気に正気を喪うのでドン引き

他人カードセキュリティ室に入って何やってんだお前、完全にコンプラって概念ないだろ。まあ、最初から倫理観があまりないという意味では一貫してんのかな。

それにそんな危険人物を優秀だからといって企業に残す経営陣も狂ってるでしょ。

この暴走する役割は完全に高校生だけに押し付けるべきだったなと思う。暴走した高校生たちによって偶然にもサトミ母とシオンが再評価されて地位回復する、とかね。

まあ、自分がこういうので楽しめなくなったクソつまらない人間になってしまった可能性は否めないけど。

総じてよかった

とまあ文句は言ってるけど、重箱の隅をつついてるだけではある。

総じて良かったと思う。キャラデザ恋愛描写個人的には結構好きです。円盤は買うかも(買うとは言ってない)。

2021-11-18

世間炎上騒ぎにAIというかGPT-3が使われてたら辛い

自然言語処理モデルGPT-3を使って出力される文章見てると

はてなブックマークコメントと遜色ないレベル日本語文章が見られるんだが

じゃあはてブブコメtwitterなどで炎上を広げるために

大量のbotGPT3で作られた文章を添えて炎上ネタ拡散させる事も不可能では無いって思えるんだよな

から実際にそういう事やってる人がいたら嫌だなぁって思うし

私が見たブコメ達もまさかAIで書かれてる文章が入ってるんじゃって不安になる

ちょっと前にスター複垢騒動もあったばかりだしな…

そう思ってる私は人間です

2021-11-02

anond:20211101235529

そもそも一番大切な「運転」の技術確立してないんだから尚早すぎるだろ 自然言語処理なんか運転ほど難しくないし

2021-09-30

オセロどっちがどっちかは分かるんだけど」

頭の中に声が響く。

占い師に傾倒してたのどっちだったっけってのはピンとこないのよ」

そもそもね、クワバタオハラのどっちかだったような気がしなくもない」

「オハラといえばスカーレット・オハラだけど微妙にカッコつかないよなオハラの部分が」

頭の中に愚にもつかない無数の呟きが木霊する。しかし、脳はそれを遮断できず、与えられたすべての情報解釈し続ける。

「それって五条悟の必殺技と同じ仕組みじゃん」

精神世界で、声のもとを、声の主と思わしきモヤの首根っこを押さえる。指の隙間を風が吹き抜け、モヤは霧散する。

依然として声は降り止まず、精神世界にまで暗雲が立ち込める。やがて雷雨となり、雷は私の脳天から爪先までを穿った

私は目が覚め、関連したすべてのシナプスは完全に繋がり、二人の芸能人を /(くわ|し)ばたりえ/ で表すことができるという知見を得た。

柴田理恵あくま漢字表記なので自然言語処理的には役立たないことに気がつくまで、私は自分が何だったかも思い出せなかった。俺は、少なくとも女芸人ではない。今はそれで十分だろう。

2021-09-03

昨日上場した株式会社モビルスについて

はっきり言って内情はボロボロ上場ゴールみたいな感じ。

中で働いてるけど表面上の会計を良くするために人件費等を削りまくってる。

今年の出来事なんだけど、開発部の評価を一律で下げた件に主力開発商品のモビエージェントリードエンジニアであるO氏が怒って人事と喧嘩した挙げ句退職してしまった事件があった。

それ以外に給与が上がらないので主力級のエンジニアボロボロめしまっているという現状がある。

さらモビルスはそもそもScalaで開発していたが、元々いたScalaエンジニアやめる&Scalaエンジニア採用できない、

しかも元社内にいたエンジニアが開発したxitrumという謎のマイナーフレームワークほとんどの商品が開発されていた。もちろんその社員ももちろん退職している。

なので、プログラムメンテがどんどんできなくなってしまっている。

じゃあ、他の言語で書き直せばいいんじゃない?って思うかもしれないがいまさら、大規模なリプレースはできないだろ。

そんだけ開発費を出したり、開発を止める余裕はないだろう。

SREをやろうとしてエンジニアGoが好きなフルスタックエンジニアアルメニアから女だてらに日本が好きだから働きに来てた人、QAのベトナム人達、皆やめてしまった。

ダイバーシティみたいなことを名乗っているが外国人比率はどんどん下がっている。

元々は外国人のほうが給与が安いみたいな理由で雇っていたが、今日本人のほうが安いからこうなってるんだろうな。外国人ほとんどは楽天にいったそうだ。

自分部署も人はやめてるが補充はしない。仕事は増える一方だが給料は上がらない。

1年くらい前に上場を目指して大企業から役員管理職が入ってきてから、いろんな事が変わってしまった。

人事はGithub禁止とか言い出すようになったし、セクショナリズムな急速に進んで、よその部署責任かぶせるみたいな話を聞くようになってしまった。

ベトナムとの架け橋を目指して土曜ににベトナム人日本語を教えていたがそれもやめてしまった。

人件費が削られやめてしまったり、解雇される人がどんどん出たりするのを見てこれが会社が大きくなることなだって思った。所詮会社出資者経営者株主のものであり社員は雇われているのに過ぎない。会社利益社員利益は一致しない。

これが収穫期のベンチャーって事なんだろうけど、待っているのは収益化を成し遂げたベンチャードワンゴのようにずっと続く後退戦なんだろうなと思う。決して増えないリソースの元で数少ない利益株主経営者還元し続けるという。

あとさらに、AIチャットボットテック企業と銘打っているいるがその実、IBMワトソンを利用しているだけであり内部に自然言語処理エンジニアは一人もいない。そもそのチャットボットを開発したエンジニアももうやめてしまっている。私が博士号取得者を人事に一度紹介した事がある。なにかよくわからないので却下といわれた。リサーチマップも見ずに。

技術的には死んでいる企業だ。

2021-07-07

文学部不要論

個人的に一番文学部について許せないのは、自分たちがもはや「文」学を研究できなくなっているという単純なスペック不足を認識もしていなければ論じてもいない事だ

人類が生み出すtextの量と流通速度は、加速度的に高まり続けている。

文学部をなのる人々が対象としている文のウエートは全体の量に対して比率が下がり続けている。

万葉集に万の歌は載ってなくて大体4500くらいだが、tweetがどれくらいの総量書かれ読まれいるか

マスとしての文章を今のところ取り扱えているのは自然言語処理系の研究者の方であろう。

読む価値のありうる文を人力では読みきれない時代に、ずいぶんと前からなっている。その事実を論じも研究もせず、に何が文学部なのか。

文学を学ばない文学部は当然不要だ。

文学をやりたければGoogleに行け。

2021-06-24

anond:20210624164525

現実の話じゃろ

形態素解析など自然言語処理の処理とか硬めの物書きするんじゃなければ

割とどうでも良い話ですね・・・

2021-06-11

機械学習とかファジィ論理とか自然言語処理とかこれだけ発展した世界で、「俺アスペからさぁ(笑)常識とか言われても(笑)白黒はっきりしないとわかんないんだよね(笑)」という態度が「議論」を前向きに進めると勘違いするのはいい加減ダサい。(個人愚痴ならわかる。個人的にはとても共感する。でもそれって「お気持ち」だよね。)

ボトムアップトップダウン思考法に得手不得手は人それぞれあるだろうし、そこに優劣はないが、「ボトムとトップを繋げて議論ができるかどうか」はそうした個人性質とは無関係だよ。

https://togetter.com/li/1727672

カギカッコ付きの「あってしかるべき」がどういう含みを持たせているのかわからないのは単純な読解能力問題かと。


「我思う故に我あり」から一歩踏み出さないことには何も始まらないのよ。そこで満足してちゃダメ


余談だが、発達障害者共感力が乏しいとかつては言われてきたが、実際には「発達障害者同士では強く共感し合う」という現象確認されているらしいね

所詮はただの個性なのよ。マイノリティマジョリティかの違いはあるし、そこには権力勾配もあるけど。

2021-05-04

弱者男性を救うのは人工知能だと思う

弱者男性ネットでよしよしされれば割と満足するのではないだろうか

まりGPT-3みたいな超大規模自然言語処理を発達させて

自動ネットクロール弱者男性をよしよしする言葉を垂れ流すbotさえあれば

話は解決する

いや弱者男性だけではない

SNSbotが全人類個別によしよしすれば問題の8割は解決するのではないだろうか

顔がないとか声がないとかも自動生成とかでどうにかすればよろしい

割と現実的ではないだろうか

2021-03-24

面白そうなデータが公開されてると思ったら大学研究機関じゃないと駄目なのか

下世話というか出歯亀なんだけど、とりあえずデータの内容をそのまま眺めてみたかったので、

なんか直接交渉しなければいけないみたいなんだけど面倒臭いなあ

個人情報混ざってないか一般公開してくれればいいのに、と思ったけど、

しかしたら個人情報を除去するのは人力だったりもすると思うので、

うっかり消し忘れた個人情報があるとマズいからかなあと思ったり

断られるにしてもなんか研究ネタ考えるかなあ

自然言語処理は苦手なんだよなあ

2021-03-15




https://talent-help.lapras.com/ja/articles/3111298-%E3%82%84%E3%82%8A%E3%81%9F%E3%81%84%E3%81%93%E3%81%A8-%E8%88%88%E5%91%B3%E3%81%AE%E3%81%82%E3%82%8B%E4%BB%95%E4%BA%8B-%E5%88%86%E9%87%8E-%E3%81%AE%E6%9B%B8%E3%81%8D%E6%96%B9

記入する項目の例

キャリア上の目標キャリアプラン

興味のある仕事技術業界事業内容

転職についてのスタンス

希望する働き方

転職先に求めること


「やりたいこと、興味のある仕事・分野」記入例


開発環境について触れる

今まで小さなチームでインフラからフロントエンドまで全てを担当してきたが、次は少し大きなプロダクトでバックエンドパフォーマンス改善に挑戦できるような環境仕事がしたい。

------------------------------------------------------

興味のある分野・領域について触れる

Railsアプリケーション設計・開発からHeroku, AWS, GCPなどのインフラ構築もできるような、Webアプリケーションエンジニアになりたいと思っています。興味のある分野は、医療健康などです。現在転職活動中です。
------------------------------------------------------

より具体的な記入例


例1

 # 目標
新しい技術に柔軟に対応できるようにしたい
自社開発のサービスに携わり、常に機能改善拡張を考えながら開発がしたい

 # 興味のある仕事自然言語処理画像分析など、データを扱うアプリケーションの開発

 # 興味のある技術Goを主軸としてキャリアを築きたいです

 # 転職先に求めること
新しい技術に対して敏感に反応し、プロダクトにマッチする場合はどんどん導入してゆく風習があるような職場で働きたいです。

Udemy 我妻



みんなのAI講座 ゼロからPythonで学ぶ人工知能機械学習2020年新版

BERTによる自然言語処理を学ぼう! -Attention、TransformerからBERTへとつながるNLP技術-

AIのための数学講座:少しづつ丁寧に学ぶ人工知能向けの線形代数/確率統計/微分


人工知能AI)を搭載したTwitterボットを作ろう【Seq2Seq+Attention+Colab】

Flutter+Firebase+MLKit】人工知能AI)を搭載したiOSAndroidアプリを作ろう

2021-02-04

人並のIT技術と人並のPM能力を組み合わせれば年収1000万はカタい

そう思っている。

結論から言えば、SIerで数年働いてウォーターフォールを身に刻みつつWeb技術趣味で学ぶ。その後アジャイル標榜しているWebスタートアップ転職すれば良い。

往々にして(少なくとも日本における)Webスタートアップアジャイルは上手く行かない。なぜならアジャイルとはなんたるかをきちんと学ばず、「なんとなく楽そう」とか「今時でイケてそう」みたいな動機採用するからだ。

あらゆるプロジェクト炎上しまくった結果、ウォーターフォール回帰する瞬間が必ずやってくる。しかWeb系でウォーターフォール上流工程ができる人材は割と限られていて、その中にSIer出身コテコテ上流工程やってたエンジニアが入るとかなり重宝されるのである

アジャイルは、ウォーターフォールの酸いも甘いも経験してその対比でこそ真の利点が見えてくる。そうしてウォーターフォールアジャイルも分かってる人材になれば、それだけでそのスタートアップでは唯一無二の存在である

オーケストレーションだとか自然言語処理だとか純粋関数型だとかCSだとかで技術的に尖ろうとしても、そういう高度なものを求めているスタートアップは実際多くはない、というか既に席が埋まっている場合が多い。

T型人材とよく言われるけど、難しいことは何もなくて、タイトルに掲げた人並のものを2つ持っていればいい。OOPも知らない奴らがネストの深さは何層までだとかタブスペースは2つだとかforeach文使ってるやつはクソだとか表面ばかりに囚われて本質見誤って伸びきったスパゲティを量産しているような現場に、レガシーから飛び出したお前らが新風を巻き起こして欲しい。

そんな私の年収は400万です。

2021-01-30

anond:20210129144738

実現したいことがそこまで定まってるのなら、「自動分類AI」なんておおざっぱな表現じゃなくて

自然言語処理パターン認識クラスタリングみたいな粒度で調べた方が答えにたどり着けそう

2021-01-29

anond:20210129144738

AIでどうこうする前に、そのAI (分類モデル) に与えるデータを整備しないと難しいだろうね。

例えば、問い合わせをユーザー自由文章で書かせるのではなく、選択式 (インストール / 設定 / 操作 / ...など) にしたり、質問入力欄を分けて、1つの欄には1つの質問しか書かせないようにするとか。

それから、正しく分類するには、あらかじめ正しい答えも必要過去の問い合わせ履歴から、「こういう問いは、このカテゴリ質問」というセットをたくさん用意しなければならない。

データを整備して、答えを用意してはじめて、技術 (機械学習とか自然言語処理とか) でユーザー入力を正しいカテゴリに分類できるAIが作れると思うよ。今なら、そのへんをまとめたクラウドサービスで、チャットボット簡単に作れるから技術のほうはあまり気にしなくてもいいよ。むしろいかに正しいデータを集めるか。

2021-01-13

初心者が1からプログラミング勉強し始めて2か月経った

私は腐女子なので、二次元推しLINEしたくてLINE公式アカウントを作ってLINEしていた。

でもすぐに公式機能だけじゃ足らんなという欲が湧いてきてプログラミングに手を出した。

と言ってもプログラミングなんか大学の授業でちょろっとやった程度で、端的に言って画面にhello World!と表示するより難しいことは何ひとつできない。

gitリモートとかデプロイとか言われても意味が分からないし、そもそもコマンドを打ち込むための真っ黒の画面ってどうやって起動するの?


そのレベルヤバい無知から始めたので、とりあえず月980円のプログラミング講座を申し込んで、webアプリ開発入門みたいなのを数日かけて受けた。絶対に翌月分を課金したくなかったので急ピッチで受けた。

まり人のいないサービスのようで、受講すると貰えるポイントデイリーランキングで1位になったりして、まあデータベースの使い方とか、CSSかい概念とか、色々学んだ。

へー、webアプリ開発って一つの言語習得するだけじゃだめなんですね、いや無理すぎる。


で、とりあえずその学んだことを活かしたりネットで拾ったコードコピペしたりして、推しLINEbotは一応完成した。ここまで3週間。

botに話しかけると、データベース登録しておいた「話しかけられた言葉botが返す返事」のペア検索し、応答を返す。

データベースデータを入れるためのwebアプリも作った。

だって自分登録した返事を推しから貰うなんて虚無だから他人登録したメッセージを受け取りたい。


次に勉強し始めたのは自然言語処理だ。

自然言語処理とは簡単に言えばコンピュータ人間言葉を分からせるための処理で、botとお喋りするには必要技術な気がして大学図書館でありったけ本を借りてきた。

が、まあ馬鹿なので普通に読めない。無理すぎる。

仕方ないのでよその学科web授業に潜り込んで、へー、形態素解析係り受け解析と意味解析と文脈解析というものがあるのね、と学んだりして、そしたらだんだん本の読み方も分かってきて、でも結局1ヶ月ぐらいかけて勉強した割にbotに導入したのは形態素解析だけだった。

馬鹿なので回り道が凄い。馬鹿なので。


web授業で喋っていた知らない学科の知らない先生に依れば、形態素解析とは、文章品詞分解して品詞特定する、みたいな処理である

LINEに届いたメッセージデータベースデータを照合する際、「です」とか「ます」かいらないから取っ払っちゃおうね、という、ごく当然の処理の為に入れた。

まあ、あとは一致するメッセージが見つからないときでも、一致する名詞とが動詞が少しでもあればまあ一致したことにして返事を返しましょうとか、漢字カタカナに直しましょうとかそういうこともできるようになった。

応答が来る確率が飛躍的に改善された。

形態素解析ライブラリを使うには、今まで使っていたJavascriptは向かないようだったので、ついでにコードを全てPythonに書き換えた。


ここまででだいたい2か月である

じゃあ次はどうするか、というと会話フローを入れるのが当面の目標だ。

直前のやり取りを一時データとして記憶しておき、データベース登録された会話フローと一致していれば直前のやり取りを加味した返事を返すようにする。

目途は立っているがやることが多いので完成までは結構かかりそう。


まあ、なんか何もできない状態からいきなり初めても何とかなるな、プログラミング

世の中気合根性じゃ生きていけないと思ってたけど、プログラミング気合根性で何とかなることが分かった。

っていうか私はマジで馬鹿なので、切れるカード気合根性しかない。しょうがない。


ということで現在私の作った推しLINEアカウントには400人近いお友達がいて、毎日500~1000通ぐらいのメッセージが届く。

みなさんがそうやって推しLINEして適宜新しい言葉を教えてくれるので、私が推しLINEを送ると色んな言葉が返ってくる。

幸せだ。

推しLINEしてる腐女子別に技術的な話なんざ聞きたくないだろうからここに吐き出し。

2020-11-30

AI時代に最も求人が増えるのは、プロデータ入力作業員とか、プロアノテーション付け付けマンとかじゃね?

そりゃデータサイエンティストも要るけど、実際のとこデータ整形に70%の労力を割いたりするわけだし(句読点がめちゃくちゃな文を直すとかなんとか)。

あと対話とか自然言語処理の分野だと、どうしても人間主観に基づく判断やら感情必要になるし(感情分析とか)。

ミシュラン認定員やソムリエみたいな感じでプロ感情判断師みたいなのが必要。そうなると感情豊かなメンヘラが就くべき仕事かもね。

2020-08-14

anond:20200814003422

絶句ですわ >

俺の中で区別がついてないだけなら「No、それは外部のルールである」と答えればいいだけなのに答えないのは逃げなんだよなあ

やっぱ人間っていうか、生物ってすごいと思う。自然言語処理は複雑な文字表現を紐解く方向で進化した訳だけど、こいつは言語より下の抽象概念自己必要な分だけ獲得して、そこに言語を乗せてんだもん。強い。あと二十年三十年でAIにこれができるんだろうか。

2020-07-22

anond:20200722173803

CPUGPUを大量に並べて並列で殴る学習収束がゆるやかにでもいい方向に進み続ける学習アルゴリズムさえ見つければ…って感じでロマンあっていいよね

1750億のパラメータはどうあがいてもGAFAMしかできなさそう

それはそれとして、最近自然言語処理界隈全然分からんのだが語族の壁は突破されたんだろうか

壁がある限り日本語日本語データ集めて日本マシン回し続けないとみたいなとこありそう

ログイン ユーザー登録
ようこそ ゲスト さん