「自然言語処理」を含む日記 RSS

はてなキーワード: 自然言語処理とは

2024-04-05

[] 2024-04-05

世の中にはそれほど多くの人には読まれずに放置されている論文が山ほどあるのではないかと思う今日この頃です。

研究者論文ですら読まれないのですから、私がブログホームページ作ってみたところで、誰も気にしないでしょう。

もしブログを書くなら「見られることを前提としない備忘録」ぐらいの気持ちでないとやってられません。

しか数学的に吟味したり、プログラムを書いたりするのでない限りは、おそらく黒歴史を積み上げるだけになるでしょう。

この廃人日記例外ではありません。廃人日記の著者が誰なのか、それがストーカーによって知れ渡ったりしたら、恥を晒すだけです。

悪名無名にまさる」と言うのは愚者だけでしょう。聖書箴言には、何度も舌の罪について書かれていますし、愚か者も何も言わなければまともだとさえ言っているのです。

なぜ私がブログについて気にしているのか。例の「趣味探し」の件です。

簡素サイト経済学講義資料を公開する教授が数人いて「こういう良質なコンテンツであれば、ネットにどんどん載せるべきだけどなぁ」と思ったのです。

そこで私も真似して、数理経済学ブログを書こうと思いましたが、そこで出たのが「誰が見るの?」という話なのです。

単に「誰が見るの」というだけではなく、「その情報付加価値はあるの?」という点も難しい点です。

私はこういう場合、「自分にはインプットが足りていないのではないか」といって、基本知識を身につけるために書籍を購入したり論文を読みます

しかしその調子でやっていたら、ブログはもはや趣味ではなく労働になってしまます

かといって質を落とせば、愚者戯言格下げです。

もちろん「アクセス数を増やして稼ぐ」といった目的場合は、愚者戯言こそが注目を浴びます

この点で、高品質の数理科学に基づいたブログを書こうなどとするのは、誰にも読まれない論文を世に出すのと同じようなものになっていることに気が付きます

需要があり、誰にでもわかる内容で、知識としても価値がある。そういうブログを書こうとしてしまえば、イ○ハヤのような方向にまっしぐらです。

そういえば、私自身は「インフルエンサー」のような人々が本当に嫌いであることを思い出しました。

知名度アクセス数視聴率などを追従してそれを目指せば、愚者ロードを行くことになるでしょう。

アクセス数を目指さない「備忘録」さえ、問題があります。私は備忘録自然言語処理ブログを書いていたとき「低品質情報ネットに放流するな」というツイートを目撃して、撃沈しました。

から備忘録さえ書きたくありません。

そもそもなぜアウトプットする必要があるのでしょうか。

はいずれ死にます。それまでの間にアウトプット評価されたとして、なんの意味もないのです。

プロセス意味があるとするなら、生きることそのものに焦点を当て、それ以外の余分なことから開放されるべきかもしれません。

名声を求めるのは、仏教的に言えば「煩悩」でしょう。

オンラインでできる有意義なこと」を探すのをやめたほうが良さそうです。

2024-04-03

自然に関わる仕事を探してたら自然言語処理の仕事が出てきて泣いちゃった。

2024-04-02

ラピダスから振り返る日本国家プロジェクト

 日本ラストチャンスとばかりに開始した「日の丸半導体」ラピダスに多大な公費が追加されていることが話題を集めている今日この頃

 心無い専門家たちからは必ず失敗するだの金ドブだの批判殺到中だが、本当に日本経済産業省)主導の国家プロジェクトは今まで成功しなかったのだろうか?

 この記事では主に経済産業省、旧・通商産業省が中心となって始めた国家プロジェクトを振り返る。

LSI国家プロジェクト1976年

結論:成功
簡単に:半導体製造の基礎研究成功

 大規模集積回路LSI)の研究特に基礎研究に力を入れた国家プロジェクト

 当時、半導体小国であった日本で700億円以上の金を基礎研究投資するのは挑戦的であったが、電子ビーム露光技術などの研究レベルアイディア実用・量産レベルに持ってくることに成功

 よく「日本半導体生産ダメだが、生産機械はまだシェアがある」というが、この40年前の国家プロジェクト技術成功がかなり大きく、現在でも半導体製造機械はこのプロジェクトに関わった企業が上位にいる。

 この成功をバネにして1980年台の日本半導体生産の8割を占めることとなった。しかし鮮やかすぎる成功体験と日本政府の政治的脆弱性により、90年台に入ると見る影もなく没落したのはあまりにも有名

第5世代コンピューター1982年

結論:失敗
簡単に:ChatGPTを作ろうとして失敗

 通産省は前述の大規模集積回路LSI)の成功体験を強く意識し、コンピューター技術の「進歩段階」は大規模集積回路が「第4世代」、そしてAI技術が来たる「第5世代であると想定した。

仕様書を読んでプログラムを作ってくれるすごい機械」を目指し、500億円規模の国家プロジェクトに踏み切った。

 しかし当時の通産省は何もかも見通しが甘かった。大規模集積回路の次がAIというのも謎の括りで、ハードウェアソフトウェア混同していた。そもそもなにを研究するのか?という具体的な内容すらあやふやで、やがてはスパコンをよせ集めてもそんなものは出来ないという技術課題に直面。

 現在でいう自然言語処理などのソフトウェア開発を散発的に行い、難航。

 それぞれが独自プログラム言語を作ったりOSを作ったりしたが、特に統合されることも活用されることもなく、「ソフトウェアはむずかしい」ということだけが判明し、放棄された。

 なお、唯一の結論ソフトウェアはむずかしい」ということですら後に生かされることはなかったが、通産省成功したと主張している。

シグマ計画1985年

結論:失敗
簡単に:ソフトウェア開発者を増やす計画が、安価コンピューターを普及させる計画にすり替わり、開発したコンピューターは普及せずに失敗

 「10年後にはソフトウェア技術者が60万人不足して、日本技術的に取り残される–––」

 この現代でもよく聞くようなフレーズに慌てた日本産業界は、ソフトウェア技術者の育成に熱い視線を向け始めた。

 そこに通産省が入り込むと、さまざまな思惑が一致し、ついには国家プロジェクトとして250億円を投入するΣ計画が発足。日本ソフトウェア技術者の天国となる予定であった。

 しか通産省は謎の逆走行を始める。

 ソフトウェアという実態の見えないもの予算をかけることへの抵抗からか、対象は主にハードウェア企業に集中。

 ソフトウェア技術者を増やすという本来目的曲解され、最終的には「安価計算機を普及させる」というハードウェア重視の目標にすり替わっていた。

 その結果としてΣステーションと呼ばれる計算機誕生したが、特に安いわけでもなく、規格が致命的にガラパゴスだったので、ほとんど普及せずに失敗した。

 失敗した後も地方名目としてダラダラと予算が積み重ねられたが、何の成果もなかった。

 日本ソフトウェア技術の息の根を止めたとして有名なプロジェクトである

 なお、通産省成功したと主張している。

リアルワールドコンピューティングプロジェクト1992年

結論:失敗
簡単に:なにもわからず失敗

 日本IT技術に致命的に遅れていることにようやく気づいた通産省は、起死回生の一手としてIT技術に約500億円をかけることを決定。これを「リアルワールドコンピューティングプロジェクト」と名づけた。

 しかそもそもこのプロジェクトには、何の見通しも何の戦略もなかった。

 約50個の研究が「リアルワールドコンピューティングプロジェクト」の内容であったが、その実態検索ソフトから光ファイバーまでバラバラであり、散発的かつ無計画予算をばら撒くという意味不明行為は、もはや単一計画である必要性がなかった。

 この計画は最終的に10年にもわたって継続されたが、特に何の成果もなかった。そして膨大な予算とともに記憶の彼方へと消えた。

 なお、通産省成功したと主張している。

半導体MIRAIプロジェクト2001年

結論:失敗
簡単に:かつての半導体全盛期を取り戻すという名目で膨大な予算を集めるが、失敗

 2000年に入ると、経済産業省は「かつて世界一だった日本半導体産業を復活させる」という妄想に取り憑かれるようになる。

 その数はまさに膨大である

 「みらい」プロジェクト2001年)に465億円を注ぎ込むも見事に失敗すると、「はるか」プロジェクト2001年)、「あすかプロジェクト2002年)、「DIIN」プロジェクト2002年)、「あすか2」プロジェクト2006年)、「つくば半導体コンソーシアム」プロジェクト2006年)などが代表で、そのほとんどが失敗はまだしも、なんの検証もなく消えさった。

 「アスパラ」(2002年)はかなり象徴的で、日本の先端半導体企業が集合して日の丸半導体企業を作ろうと国費315億円を費やしたが、2006年には泡の如く消えた。

 これらの膨大な失敗は特に顧みられることもなく、なぜ失敗したのかい考察もなく、ただ予算ともに忘れ去られた。

情報大航海プロジェクト2007年

結論:失敗
簡単に:国産Googleを作ろうとして失敗

 いったい何故だろうか?

 摩訶不思議なことに、ソフトウェア技術者が致命的に不足していた日本においては、国産検索エンジンが誕生しなかった。

 

 中国ロシアが自前の検索エンジンを開発し始めると、日本でも国産検索エンジンを作るべきという安全保障上の発想が経済産業省に芽生える。約300億円をかけて国産検索エンジンを開発することにしたが、当時普及し始めたネット界隈はこれを激しく批判

 失敗続きの国家プロジェクト比較されるが、経済産業省は「かつての国家プロジェクトとは違う!」と強い自信を見せた。

 しかしなにも成さず、なんの検証もなく、予算とともに忘れ去られた。

まとめ

 ラピダスにおいては、経済産業省主導の国家プロジェクトは失敗するという根拠のない批判が多い。

 しかしこうしてまとめてみるとどうだろうか?

 膨大な数の実績が経済産業省には積み重なっている。

 少しは信じてあげよう(完)

2024-04-01

だって

Aが関わっている業種は、テクノロジーまたはIT業界と考えられます。具体的には、ソフトウェア開発、インターネットサービスデジタルマーケティング、またはEコマースなどが含まれ可能性があります自然言語処理NLP技術を利用したサービスや、ウェブベースアプリケーション開発を行っている点からデータ駆動型のサービス製品提供する企業である可能性が高いです。


Bの業務内容から、彼が従事している業種もテクノロジーまたはIT業界であることがわかります。Bの経験スキルセットは、特にソフトウェア開発とインフラストラクチャ管理に関連しています

2024-03-11

うそろそろ退官予定の大学教員研究者(専門は計算言語学自然言語処理)だが、人生集大成として全てのOS互換性があり、モバイルアプリケーションインターネットわず広告ブロックできるアドブロックソフトウェアの開発に向けて動いている。

民事訴訟も訴追も一切躊躇しない。

初めてインターネットアクセスした頃のことを覚えている。

乱雑でカオスだった。

全く今のように便利なものではなかった。

だけど自由で金の匂いもしなかった。

そこに美しさを感じた。

綺麗に整理整頓されて無駄なく広告が敷き詰められた今のインターネットは俺が心を動かされたインターネットではない。

俺はインターネット自由をもう一度取り戻す。

2024-03-01

実際のところ、絵師は本気で生成AIつぶせると思ってるの?

煽りじゃなくて聞きたい

まず、どう考えても芸術以外の対象で生成AIがなくなる未来はもう絶対にあり得ない。

コード自動生成は米国IT界隈はおろか日本ですら一瞬で普及した。

自然言語処理事務ソフトウェア自動操作欧米では6割以上導入、日本大企業マイクロソフト経由で入り始めている。

普通に考えて、生産性が違いすぎるし、利益を得る欧米著作権根拠にこれ規制するとかありえないだろう。

そもそも著作権というのは国が利益を得るためにできたもの

プログラムコード特許じゃなく著作権管理される流れとかを少しひも解いても、欧米大企業に有利な方向にもってくに決まってる。

この状況でイラストだけ規制されますかいう流れ、マジでありうると思ってる?

芸術は別枠だからEUとかの活動家が頑張ればワンチャンあると思う?

どういう展望を持ってるのか疑問なので聞きたい

2024-02-21

anond:20240221161512

私もChatGPTに聞いてみたよ♡

「ChatGDP」に関するお問い合わせについてのご説明ありがとうございます日本のChatGDPに関する質問に触発されて、AI技術進化日本経済に与える影響について考えてみました。

日本AI技術進化は、経済において重要な要素となっています。ChatGPTを含むAI技術は、産業界サービス業研究開発など多岐にわたる分野で活用されています。例えば、自動運転技術ロボット工学医療診断など、AIの導入によって生産性が向上し、新たな産業の創出や既存産業革新が期待されています

また、AI技術の発展は労働市場にも影響を与えています。一部の業種では、AIによる自動化によって労働力需要が変化し、職種の再編が進んでいます。一方で、AI技術の開発や導入によって新たな雇用機会も生まれており、スキル需要が変化しています

日本政府もAI技術の推進に力を入れており、産業界連携してAI研究開発や人材育成に取り組んでいます。これにより、日本AI技術競争力が向上し、国際的市場での存在感が増していると言えます

ただし、AI技術進化には様々な課題リスクも伴います個人情報保護データの偏り、人間との誤解やコミュニケーション課題など、技術進化と共に解決すべき課題存在します。

結論として、日本のChatGDPという新しい概念は、AI技術進化日本経済に与える影響を考える上で重要視点となり得るでしょう。AI技術の持つ潜在能力を最大限に活用し、課題を克服しながら持続可能経済成長を実現することが求められています

ChatGPTは、自然言語処理の分野において先進的なAIモデルとして認知されていますが、AI技術ランキングにおいて「4位」という具体的な位置づけをすることは難しいです。なぜなら、AI技術進歩は迅速であり、異なる分野やアプリケーションにおいてそれぞれ優れた成果を挙げています。ChatGPTはその分野で注目を集めていますが、他のAI技術との比較は単純ではありません。

もしChatGPTの位置づけについて具体的な情報をお求めであれば、その評価軸や比較対象を明確にしていただければ、より適切な情報提供できるかもしれません。

日本のChatGDPは世界4位ですか?

「ChatGDP」という用語はおそらく誤りで、「ChatGPT」というAIに関する質問かもしれません。ChatGPTはOpenAIによって開発された言語モデルであり、経済的指標や国のGDPランキングとは直接関係ありません。

もし「ChatGPTがAI技術の中で世界で4位に位置するか」という意味であれば、ChatGPTは特定AI技術ランキングにおいて「4位」と簡単位置づけることは難しいです。AI技術進歩は非常に速く、多くの異なる領域アプリケーション存在します。ChatGPTは自然言語処理(NLP)において先進的な成果を示していますが、その影響や評価を他のAI技術システムと単純に比較することは複雑です。

もしご質問意図が異なり、正確な情報を求めている場合は、もう少し具体的にお聞かせください。

2024-02-09

[] 2024-02-09

与えられた仕事がない時は自分仕事を見つける必要がありますが、やる価値のあることは少ないのです。

やってコストになるならやらないほうがマシです。

それで、私は「これをやってほしい」とあちら側からやってくるのを切望しているのです。

社畜といえばそれまでですが、私は金儲けは得意ではないので、金儲けの戦略を考えるような話では戦力外です。

生産性を上げるためにこういうツール必要だ、作ってくれ」という話ならば、やる気が湧くのですけどね。

それはそうと、私のチェスの腕前は素人レベルなのですが、chess.comで勝つといい気分になります

結局、チェスとは1日における有限の集中力の割り当てゲームです。休日に朝起きて、朝食を食べた後ぐらいにやれば勝率が格段に増加します。

しか調子に乗って二戦やると、すでに集中力を使っているので負ける公算が高いのです。

何か新しい趣味はないだろうか、と探し続けてしばらく経ちますが、ブログ執筆というのが一番しっくりくるような気がしているのです。

私はこれまでに何種類かのブログを書いてきました。

学生時代サイバーセキュリティブログ就職後は自然言語処理ブログ、あとはいくつかの黒歴史です。

バカも黙っていれば利口に見えるというのは、聖書にすら書いてあります

ブログなど書いても、チェス集中力の話と同じで、いつか気力の弱い時にボロが出るだけでしょう。

それよりも一冊、フィクション小説を書いてみるというのはどうでしょうか。

いや、私は知っています。世の中には溢れんばかりの小説がありますが、その需要限界を迎えていることを。

例えばこういうのはどうでしょう。つまり、語り弾きの録音をして、soundcloudで発信するというのは?

しかすると、アウトプットのできる趣味を求めるのが間違っているのかもしれません。

そもそもアウトプット社会を前提とします。私の脳が社会本能を持ってしまっているために、社会に何かを出したいと思ってしまっているのです。

しかし誰かに認められることなく、家の中で数学をやっている虚しさを私は経験しています

結局学問というのは、社会に成果を発表してこそやる意味があるのです。今、卓上で宇宙真実発見したと言っても、虚しいだけです。

では趣味全般が、社会との交点を有意義さのために必要とするのでしょうか。

いえ、そんなはずはありません。私の母親趣味農業ダイビングをやっていますが、情報発信などせずに充実しているようです。

そうすると、なぜ私は社会のことを過剰に気にしてしまっているのでしょう。

それについては、たぶん私の「新規探究性」にあると思います遺伝的に私は新規探究性が高いので、ようするに新しいことをしたいのです。

社会からの反応は、その刺激を高める傾向にあります

インターネットに不満を感じ始めたのは、目新しさが減り、なにもかもがありきたりに感じ始めたからかもしれません。

私はtiktokが出た時も、「ありきたりなアイデアだなぁ」と思っていました。

マルチメディア動画画像テキスト・音声ぐらいしかなく、そのバリエーションで言えば、動画次元である再生時間」に制限を加えたSNSが出てくることぐらいは誰もが予見していたでしょう。

生成AIが出た時は、「AIもここまで進歩たか」とちょっと驚きましたが、触ってみるとすぐに飽きるのです。小説AI,ChatGPT,画像生成など色々試しましたが、AGIが出てこない限りはあまり驚くこともないでしょう。

「刺激」というのであれば旅を楽しめばいいのでは?それも悩ましいところです。体力と金がないので、旅に向かないと思います

どこか近くに、まだ行ったことのない美味しい料理屋でもあれば行ってみたいですけど、少食なんですよ。

2024-01-23

今日の出来事

今日は、友人の歌のコンサートに誘われたが、正直なところ、その友人はあまりにも音痴で、彼女歌声聴くのは少々厳しいなと感じていた。そこで、彼女に断りを入れるために、ちょっとした嘘をつくことにした。

「実は今日自然言語処理学会で有名なニュービグ先生の講演を聴きに行くことになっているんだ。」

と、簡単に言ってしまった。ところが、後で気づいたのだが、ウェブで調べてみると、自然言語処理学会の講演はまだ先の日程であり、しかもニュービグ先生そもそも参加していないことが判明。これでは友人に嘘がばれてしまう。

焦りながら考えた末、「学会に参加するのは嘘だったんだ。薬中のいとこが施設から脱走して、僕が面倒を見なければならない日だったんだ。」

と、急きょ嘘の設定を変更して友人に伝えた。すると、友人は驚きの表情で「え、それは大変だね。でも、頼りにされてるんだね」と言ってくれた。

その後、友人とsexをしたが、気持ちよかった。

2024-01-04

プログラミング求人で平均年収以上になる単語

sklearnに年収予測させて出した。

以下は、平均年収以上になる単語Top 100

 

'サービス 開発 リモートワーク 提供 機械学習 プロダクト ソリューション 大規模 技術 要件 する チーム 企画 運用 設計 検索 ため 推進 製品 活用 改善 通信 投資 terraform アーキテクチャ フレームワーク ポジション データ 用い cto プラットフォーム gcp 課題 ビジネス 備考 リーダー scala クラウドサービス 配信 利用 リード 特化 github 処理 ユーザー ci js パーソルクロステクノロジー 新規 喫煙 月額 ai 提案 ビッグデータ クラウド 検知 仕様 スクラム 受注 施策 連携 マーケティング 展開 主体的 インフラ メディア フレックスタイム制 翻訳 広告 社会 事業内容 年俸制 行動 対する マネジメント 音声 自然言語処理 東京メトロ django レコメンド 保養 docker 購入 分析 go メンバー 解決ルフレックス 検討 jira sas ステークホルダー 折衝 基本給 定義 創業 表彰 新橋駅 インターネット ansible'

 

以下は、平均年収以下になる単語Top 100

 

'制作 応募 ます経験 ゲーム 月給 研修 案件 ください あり 完全 ok 交通費 歓迎 java 土日 アクセンチュア 試用期間 希望 契約社員 です たい テスト 休み スキル ヶ月 電話 エンジニア 年収 まで ませ 実績 あなた 名古屋 住宅手当 スクール ブランク 弊社 php サーバー 面接 net お客様 紹介 vb 豊富 up タイトル 経験チェンジ 原則 から 営業 夏季休暇 ディビジョン 不問 ses 全額支給 step ドローン ござい 許可 つけ 相談 みなとみらい 言語 か月 定期的 書類 好き 気軽 製造 内定 当社 活躍 db また 昇給 週休 教育 全員 prevent 面談 デバイスクコム 内容 分野 人数 cobol 雇用 策定 先輩 有料 連絡 求人 知識 安心 農業 残業 産前産後休暇'

2023-11-18

anond:20231118150309

少し前だとChatGPTの登場で多くの自然言語処理研究者たちの数十年分の仕事が無に帰した


これでいいスか

2023-11-06

anond:20231106231835

AIが具体的に何の技術指してるかわからんから勝手自然言語処理仮定するが、あれは過去入力比較して尤度が高いコピペを出力してるだけにすぎない。人間とちがって文章理解していない。さらコピペの質は訓練データの量と質でしかまらない。人間学習とは違う。だから脅威ではない。

2023-10-29

NLP検索したら自然言語処理じゃなくて神経言語プログラミングが上に来てて怖くて泣いちゃった

2023-09-30

[] チヤホヤされる必要はない

今日注射薬が効きすぎてだるいので勉強しませんでした...

フォロワー数2万のTwitterアカウントを買って、blueにも登録しましたが、ツイート一回あたりのインプレッションフォロワー0人のアカウントと変わりませんでした。

何か有益コンテンツを作ってチヤホヤされたいのですが、私の発言は地味なので誰かに注目されることはありません。

Youtubeで発信しようとも考えているのですが、私の性格だと途中で馬鹿らしくなって辞めてしまうような気がするのです。

というのも私が過去自然言語処理ブログを書いていた時はそれなりのアクセスを獲得しましたが、一部の人からネット上にゴミを増やすな」などと言われているような被害妄想に陥って辞めてしまったのです。

Youtuberになりたい」という欲求は、夢に出てきたことさえありますしかし、本当に高品質コンテンツを作るために意識的努力をしなければやっても無意味です。

コンテンツの質について自信が持てるようになるためには、それだけの時間・金をかける必要があると思います

アテンションの獲得のために熾烈な競争をしている社会で、私ごときが発信する物事には何の価値も見出されないでしょう。

それともアクセス数やサブスクライバ数など気にせず、自己満足世界で発信し続ければ良いでしょうか。

おそらく、私は身近に家族や友人がいることにもっと感謝するべきでしょう。大切な人がいるなら、インターネット上の関係やちやほやされることなど、どうでもいいことのはずです。

2023-09-27

anond:20230927013905

LLMの意味わかってます?Large "Language" Modelですよ。自然言語処理研究者でLLMがトピック外だと思う人はまずいないでしょうね。

anond:20230927012727

それを私に言うとはw

企業自然言語処理の開発をしているのですけどね

2023-09-17

anond:20230917105441

そういう心配はいりません

自然言語処理エンジニアとして5年働いていますし、体系的に学ぶために沢山の書籍論文を読んできましたし、毎回言語処理学会視聴者として参加しています

2023-07-21

anond:20230721205230

自然言語処理の基礎中の基礎である形態素解析はその名の通り言語学由来の形態素という概念があったから成立したやで

言語学なんて実用性のない学問どうでもよくない?

https://b.hatena.ne.jp/entry/s/note.com/kind_minnow917/n/n5958d3d2f064

言語学ってコンピューターによる自然言語処理ほとんど貢献できてなかったじゃん。

いまやディープラーニングやら LLM やらでコンピューター自然言語を話せるようになったのに、言語学って何の貢献もしてないよね?

言語学」といっても、結局内輪で実用的でない言語オタク話を延々としてただけじゃん。

「学」をつけるのもおこがましいから「学」を捨てろ!

言語学」は「言語オタク」に改名しろ

2023-07-05

生成AI何が悪いんやろか

それこそ人工無能とかワードサラダとかそういう時代から自然言語処理とか機械学習界隈に関わってきた増田としては生成AI何が悪いのか分からんのよな

ChatGPTもStableDiffusionも所詮ちょっと出来の良いおもちゃやん

ログイン ユーザー登録
ようこそ ゲスト さん