はてなキーワード: 自然言語処理とは
大学生で、来年から外部の大学院に院進を考えていて受験勉強真っ只中。
専攻を変えるために(元々その分野のことを2年くらいで好きになって自分なりに勉強はしていたのだが)苦労して教科書を読んで勉強中。
なんか未来が見えなくて辛くなってきたから誰かに聞いてほしい。
大学に入ってから自然言語処理がしたくなって院を探しているのだが、
内部生優先の制度があったり、最近のAIブームのせいか倍率が異常だったりする。
特に有名なところとなると倍率も高いしtoeicのスコアも相当な点数が要求されているみたいだ。
最初から受け入れ拒否されるところもあると聞いた(そこまでのところには自分は出会ってないのだが)
周囲の目線的に院進は落ちるものではないという考えの人がほとんどで、僕自身もそう思っていたのだが、
それは内部院進に限った話で外部となると話は完全に別だなと感じている。
正直受かる未来がまだ見えなくてもがくように勉強したり説明会に出てはいるが、
このさきどうなっていくのだろうか..
ドロドロした話ではなく,研究者業界を知らない人への一般的な話です.
大学の研究者は各大学に所属していますが,よく大学研究者は個人事業主だと言われるように,
実際問題として大学への帰属意識はそれほど高くなく,業界に帰属していると考えている人が多いように思います.
一般の会社員から見ると,大学と研究者の関係は,会社とサラリーマンの関係のように思えますし(雇用関係は事実その通りなのですが)
たとえば,情報科学科というものが存在した時に,その中にはアルゴリズムの研究者,VR・ARの研究者,DBの研究者,自然言語処理の研究者,
機械学習の研究者,コンピュータビジョンの研究者などの様々な研究者がおります.日本の大学の場合,それぞれが講座制として研究室が運営されています.
では,自然言語処理の研究室の助教(昔でいう助手)が准教授になるには,その研究室の准教授ポストしか一般的にありえません.
他の選択肢は他大学の自然言語処理の研究室のみです.つまり,彼/彼女にとっては,A大学情報科学科に所属していると言えますが,
キャリアパスとしては,全国にある大学の自然言語処理研究室のポストを見ていることになります.
ピッチャーは自・他チームのピッチャーにしかなれませんし,ゴールキーパーは自・他チームのゴールキーパーにしかなれません.
一部の例外を除いて,他のポジション(ゴールキーパーがフォワード)に移ることはありえないのです.
そう考えると,彼/彼女から見ると,あたかも自然言語処理業界株式会社のような概念が存在し,
その支店としてのA大学,B大学があると考える方が正しいように思います.
そして,キャリアパスとして,うまくいけばA大学助教,B大学准教授,C大学教授と栄転をしていくのです.
もちろん一部のエリートは,履歴書に東大しかないような人もいますが,
それは会社でいうところの幹部候補生のようなものであまり一般的ではありません.
(教授が10-20年君臨することを考えると,そういう人は各業界において,10数年に1人の生産ペースです)
最後に少しドロっとした話をしますと,A大学の人事に,B大学の教授が口を出すというケースもよくあります.
これは,会社の視点で考えると異常なことですよね.A大学とB大学は全く資本関係はないのです.
しかし,トヨタのグループ会社だと考えると素直に理解できませんか?(子会社の人事に,親会社が口を出すというように)
資本上は一切関係がなくても,人的交流による様々なしがらみがあり,それが学閥であったり,業界のドンのような人を生み出しています.
おわり.
「よろしい、ならば戦争だ」
デコイ(英語: decoy、Military dummy、囮とも)は、敵を欺瞞して本物の目標と誤認させる目的で展開する装備の総称。
Matt Cutts氏が指摘するように、順位を下げるために付けたリンクが、期待とは正反対に順位を上げる手助けをしてしまうこともあり得なくはありませんね。
リンクされているサイトではなく、リンク元のサイトがスパムかどうか判断していることをGoogleのゲイリー・イリェーシュ氏がMarketing Land のポッドキャストで明らかにしています。
この説明にもネガティブSEOの具体例をあげて解説していることから、ペンギンアップデートがネガティブSEO対策に力を入れていることがうかがえます。
目的は「はてな次郎」の文字列を自分で管理して、インターネット上に増やすこと。
セルフプロデュースでセルフブランディングするのがポジティブSEOの王道です。
現在、「はてな次郎」をGoogle検索したら1万件ヒットする場合、セルフブランディングした情報が3万件ヒットするぐらいを目指してください。
「はてな次郎」に関する誤情報が、検索結果の10ページ以下に沈めばとりあえず成功です。
「はてな次郎」という文字列をインターネット上で増殖させる作業を、手動ではなく自動で行うことも可能です。
(例)有名人を応援するファンサイトを作り、各ページのタイトルやヘッダーに「はてな次郎」の文字列を入れる。
このような方法で、100万ページ程度のWebサイトは自動的に作れます。
元データや加工方法を変えて、さらにWebサイトを作れば「はてな次郎」の文字列をインターネット上に1億個以上投下することも可能です。
アメリカ大統領選挙でロシアが情報操作を行っていたと言われている「ロシアゲート事件」を参考にして、SNSにデコイをばらまくことも可能です。
やりたい放題のGoogleをブッ飛ばすには、プログラミングが有効です。
頑張ってください。
元記事の仮名が変更されたので本記事の仮名も変更しました。(はてな次郎)
補足:
(株)はてな 6.59% 445352200円
毛利 裕二 5.98% 404128400円
梅田 望夫 4.30% 290594000円
伊藤 直也 1.79% 120968200円 ○
田中 慎司 1.30% 87854000円 ○
小林 直樹 1.15% 77717000円
お金の額面はともかくの話なんだけど、
○をつけたのは、はてなのコードを書いたことがあると"思われる人"。「名前 プログラミング」で検索して有意な結果が出た人に○つけた。各株主の詳細知りたい人は適当にググって
で、さらに
はてなの年収は524万円が平均年収です。(有価証券報告書調べ)
http://heikinnenshu.jp/joho/hatena.html
スクリプト言語(主に Perl/PHP/Python/Ruby/JavaScript)によるアプリケーション、ライブラリ開発の経験
ScalaやGoにおけるアプリケーション、ライブラリ開発の経験
iPhoneアプリ、もしくはAndroidアプリの開発経験
UNIX系OS、RDBMS (特に Linux、MySQL)についての基礎知識
コンピュータサイエンス(アルゴリズムとデータ構造、分散技術、自然言語処理技術、機械学習、データマイニング、型理論)に関する基礎知識
ネットワーク技術(HTTP、DNS、TCP/IPなど)についての基礎知識
大学卒/275,000円〜
http://hatenacorp.jp/recruit/fresh/application-engineer-entry
この毛利 裕二という人の持ち株の資産を新卒の給料(計算だるかったから計算からボーナス抜いたけど、手取り分で考えたらボーナス分くらいは消えるだろう)で稼ぐとしたら122年かかるし、梅田 望夫という人は88年かかる。本当にこの人たちにはそれほどの価値(上にあげた新卒に求めるやたらと高いスペック)分の価値があるのか?いや、価値があると思ったから株をあてがったんだろうけど...
日々流れる人工知能(AI)関連のプレスリリースをAI研究者の視点から軽く解説します。
・ウェブ面接プラットフォームHireVueの株式会社バンダイにおける導入利用のお知らせ
https://prtimes.jp/main/html/rd/p/000000019.000016792.html
【人工知能技術】ウェブ面接プラットフォーム上に溜まった会社の情報と候補者の情報からマッチング
【難易度】低
・宿泊施設の料金設定の悩みを解消 MagicPrice(株式会社空)とホテルシステムのDynalution(ダイナテック株式会社)が業務提携
https://prtimes.jp/main/html/rd/p/000000006.000019984.html
【人工知能技術】MagicPriceはホテルや宿泊施設のデータを用い、最適な料金設定をAIで行っている
【何が変わったか】データの定期的なアップロード作業が必要だったが、宿泊施設データ管理システムDynalutionとの連携により不要に。利用者側からはより簡単に利用でき、分析をするMagicPrice側からはデータフォーマットのブレがなくなり分析しやすくなった。
・ユーザーがChatbotでリアルタイムに試合情報を取得、AI×人の相互コミュニケーションによる新しい観戦スタイル
https://prtimes.jp/main/html/rd/p/000000027.000017379.html
【概要】日本チームの選手の情報や、リアルタイムでの試合の実況情報などユーザーのリクエストに対し、チャットボットが自動応答。また特定の選手についての質問や、過去の成績についても応答が可能。
【技術】データスタジアムの「一球速報プラットフォーム」のデータベースから質問に対してチャットボットが応答。
本文引用『一般的な対話システムには、想定質問とそれに対する応答のQ&Aデータが予めインプットされており、ユーザーのリクエストに対しそのデータベースから適する応答を返すというものが主流ですが、本サービスでは試合中、常に変化する実況情報をリアルタイムでユーザーに配信します。』
この「リアルタイム」は「データベースがリアルタイムで更新されているだけ」であり、応答のセリフなどの部分については従来通りだと思われる。
【開発】Nextremer
・英語学習AIロボットMusio(ミュージオ)、髙島屋と共に親子で英語に親しむ新しい体験を提供
https://prtimes.jp/main/html/rd/p/000000012.000017199.html
これはりんねやプレミア(https://twitter.com/premieresao)と同じく、相手の発言内容を記録していっている。
【開発】AKA
http://blogos.com/article/212112/
----------------------------
僕はLINEを愛してる。
愛してるがゆえにLINEをどんどん駄目にするLINEの経営層が許せない。
はっきり言うが、彼らのやってることはグダグダだ。他社のチャット系サービスが成長してる中、LINEが初めてユーザー数が減少したと言うがそれは当然だ。
説明しよう。
----------------------------
多分に自己愛と思い込みの強い著者が、アプリってのはこうグロースさせるもんなんだからそれをやれてないお前ら間違っている
と一方的に断じているもので、共感できるところは各タブに名前が入っていないことくらいのぶっちゃけ大して価値のない記事であった。
そもそもニュース領域はtwitterと違い、LINE株式会社側にLivedoor由来の編集チームがいてリソースが確保されている点、すでにLINENEWSという
基盤が存在している点で突然何の前触れもなくニュースを始めた日本のtwitterとはわけが違うだろう。
さらに噴飯ものはタイムラインについての評価で、まず誰も見ていないと断じているが、
リサーチベースではこんなものも出ている(http://gaiax-socialmedialab.jp/post-1891/)
大体、広告事業としてのLINE ADS Platformは、このタイムラインをベースにしたインフィードアドが中心であり、それで十分にマネタイズできている
ということは、タイムラインが一定使われていて、広告インプが一定以上発生していることの証左だろう。
つまり、この著者自体が、自分の見ている物事からしか評価・判断のできない典型的な「マーケティング知らない人間」なのだろう。
何をしてきた方かは存じ上げないが、いわゆるユーザーグロースのみをマーケティングであると思い込んでいるIT野郎。
LINEのニュースタブは、すでにユーザーが一定以上グロースしている国内のLINEユーザーに対してより多くの広告インプを発生させるためのレベニューグロース
としての側面が強いわけで、それも含めてマーケティングであるのだから、十分LINEの現場も、経営陣もマーケティングを、経営を理解していると言っていいだろう。
あ、後ユーザー数が減少と書いているけど、これはニュースタブを追加していない国についての話であって、そもそもの前提からしてもうめちゃくちゃ。調べずに書いてる感満載。
だからこそ失望したのが、これなわけで。僕もLINEを愛しているけど、これはマジでないんじゃないか。
http://jp.techcrunch.com/2017/03/02/line-clova/
----------------------------
スペイン・バルセロナで開催中のモバイルカンファレンス「Mobile World Congress(MWC) 2017」。そのキーノートにも登壇したLINEが3月2日、クラウドAIプラットフォーム「Clova(クローバ)」を発表した。
今後はClovaを搭載したアプリ「Clova App」を提供するほか、初の自社デバイスとなるスマートスピーカー「WAVE(ウェーブ)」を今夏にも日本と韓国で発売する予定だ。
今冬にはスマートディスプレイ「FACE(フェース)」の提供も控えるという。
----------------------------
要はAmazon Echoとか、Google Homeとか、スマートスピーカー領域(というか、音声会話をベースにしたインターフェース領域)に打って出るというわけだ。
これは一面ではすごく合理的に見える。つまりチャットサービスとしてユーザー間、ユーザーと企業間でのコミュニケーションのインフラを提供しているLINEが、textingから音声を介した
コミュニケーションインフラに舵を切るということ。事業の成長の向く先としてわかりやすい。
が。これ。マジで間違いなくうまくいかない。頓挫する。てかこれこそ、挑戦の美名に酔いしれてマーケティングを忘れた経営判断だろ、と思う。
音声インターフェイスの要は、自然言語処理であり、発話された音声を正確に理解する技術にあるはずだ。
この点、AmazonとGoogleは基本的に「英語」という話者が圧倒的に多い言語に優先して開発を進めればよかった。現に英語の自然言語処理はめちゃくちゃ進んでいる。
しかし、LINEは違う。英語圏ではまったく使われていないサービスなのだ。それどころか、LINEが浸透している主要国は日本、台湾、タイ、インドネシアの4カ国である。
サービスを普及させるためには、地の利を生かすほかない。そういう意味で英語圏は端から勝負しようがない。一方中華圏、圧倒的人口を誇るメインランドにはWeChatという
であるからして、浸透している主要4カ国で普及させる、という選択肢にせざるを得ないだろう。しかし、この4カ国ぶっちゃけ日本とインドネシアしか1億を越える人口の国はない。
その上、GDPベースで考えてもスマートスピーカーが短期的に人口に膾炙するほど普及させられるマーケットは日本と台湾しかない。
さらにさらに、R&Dの視点からいって、4カ国それぞれの言語にあわせて自然言語処理を一定水準まで高めるには、英語1つに絞って開発するのと比較して単純に4倍のコストと労力がかかる。
典型的な、労多くして実り少ない状況なわけだ。
どう考えても八方塞だ。
コミュニケーションプラットフォームである以上「言語」は避けて通れない問題。これを攻略する方法は正直、僕にはわからない。
だからもはやLINEは、チャットサービスとして浸透している国の中で、その土台の上で、ニュースタブとかその他もろもろで、
きちんとレベニューグロースを続けるのであれば、ぜんぜん負け続けることなんてないのになーと僕は思います。
今秋、人工知能による東大合格を目指していた「東ロボくん」がその目標を断念したというニュースがあった。AIは文章の読解(意味の理解)が苦手である、というのが大きなネックだったようだ。
このニュース自体は、現在の自然言語処理の限界という観点からはそれほど驚くにはあたらない。だが同時に一つの問題が提起された。
「AIの性能を上げている場合ではない」──東ロボくん開発者が危機感を募らせる、AIに勝てない中高生の読解力 - ITmedia ニュース
AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?(湯浅誠) - 個人 - Yahoo!ニュース
「文章の意味を理解できない東ロボよりも、得点の低い高校生がいるのは、どういうことだ?」
例えば「仏教は東南アジア、東アジアに、キリスト教はヨーロッパ、南北アメリカ、オセアニアに、イスラム教は北アフリカ、西アジア、中央アジア、東南アジアにおもに広がっている」という例文から「オセアニアに広がっているのは( )である」という文の空欄にあてはまるものを選ぶ問題がある。
文章をしっかり読めば、答えがキリスト教であることは明白だ。しかし、全国約1000人の中高生のうち、約3割が正答を選べなかったという。他にも問題文に回答が書いてあるような同様の問題で、文章を正しく読み取れない生徒が一定の割合で存在しているという。
複雑な論理関係や推論の必要ない、むしろほとんど同語反復に近いこの問題に、中高生の3割が誤答したという。
この問題は文中の語の意味を理解することを必要とせず、文中の語と語の関係だけから答えを導くことができる。すなわち"AIが解ける"レベルの問題なのに、である。
この事実は、ある種の人々にとって衝撃的なニュースとして受け止められたようである。
だが個人的にはむしろ納得のいく結果であると感じている。自分が公立の中学校に通っていた時の実感と合致するからだ。"そういう子"は間違いなく、そして少なからずいた。
この"実感"を言葉で説明するのはなかなか難しい。音読は(一応)できる。目で文字を追って発声することはできる、が、その文の意味が明らかに理解されていない。あるいは会話をしていて「アルファがベータをカッパらったらイプシロンした」くらいならまあ通じるが、「アルファがベータをカッパらったらイプシロンしたけどデルタがゼータにイオタしたからベータがデルタとシグマった」みたいになるともう通じない。時間をかけて一つ一つ説明すれば通じるのだが、とっさには理解されない。中学の段階でそういう子は間違いなくいたのである。
40人のクラスで3割と言えば十数人というになろうか、決して盛りすぎとはいえないと思う。
しかし、ある一定の層、特にある程度以上の学歴があって、社会でもリーダーシップを取っているような層の人にとってこの結果が衝撃的だというのは、つまりそのような人たちに"そういう子"の存在が見えていなかった、ということだろうと思われるのだ。
ある種の人達に、別のある種の人達の存在が見えなくなっている、それは社会にある種の分断を生んでいるのではないか?
"そういう子"が見えなくなる背景には、中学受験の存在があるように思う。少なくとも都市部では、親に経済的余裕があって子どもの学力も一定以上なら中学受験は当たり前になっている。それも今に始まったことではなく、もう数十年に渡ってそうなのである。
中学受験してしまえば周囲は一定以上の学力の子ばかりになる。彼らはそれ以降"そういう子"とはぜんぜん関わらずに過ごすことになる。
もちろん中学受験組も、小学校が公立であればその間は読解力の低い子らと一緒くたに過ごすことになる。だが、小学生の段階ではそういう観点から相手を客観視するまでには至らないだろう。
そして思春期以降は一定水準以上の仲間たちに囲まれ、小学校の頃にいた "(なんとなく)できない子" の多くがその読解や学習上の困難を克服できぬまま中学を巣立っていくことも知らず、やがてそういう子らの存在を忘れてしまう、こういうことがひょっとして起きているのではないか。
もしそうだとしたら、それは社会的な分断以外の何物でもない。
学習に困難を抱える子どもをどうケアするかというのはもちろん大きな課題であるが、もし社会にかような分断が生じているとしたら、その克服も一つの社会的な課題だろう。
先日、はてなの匿名記事で大きくバズってる記事があったので、拝見したが、何とも言い難い気持ちになった。
匿名記事なので、あえて私についての説明を加える必要はないかと思うが、某記事と近い立ち位置であることはご理解頂きたい。
チャットボットに関する議論の方向性が見えないのは、チャットボットというワードによって、様々なものを一緒くたにしてしまっているからである。
現状は、切り分けると実に多様である。
チャットのUIそのものの「チャット」なのか、Facebook MessengerやLINEなどのプラットフォーム依存の「チャット」なのか。
人工知能を用いた「ボット」なのか、単純に応答を返す「ボット」なのか。
今回は、プラットフォーム依存の「チャット」、単純に応答を返す「ボット」という意味でのチャットボットの実用性についてお話したい。
そもそも、昨今のチャットボットブームというのは、Facebook MessengerやLINEなどがプラットフォームを公開したことに依るもので、そこに新規性があるはずで、今しなければいけない議論はここにある気がしている。
よく言われるのが、ユーザーは使うのかどうか、という話であるが、プラットフォームがβ版の最中で、今これを議論するのは時期尚早である。
だが、在米時代にUberのボットを使ってみたり、在中時代にWeChatで色々とボットを試してみると、これがかなり便利なのである。
私はそもそも電話が嫌いであるし、ウェブやアプリを横断するのも面倒くさい。
その中で友人などとメッセージをやり取りし、そこからアプリを動かずに予約をしたり、企業に問い合わせたり、というのは手間が省けて実に良い体験であった。
では日本ではどうだろう。
だが、若者世代含め、チャットアプリが生活の大きなパイを占める時代においては、当然求められても納得出来る。
であるからして、予約や定期的に購買するEC、デリバリーサービスやメディア諸々、チャットだけで完結するようなユースケースは必ず出てくると思う。
そういったケースが増えていくと、「これはなんでチャットで出来ないんだ」という時代が来てもおかしくはない。
いろんなものがネットで可能になった時に、「なんで今の時代にネットで出来ないんだ」と思われたと同様に、だ。
「チャットじゃなきゃダメなんですか?」ではなく、「チャットじゃダメなんですか?」という問が来る日もそう遠くはないかもしれない。
今回、人工知能型ではないものに重点を置いたのは、人工知能型には課題が多すぎるからである。
自然言語処理も精度は高くないし、無論、感情を読むなどはまだ先の話になるだろう。
そして、まるで人間ですよ、というものに対し、ユーザーが対人コミュニケーションを望むのは間違いない。
人間に話しているのに、およそ意味不明な回答が来たらユーザーは離脱するだろう。
一方で、そもそも人間ではなくただのシステムだと認識していたらどうだろう。
今は、ユーザーも企業も、雑談や人間らしさはさておき、ちゃんと言ったことをこなすコマンド型のボットに期待すべきだ。
いわば、アプリをチャットのUIにして、コモディティ化しているプラットフォームで公開する、ということだ。
今までユーザーもアプリに対して人間らしさ、などというものは微塵も期待していないはずで、そのようなボット像を目指すべきではないかと考える。
また、ユーザーに広く使われるためには、チャットボットと言えども、UXは非常に大切である。
この点においては、プラットフォームが解決しようと頑張っている。
FacebookがQuick Replyという機能を実装したことから見えるのは、
⑴そもそもユーザーの発言に揺れが出ないように、最初から選択肢を用意しよう
⑵ユーザーがテキストをタイプする手間を省いてタップだけで済むUIにしよう
ということであり、チャットボットが広く使われる上でのUIを見越していると思われる。
その上で、企業側も前述のようにプラットフォームが用意したUIをいかにフル活用して、いかにユーザーが使いやすいものを作れるか、が非常に重要だと考える。
多様なものが混合しているワードを漠然と差して、「これはない」というのは暴論だろう。
1VCさんが、この領域は絶対ない、というのは新規投資先スクリーニングに有用だと思うが、それならば実名にし、そのVCではチャットボットサービスには投資しません。
と言ってしまった方がコスト削減になるのではないだろうか。3割もの方がチャットボットサービスについて話し、毎回同じ議論をしているのだとすれば、それこそ無駄である。
なんなら、事業内容を聞いて、「チャットボット」というワードが入れば「事業内容を変えなさい」と返すチャットボットでも作ってみてはいかがだろうか。
こういった機会は、毎回必ず様々な議論を生み出すが、全員の意見が一致しないからこそ、投資の価値があり、それを見抜いたものが勝つ業界だと思っている。
だから、是非ともチャットボットサービスを考えている皆さんは、ちゃんと自身のサービスの価値を見極めた上で、頑張ってほしい。
タスク型というのは、「テレビ付けて」「テーブルからりんご取って」
それ以外の非タスク型は、いわゆるコミュニケーションロボットやチャットボットで用いられるような、コミュニケーション自体を目的としているもの。
前者は、限定されたシチュエーションであれば結構良く出来てきてる。
多少のことばの揺れがあっても、ちゃんと認識してくれる。
ちゃんと使いどころさえ考えれば、ユーザーの期待を超えてサービスとして成功する可能性も高いだろう
だが非タスク型、テメーの出番はまだ先だ。
自然言語処理の現状の研究成果じゃ、それっぽい答えを返すのが関の山だ。
非タスク型は、リラックスやストレス低減、萌えなどの効果が期待されてるが、現状それっぽいことを返して、使用者に勝手に意図を推測してもらう使い方しかできない。
りんななんかも、ユーザーがJKだと思って想像を膨らませて勝手に話してるだけ。だからこそ、コミュニケーション系でうまくいくには、
③変な回答しても許して貰える対策
などが必要になってくる。
はっきり言って、これは人工知能の分野ではなく、ギャルゲーやアニメ、ドラマなどの経験があったほうがユーザーにいい体験を与えられるものが作れる。そんな段階。
会社名を明かせないが、業界大手のベンチャーキャピタルに所属している。
主な出資先は所謂ミドル、レイターと呼ばれる「成長、拡大期」のベンチャーである。
さて、そんな私も最近は起業前、もしくは新規事業を立ち上げようとしている方にアドバイスをすることが多い。
そしてその中でもここ1ヶ月は会う人の3割がチャットボット系のサービスのアイデアを語るのである。
「やめたほうが良い」と毎回アドバイスするのだが、毎回伝える3つの点についてここに記したい。
願わくばこの記事が広まり、浅はかな「対話型サービスの未来」を考えているベンチャーが断念し、より可能性の高いビジネスに切り替えて欲しい。
そしてこの記事を受けても尚、私の予測を上回り成功するチャットボットサービスが出てきてほしいとも思う。
前置きが長くなったが、以下3点がチャットボットが失敗する理由である。
一番の理由がこれだ。
ここで注意したいのが、 クライアント ではなく ユーザーである点だ。
よくある「チャットボットを簡単にECサイトに導入できます」サービスを事例に出してみよう。
「今まで大変だった顧客対応がチャットボットで代替できます。」
「チャットボットが商品のアピールをすることで売上が上がります。」
確かに正論に聞こえるし、無料キャンペーンや優先登録などに興味を示すクライアントは多いだろう。
プレスリリースを出せばクライアントの問い合わせは殺到するだろう。
ユーザーは商品についてわからないことがあった際に、いきなり得体の知れない自動応答システムに話しかけるだろうか?
そもそも埋込み型の顧客問い合わせサービス(zopimやolarkなど)について、ユーザーの利用率が5%未満に過ぎない事例が多いことを知っているだろうか?
私もこれらの問い合わせサービスに関わったことがあるが、日本人の性質としてチャットボットにいきなり話しかける(しかも想定された問答を想定通りの言い回しで)例は少ない。
また、少ない額であれば導入する事例も増えるだろう。
しかし、ユーザーがチャットボットを使うシーンは少ないだろうし、結果として売上にもコストダウンにも繋がらないケースがほとんどだろう。
厳しい言い方をすると、話を聞くチャットボット関連サービスは現状、 「ユーザーのことを考えず提供者側の視点しかない マスターベーショナリサービス」
なのである。
自然言語処理を簡単に説明すると、「コンピュータが会話を理解し適切な回答を返す処理」である。
この技術は現状、正直言ってそこまで高いレベルに達していない。
言い換えるならば「ユーザーの期待値」と「提供できる技術レベル」の均衡が取れていない。それどころかユーザーの求める「自然な対話」レベルにはほど遠く失望させるものなのである。
よく非技術者の創業者や流行りものが大好きなコンサルが「Deep Learningの登場で自然言語処理の精度が高まり自然な対話を実現できる」とドヤ顔で語るのだが、これは大きな勘違いだ。
画像認識については、「文脈」などその対象以外の外部要因が発生することは少ない。
その為、その特徴量を見出しやすくDeep Learningを使用することで精度をかなり高めることが可能である。
しかし、「対象そのもの」以外にも文脈や発する人間のパーソナリティなど様々な外部要因が発生する対話において、特徴量は見出しづらい。
特に日本語は主語が省略される、漢字の読み方で大きく意味が異なる、「空気」を重視する等のハイコンテクスト文化であり、自然言語処理は難しい。
その為にDeep Learningが自然言語処理を圧倒的に成長させ、「機械であることを感じさせない自然な応答」を可能にさせることはほぼ不可能なのである。
そんな精度をユーザーが求めていないのでは?と思うのは提供者側のエゴだ。
不自然な対話、自分の想定していない回答が続くようであればユーザーはサービスから離れてしまうだろう。
「飲食店などの予約がチャットボットでできる」系サービスも良く聞く。
彼らには必ず「それってチャットボットである必要性ってあるんでしたっけ?」と質問するのだが、納得のいく回答を得られたことは無い。
対話のほうがかっこ良い、対話でできたら未来っぽい、アメリカで流行っているから、実際にそんな浅はかな考えで通用するほどビジネスは甘くない。
「対話によりニーズを深掘りできる」等もよく聞くが、2で挙げた通りそんなに自然言語処理の精度は高くなく、深掘りする以前に離脱してしまうだろう。
「なぜ対話なのか」
これらの質問に自信を持って答えられるだろうか。
それができない限りはビジネスは成立しない。
今すぐチャットボット事業を畳み、↑の質問に答えられる別の何かの可能性を考えたほうが良い。
以上である。
チャットボットブームは、クライアントが導入した後に「ユーザーに全く使われない」と気づきその悪評が広まる、あと半年の寿命といったところだろう。
そんなチャットボットだが、現状で可能性があるとしたら「チャネルの1つ」として使う程度だろう。
LineやFacebookメッセンジャーに組み込み、「既に展開しているサービスの広報的役割として活用する」、「メディアの記事を配信させる」役割であれば優秀なツールとなるだろう。
繰り返しとなるが最後にもう一度。
願わくばこの記事が広まり、浅はかな「対話型サービスの未来」を断念し、より可能性の高いビジネスに切り替えて欲しい。
そしてこの記事を受けても尚、私の予測を上回り成功するチャットボットサービスが出てきてほしいとも思う。
>BtoBでの事例
導入事例のステマ記事(メディアとクライアントと内容は詰めている)はこの半年で沢山出てくると思いますが、実際の導入でコストが下がった、売上に繋がったという話は決して多く出ないだろう(むしろネガティブな話ばかりだろう)と私は予測します。
>「二次元アイドルとの会話」みたいな路線なら弾けるとこあると思うよ
これは私もそう思います。ただそのサービスだけでのマネタイズは難しく、記載した通り「チャネルの1つ」としての活用だと思います。
>いま成功している企業に対して、過去の時点で成長すると断言できたのかな?
私の担当案件は同僚と比べてROIが高いほうだと自負していますが、それでも100%ではありません。
当然予期できていないものもありますが、ここで挙げた3つの課題がクリアできない、もしくは突破できる切口が見つからない限り難しいだろうと考えています。
また同時にそのようなサービスが生まれて欲しいという期待もしています。
>本名で書けばいいのに、VCなら。
君なら知っていると思いますが、VCといってもサラリーマンです。
君みたいなネットタレントでも私は承認欲求が強いわけでもないので、実名で注目されることでのメリットが無いのです。
>概ね合っているとは思うがこの人自然言語処理は理解してなさそうだ
私のもともとのバックグラウンドはエンジニアで、セキュリティソフトの迷惑メールフィルタリングシステムを開発していました。
自然言語処理は業務で取り扱ってきましたが、どういった点が自然言語処理の理解が足りなそうか教えていただけますか?
あまり冗長にならないように書いたのですが、不足している箇所があれば修正したいのでご教示いただければ幸いです。
>1.多くのユーザーは凸る前にカタログやQ&A等を見るでしょ普通。ボットはその中間でしょ。2.検索性の悪いQ&Aよりはマシな可能性は? 3.何故に二者択一よ。
「カタログやQ&A等を見るでしょ」
これがなぜ対話になるのですか?なぜチャットである必要があるのですか?いきなり不明点を話しかけると思いますか?
検索性の悪いQ&Aよりはマシレベルのものがビジネスとして成立すると思いますか?
チャットボットはゆらぎも含めた大量のインプットデータが必要です。
そのメンテナンス費用を考慮すると検索性の悪いQ&Aを直せと言いたいですね。
「3.何故に二者択一よ」
対話システムとしてビジネスをするのであらば、対話である必要があるのか、なぜ対話なのかといった観点は必要になると思いますがいかがでしょうか?
なかなかご理解していただけないようなので、この質問をさせていただきます。
「あなたはユーザーとしてチャットボットで質問をしますか?まだ使ったこと無い場合、質問ができそうでしょうか?」
>まずもって中身のサービスが素晴らしく、それをチャットUI(また、それが載っているプラットフォーム)をもってレバレッジかけるような感じ
私もこれは完全に同意です。
既存製品の新たなチャネルとして、そのUIがフィットするのであれば良いかなと思っています。
ただ、チャットボットですという売り方では難しいと考えています。
(実際チャットボットでこれから生きていくみたいなビジネス相談が多いのです。)
ご理解いただきありがとうございます。立場上、実名発言が難しいのですが、この「チャットボットで俺は生きていく」層が多くそれに警鐘を鳴らしたい、鳴らさなければいけないと感じ増田に書きました。
ネットメディアの導入事例系はマーケティング的な要素が強く、またあの記事の人件費削減の根拠も曖昧です。
>ユーザー側が求めてるサービスの質次第なんじゃないかな。未成熟な技術分野だからこそ、提供者側が工夫すれば良いだけ。
工夫というのは同意です。
ただ現状、完全自由対話のインタフェースを用意すると、ユーザーの期待値をサービスが超えることは無いと考えています。
ある程度選択肢を絞らせる、スタンプを使うなど「工夫」がなければ難しいでしょう。
またその工夫でもこのインタフェースだけでビジネスとして成り立つかというと...我々は慎重に考えています。
>複数人が入っている部屋での稼動があると思うんだ。
趣味でSlack上で司会進行的に喋るBotを仲間内で開発しましたが、これは非常に面白かったです。
ただ、やはりビジネスとなり例えば1,000社が有料で導入するレベルのものかというと...
>成功しそうなの教えて
そうですね、ポジティブな話もしないとですね。
昔からあるものですが、どうもインタフェースが特殊で事例が中小企業規模まで降りてこない。
Google Analyticsの焼き直しや、他の埋込み型トラッキングサービスも伸びています。
コンシューマ向けだと、所謂CtoCにはまだ可能性があると思っています。
炎上はしましたが、個人の写真売買など「今までプロが提供してたけど素人でも提供できる、かつ流通量が多いもの」に可能性はあると思います。
更に追記
もうご覧になる方はほとんどいないと思いますが、最後の追記です。
活用方法や実際の導入の声など、参考になるコメントもたくさんいただけて私自身も勉強になりました。
※はてなの方から他のシリーズもやってくれとコメントを頂いたので、IoTやVRなど他のトレンドについての課題も今後「増田で」挙げていこうと思います。
これらの意見をいただいても尚、ビジネス化をしていくには難しいだろうと私は考えています。
それほど、私が挙げた3つの課題をクリアしかつビジネスとして回していくことは難しいからです。
そして、同時に「未来はどうなるかわからんぞ」といった意見には賛同します。
Webもアプリも「こんなもの流行るわけがない」という世論があった中で、ここまでの発展を遂げています。
「若くチャレンジしようとする芽を潰すな」という意見もありましたが、そもそもこの意見を聞いて諦めるような起業家ではその先にある苦難に立ち向かえないでしょう。
もともと「チャットボットが新たなインタフェースになるんだ」と確信し強い気持ちを持っている起業家は、こんな意見を聞いても全く諦めようとはしません。
私も実際、起業前の方に「止めておいたほうが良い」と伝えたことは何回もありましたが、それでも彼らは起業しサービスをローンチしています。
私自身もそうでした。みんなに反対される中、当時全く広まっていなかった人工知能系のベンチャーを立ち上げました。
勝手ながら彼らの信念がいつの日か実り、少しでも世の中に良い影響を与えられる存在になってほしいと思っています。
VC的にはIPOか売却というゴールを期待してしまいますが(笑)
私が本当に警鐘を鳴らしたかったのは、どちらかというと「チャットボットが万能だ」、「チャットボットで何でもできるようになる」と伝えるメディアやコンサルの方です。
口々にチャットボットだと言って誰にも使われないサービスやスタートアップを量産しようとしている話を聞くと心が痛みます。
過度な期待をしたくなるのはわかりますが、私が挙げた3つの課題はどうしても避けては通れません。
起業家の方々が「周囲の過度な期待」に流されず、これらの課題から目を逸らさず、新しいインタフェースを開拓してくださることを期待しています。
※上から目線のようですみません。ただ立場抜きにして1ユーザー、サービスを享受する1人の人間としても期待しています。
最後に
多くの方にご覧いただきたいということもあり、こういった表現を使用してしまいました。
特にけんすう氏にも良くない表現を使ってしまいました。申し訳ありませんでした。
ここにお詫びいたします。
真面目に答えず、出来る限り嘘と虚構を織り交ぜて答えていきたい。
広義的にいうならスパムだな。
で、この文章がどうやって作られているかというと、主にコンピューターによって自動生成されている。
自然言語処理には「形態素解析」や「構文解析」などの技術が用いられているのだが、よく分からないのでスキップしよう。
で、それらが文法を解するのだが、致命的な弱点がある。
つまり、それで出来上がる文章は文法的には正しく見えるかもしれないが、文意がないので支離滅裂になる。
言語障害を「ワードサラダ」と通称することがあって、そこからこのスパムはそう呼ばれるようになった。
これの厄介なところは、検索エンジンがそれら支離滅裂な文章をスパムとして弾くことが困難なことだろう。
ザックリいうなら、コンピューターが書いたものなのだから、それはコンピューターにとって「正しい文章」だと判断される、と考えてくれ。
SEO(検索エンジン最適化)にとって、ワードサラダの対策は永遠の課題……らしい。
このようなことをする目的としては、労力なしに広告収入を得るため、SEOの妨害とか愉快犯など、人によって目的は様々のようだ。
誤解してはいけないが、自動で文章を生成する技術自体が悪いのではなく、それの利用方法の問題であることは知っておいたほうがいい。
トピック機能→割と最近、はてブのエントリーに吹き出しマークと一緒に表示されるようになったアレ。
http://i.imgur.com/iN43DgH.png
例えば三菱の記事には「三菱自燃費不正」のトピックが自動で付与される。自動で付与される。大事なことなので(ry
インターン生に死体蹴りを浴びせた挙げ句自称本人からの反省文を投下して盛大に炎上しているMTRLとかいう会社。
たくさんの関連記事がはてブに上がったので、めでたくトピックが付与された。…が、そのトピックがこれ。
http://b.hatena.ne.jp/topic/300602783541852586
なんだこれ?まるで「これがゆとりのリアルだ!(会社は悪くない!)」と言わんばかりではないか。トピック(主題)として不適切すぎる。
無関係なドラマのタイトルがTwitterのタグのように入っちゃってるし。
このトピック名は、5/12(木)付けでMTRLブログに書かれた記事のタイトルだ。ブクマしたユーザ数は5/13(金)現在、わずか6人。
同日にはあの青春基地を彷彿とさせる自称本人からの反省文が投下されており、こちらをブクマしたユーザ数は465人。ちなみに大元の炎上記事は701人。
他の関連記事もほとんど6人以上のブクマを集めている。なぜよりによって「MTRL世代のゆとリアル」をトピックとして選出したのか疑問だ。
もちろん、自然言語処理で自動的に付けられたものだから仕方のない部分もある。問題は、不適切なトピックを変更(あるいは通報)する手段が、ざっと調べた感じ見当たらないことだ。
これははてな的にも問題ではなかろうか。仮にこの先三菱自動車にポジティブな話題があったとして、皆がおめでとうおめでとうとブクマする中、
間違って「三菱自燃費不正」みたいなトピックが付いたら一気に冷めるだろう。トピックだけ見て、あーあまたやらかしたのかと勘違いする人もいるかもしれない。軽く営業妨害だ。
という訳で、ある程度ユーザからのフィードバックを受け付けてトピックを変更できる仕組みなんか導入できませんかね。
マイナス評価の多いトピックは自然言語処理解析をやり直して、2番目に妥当と判断したトピック名に自動で切り替えるとか。お願いします。(エアリプ)
多くの企業が人工知能を使ったサービスをやりたいと思っていることだろう
しかし大体の企業は人工知能研究者なんか抱えていないのでアカデミックにいる研究者にリーチしてくるはずだ
今だと新聞にも人工知能や機械学習の研究者へのインタビュー記事が良く掲載されている
答えはノーだ
新聞のインタビューに出てくるのは「昔すごかったけど今はあんまりなタイプ」か「研究派閥がすごいタイプ」のどちらかだ
現役でバリバリやっている研究者を見つけるには業績が一番てっとりばやい
特に人工知能を含むコンピュータ科学の分野では国際会議(カンファレンス)が重要視されている
なかでもトップカンファレンスはものすごくレベルが高くグーグルやマイクロソフトリサーチなどITの巨人たちが切磋琢磨している世界だ
分野ごとのトップカンファレンスは大体以下のような感じだと思う
若手に限らず日本でトップカンファレンスに通せている人は多くはない
※細かことをいうと著者順も重要だがそれは省略
過去の増田を教師データにして、文章を自動生成するプログラムを書いた。基本的には、増田に付いたブクマ数に応じてトピックに点数を与え、ホッテントリ入りしそうな記事を生成するという仕組みだ。自然言語処理に関する既存のライブラリに、最近の論文誌や国際会議で発表されたいくつかの研究成果を独自に組み入れた環境がベースになっている。
自動生成した文章を立て続けに投稿することはスパム行為に当たると思うので、投稿は一日当たり数件程度にとどめているが、これまでの成果は上々。ブコメには、増田の内容に合わせて、真面目な意見とか批判とか共感とか大喜利が書き込まれている。