「自然言語処理」を含む日記 RSS

はてなキーワード: 自然言語処理とは

2019-06-10

anond:20181220234137

だったら「枯れて」ない分野では日本人がどんどん活躍できそうだけど、実際のところどうなの?

例えばIT系の分野。

機械学習とかAIとか自然言語処理とか。

あと、核融合とか。

2019-02-10

いかがでしたか媒体排除について考えてるメモ

まあ、スラドやstackoverflowの仕組み。

いやー、違うなー。Google検索結果で確か検索結果として不適格扱いにするボタンが既にあったか

それでもうまく出来ないということか。

まあ、そんな簡単排除出来たらGoogleがもうやってるはずだもんな。

人間が読めば判断つかんだから、もう2段階ぐらい上の自然言語処理がいるんだなあ。

2018-11-29

5年強勤めたNTT退職する気はありません(無能編)

みかかをやめたエントリー流行っていますが、自分自身もOBOGのみなさんが指摘している問題は当然認識しております

特に心に来たのがこちら。

https://anond.hatelabo.jp/20181126192228

それなのに、なんで自分は当面しがみつく気でいるんだっけ、と考え直すきっかけになったので

自分向けの整理を兼ねて、このぬるま湯を飛び出す気なんてない無能から視点で書かせていただこうと思います

以下、殆ど労働環境自虐風自慢になりますので「叩く前に一応中身見ておくか」と思ってクリックしてくれた律儀な方は

現時点で戻るボタンを押してブクマにご登録の上「結局自慢じゃねーか時間無駄にした」なり「ブルジョアがいたぞ殺せ」なり書いてくださって結構です。

ただ、もしあなた就活生ならば、自分みかかフィットするか判断する一助になるかもしれません。

自己紹介

偏差値60程度の私立高校偏差値60程度の私立大学偏差値60程度の国立大学出身、現・NTT主要5社のどれか。

ただし、一つたりとも普通入試入学していない。

これは別に裏口入学をしたという意味ではなく、推薦やらAOやらを活用していたということ。

自分では口下手だと思っているのだが、どうやら面接は得意らしい。

故に、周囲から評価出会ったときが最高で出ていくときが最低というのがいつものパターン

皆には本当に申し訳ないと思っているけど、別に騙そうとしたわけではないので許して欲しい。

客観視すると、自分は長いこと世間的2番手グループに紛れ込んでいた3番手以下の男だったわけで、

当然これらの集団の中で自分相対的に最底辺レベルだった。

勿論今の会社の中でも自分能力相対的低さは常に感じているところで「無能編」とした理由はここにあります

NTTをやめない理由

社員民度が高い

弊社は、就職先として人気である

故に、社員ボリュームゾーン日本大学生のうち、「人気企業志向し」かつ「人気企業内定を取れる」人たちである

無論いろいろな人がいるが、大学出会った優秀層にはわりといたテストステロンを異常分泌していると思われる人や、

常人の倍はありそうなIQを全く自然言語処理に割り振っていないタイプの人は殆どいない。

社内で怒声が聞こえた経験はなく、勿論暴力を振るわれた覚えもない。

社員同士のやりとりで精神的なストレスは感じにくいといって良いと思う。

ちなみに、部長以上になるとややイケイケ気味の人が多いように思う。

そういう人が出世やすい傾向はやはりある

労働環境がいい

政府が「働き方改革」などで語るエルドラドはどこにも存在しないとお思いだろうか。

いや、不完全だがそのイデアの影は確かに存在する。それがみかかである

私は毎年有給を使い切り、趣味海外にも片手の指で収まらない回数出かけている。

それでも足りないので、裁量労働制をフル活用し、遠征初日は早朝~午前中まで勤務しそのまま出国遠征から戻った日に夕方~夜までリモートメールチェック。

これで2日有給節約、みたいなことをやっている。

会社には半ば呆れられているが、趣味では成果が出ているのもあり、とても楽しい。当面は続けさせてもらうつもりだ。

(とても狭い世界だが、日本でXXXをやっている人と言われたら3人目までには名前が上がるはず)

みかか以外で同じことができたかと言われれば、とても疑問。

この趣味に本格的にのめり込みだしたのは入社以降なので、みかかが私の隠れた可能性を掘り当ててくれたとも言えると思う(?)

ちなみに私は家族に「中央官僚」「警察官」「幹部自衛官」がいるが皆ひどい労働環境である

家族仲は極めて良好なので、折を見て一緒に海外旅行などしたいのだが、全く予定があわない。

というか警察官自衛官就業規則的に入国できない国が結構あってワロタ

安定性は最強でしょうが趣味に打ち込みたいなら公務員オススメしません。

また、産休や育休も取りやすい。事前に準備する計画と合わせて申請すれば男女問わずほぼとれると思われる。

実例として、2人生んで復帰した後部長まで駆け上がった女性社員一年の育休を取得した男性社員を知っている。

社員個人として育休は「そこそこの給与で飼い殺される権利」をオプションとして残しながら育児できる権利であるわけで人生選択肢が広がる。

しか特別に意欲のある人以外、もとのキャリアにはなかなか戻れないという問題は確かにあって、積極的に元路線に戻さないなら

じゃあもっと安い給与派遣さん雇えるよねという話になり、これは正社員の既得利権しかない。

制度本来目的からは外れていると思います

これは今後の課題だけれども、会社制度問題というより社会問題かと思う。

給料がそこそこ出る

手当等を一切もらえない立場でも、30歳で600万は超える。これは独身ならば十分な額であると思う。

2大手である配偶者扶養住宅手当がつくと30歳で700は確実に超える。

出世スピード的に普通レベルでも40歳手当込み800はいくと思う。ただし管理職にならなければだいたいこれで頭打ち

結構大きい住宅手当が45歳で打ち切りとなり、その補填が定年までにできるかどうかというところだ。

子供複数欲しく、住宅東京に買いたい、となるとたしかに余裕があるとは言えないが、これ以上を望むのは特別能力がある人以外は贅沢ではないかと思う。

それでも、転職を考えないわけじゃない

周囲に豊かな生活をしている知り合いがいる

上記したとおり、給料はそこそこもらえる。ネット検索しても「自分はまずまず恵まれている」という意識補填する情報がでてくる。

しかし、弊社社員には嫌でも目に入る「より豊かな人」が2種類いる。

こういった悪意なき親しい人間が、NTT社員精神的安定を奪い「ちくしょう転職だ!」となるわけです。

母集団の層が高めであるため、こういう人が混じってくる。彼らは億単位マンション就職祝いに買ってもらい、

我々が必死こいて見栄張った結婚式より数倍豪華な式を親の金で挙げる。給料はすべてお小遣いまたは貯金である

ちなみに、こういう人の勤務態度、勤務成績は嫌味なほど良い。お前らなんで働いてるの?

銀行外資系ITなどへ行った友人とは、30前後から明らかな生活水準の差が出てくる。

彼らがカジュアルに誘ってくる店で「高い・・・」と思うのは、なにか胸にくるものがある。

NTT肩書には高い値段がつく(ことがある)

ぬるま湯NTTだが、転職していった知り合いは多くが年収を上げている。

まぁ、いい値がつかないなら転職しなきゃいいだけなので上がった例ばかり知っているのは当然なのだが、

主要5会社ではないその子会社から転職年収が1.5-2倍、金額で言えば1000を超えたケースも複数知っている。

NTTがやっているような規模の仕事をやっている会社は少なく、

その仕事マネジメントに近い立場ドライブした経験には思ったよりも高い市場価値がついているということらしい。

実際は会社名前でとってきた仕事会社に言われたとおり取り組んでるだけなのにね。

自分部署の将来性による不安

私は技術系の部署に属している。全社の技術課題を飛び回って解決したり、全社で利用する技術を選定したりする立場だ。

「つぶしが利きそうでいいね」と現場系の同僚には時々言われる。

が、そうではない。それどころか上記した「元NTT」の肩書活用できないポジションである自分は考えている。

実態ポケモンで例えよう。

ハナダジム攻略プロジェクト

ポケモンリーグ制覇の中期目標に向け、ハナダジム攻略すべしという社命が下ったとする。

すると弊社現場社員は「過去にハナダジム攻略したトレーナーが持っていたポケモンの平均個体数とレベル」を調査し、それを攻略人員として割り当てる。

詳細がわかっていないので近場で手に入れたイシツブテ6匹をメンバーとしてアサインし自信満々で「体制を組みました」と上司に報告するわけだ。

これではスターミーにたどり着けすらしません。

そこで、現場の協力会社が「せめてでんきタイプを一体くれ」と声を上げて補充されるのがたいあたりしか覚えていないビリリダマだったりする。

そのぐらいわかっていない(ところもある。けっこうある。わりとある。)

我々の役割は、状況を整理して「必要なのはでんきショックを覚えたピカチュウです。最低レベルはxxであと念の為ピーピーエイダーください」とまで噛み砕いて説明し、

でんきショックの使い方を解説、最悪の場合には自らスタンガンを装備してスターミーに立ち向かうことである

こうした仕事をこなすと、現場社員から技術的に頼れるメンバとして捉えられ、時には称賛される。

しかし我々は理解っている。こんなこと、エンジニアと呼ばれる人間ならできて当然のことであると。

というかこんなコト自慢気に語ったら笑われるぞと。

まり社内の強みと社外の強みが噛み合っていない。

社外の人たちが高い値をつける「NTT仕事」とはだいぶかけはなれたところにいるわけです。

存在意義は正社員としてすこしエンジニア的動きができるということだけ。

本腰入れて技術者を雇いだしたら消し飛ぶ強みです。

私の現状はみかか肩書がなければ「無能」そのものです。

退職エントリを読んで

自分の中のもやもやとした感情を整理するきっかけになったエントリ群にはとても感謝しています

ここ数年は趣味最優先で生きてきたけれど、少し冷静になりって将来のことを考えてみたいと思っていたところでしたから。

まずはそう、目の前の仕事をもう少し社外にも通用するスキルが身につく方向に舵を切りたい。

そして、実際に転職するかどうかはともかくとして一度転職活動をしてみる。

ぬるま湯の中でやってきたことに客観的な判断をしてもらう。そのつもりでしばらく仕事をする。これだね。


総評

と、在職中にも関わらず寝ぼけたことを言えるのがみかかです。人気なのも頷けるのです。

弊社社員は毎年の就職人気企業ランキングを見て「うちが上位とか学生は何も理解ってねえな!」と笑いますが何わろてんねんと思います

まさかと思うが自分たちの立場自分たちの能力で支えられてると思ってるわけ?と。

自信のある方はどんどんうけると良いと思います

趣味に打ち込むもよし、ガリガリ仕事したい人は踏み台にして転職するもよし、やる気のない同期を抜き去って出世するもよしです。

追記

ビビリダマを修正しました。

2018-10-18

本当は研究者になりたい

本当は研究者になりたい.色々と理由をつけて目的からずれているだけなんじゃないかと思う.

生い立ちを書くと地方私大にかよってコンピュータサイエンスを専攻して卒論では自然言語処理で書いた.一応努力賞には表彰された.

でもレベルは本当に応用しただけでオリジナリティーは無い.

元々大学院に進学するつもりで,二つの院を受けて二つの院とも落ちた.

それでも諦められずに今年大学院を受けて受かった.

それなのに入学金と授業料(授業料バイトして稼ぐつもり)を親に借りるのが申し訳なくて就活して就職するつもりだ,ったのだが

今更になってやはり大学院にいってちゃんと基礎を学んで研究して,ちゃんとした論文を書けるようになりたいという思いが強くなった.

研究者になりたい,研究者になりたい,研究者になりたい.僕にはそれしか無いのだと思う.恋愛にも興味は無いし研究しか生きがいは無い.

奨学金を借りて,入学金の10万だけ親に借りて行くのが正解だろう.バイトしながら行けとか厳しいコメントでもいいので背中を押して欲しい.

修士号をとって博士号をとって機械学習統計学理論的な研究をしたい.数学死ぬ気でやるつもりだ.

就活なんてしてる場合じゃなくてバイトして少しでも大学院お金を稼ぐべきなのかも知れない.

キャリアも大変な事は分かってるでもそれでも挑戦したい.朝起きても寝ても研究したいということしかない.

企業に入りながらと考えたけどやはりそれは違うと思った.いま合格しているのに挑戦しないのは単なるバカなんじゃないかと.

どうか厳しいコメントを待っている.

2018-10-12

anond:20181010122823

本論と直接関係ないのですが、「情報系では」は主語(subject)ではありません。dlitさん言語学者なので、そこはご専門を尊重しましょう…ただ、主題(topic)ではあるかもしれません。

by 自然言語処理分野の博士号取得者。

2018-10-10

anond:20181010070028

その自然言語処理の強力さの証拠に今回のMake By Google 2018では驚きのリアルタイム機械翻訳字幕が付いていた。しかもほぼ誤認識なし。

字幕なんて普通に観てたら気づかないのによく気づいたな

それだけでも増田Googleマニア感が伝わってくる

楽しすぎたAppleディス祭りMake By Google 2018〜

いきなり飛び出すリー動画

Make By Google 2018の冒頭はMake By Google 2018で発表されるであろうハードウェアYoutubeリー動画だった。

このスタートは今回のMake By Google 2018を象徴するものだったと言って良い。

「どうせバレてるんだったら面白おかしくやろうぜ!」というGoogleからメッセージだ。

Help! - The Beatlesコピーバンド

まりにも忠実に再現されていて気付かなかった人も居るかも知れない。

冒頭で流れたThe BeatlesのHelp!はコピーバンドによる演奏だ。

パクりパクられのIT業界ネタしたのか、それとも米Appleと英Apple(レコードレーベル)の商標係争過去にあったことを揶揄しているのか、それともその両方をアピールしたのか定かでない。

少なくとも判る人には判るネタを早速ぶち込むその姿勢に腹を抱えて笑わずはいられない。

Youtubeリー動画の次がコレって今回のMake By Google 2018に期待感が増す。

超強力な自然言語処理

次のパートではGoogleによる自然言語処理の優秀性をアピール

1400言語機械翻訳を処理しているとの発言は単純にスゴいなと感じさせるものであった。

その自然言語処理の強力さの証拠に今回のMake By Google 2018では驚きのリアルタイム機械字幕が付いていた。しかもほぼ誤認識なし。

ただこんなものは始まりに過ぎない。次のパート画像認識処理が本命だった。

画像認識処理はGoogle

そのスゴさは一発で理解可能もので、人間だけではなく犬の眼・鼻・耳すら認識し、Googleフォトからテキスト検索可能だと言う。

Google企業としての取り組み、リーク通りなPixel 3やPixel Slate、Google Home Hubの発表がされ、あーハイハイと見続けて居たが「次はスマートフォンの番だ」との発言から会場は一気に盛り上がる。

13連射撮影によるHDR合成では直接的にiPhone XSを引き合いに出し、iPhone XSよりも明るく写ることをアピール

Pixel 2の頃からカメラはウチだと言い切る大胆不敵なGooglePixel 3でも自信が溢れているようだった。

そしてシングルカメラによる被写界深度コンロトールも堂々と発表してしまうその姿に心が震えたギークも多いのではないか

なぜならシングルカメラによる被写界深度コントロールGoogleが先に実現していた技術であり、同じくシングルカメラ被写界深度コントロールができるiPhone XRをパクりだと揶揄したのだ!

SoCでは華麗にスルー

今回のPixel 3ではQualcommフラグシップSoCであるSnapdragon 845を搭載しているが、GoogleはこのSoC搭載によって向上した処理能力についてほとんど言及しなかった。

これは正しいと言えるだろう。もはや多くの人が察しているだろう、今回のMake By Google 2018のテーマの1つは明らかにギーク」だ。

AR技術であるARステッカーリブランドした「Playground」によって投射されたアイアンマンが登場したとき、ついつい「MARVEL!!!」と叫んでしまった同好の士も多いかと思うが、これはもうGoogleは「Pixel顧客はおまいらだ」と明言したと受け取って良い。

そう、顧客はおまいらなのだ。そうであるならば間違いなく数字はパワーだ!パワーはジャスティスだ!

ならばぶっちゃけ完成度が高すぎるA12 Bionicに対抗して処理能力の向上をアピールするのは得策じゃないだろう。

おまいらは知ってるんだ現状最強のSoCはA12 Bionicだと。わざわざ負ける部分をアピールする必要なんてない。

出荷される無接触充電スタンド

もうこの時点で馬鹿みたいに笑わざる得ないwww

Appleが去年発表した「AirPower」はiPhone XR/XS/XS Maxが出荷されても何故かユーザの手元には届かない。

でもAppleユーザ安心して欲しい。Google純正接触充電スタンドPixel Stand」はQi対応の様々なスマートフォンで使えるらしいので。ゴメン笑うw

いやぁ便利ですよね無接触充電ってwww

その他色々

すべての部分でAppleディスっても仕方がないので、Googleはその他様々なプロダクトを公開した。

その中でやはり注目すべきは「Google Home Hub」で、ホームIoTブランドの「Nest」を抱えている優位性はAppleが指をくわえて見ているしかない分野だ。

Appleもただ黙っているわけでなく「HomePod」などをリリースはしているがGoogleGoogle Home mini投げ売りのせいのあってか上手くはいってない。

Pixel SlateもCeleronからi7まで幅広いライナップを揃え、軽量なChrome OSと合わさり中々便利そうである

そもそも北米STEM(教育)市場ではChrome OS無双と言って良いほどのシェアを獲得しており、AppleだけでなくMicrosoftSTEM市場に興味を示してはいるが、Googleの牙城を崩せずにいる。

最後

もっと細かく語っても良いのだろうけど、実際の製品などに関する情報メディアサイトなどを読んでくれたほうが良いと思うので、そちらをどうぞ。

こういう「判る人にだけ判る」って部分を語れるのが増田の良い部分だと思う。

ホント最高に面白Make By Google 2018でした。

Make By Google 2018のアーカイブYoutubeで観れるのでどうぞ。

それでは、はてなブログなどのApple信者がどういう反応をするのかニヤニヤしながら眺める作業に戻りますね。

2018-08-26

anond:20180826133045

自分画像認識ができると思いこんでいる人工知能の嘆きかな

人工知能増田を書くとは自然言語処理もうまくなってきたんだな

2018-05-11

外部院進はつらい

大学生で、来年から外部の大学院に院進を考えていて受験勉強真っ只中。

専攻を変えるために(元々その分野のことを2年くらいで好きになって自分なりに勉強はしていたのだが)苦労して教科書を読んで勉強中。

過去問も解いてみたが中々解けなくて対策を考えているところ。

なんか未来が見えなくて辛くなってきたから誰かに聞いてほしい。

自分大学では似非情報学科に入って、

大学に入ってから自然言語処理がしたくなって院を探しているのだが、

内部生優先の制度があったり、最近AIブームのせいか倍率が異常だったりする。

特に有名なところとなると倍率も高いしtoeicスコアも相当な点数が要求されているみたいだ。

最初から受け入れ拒否されるところもあると聞いた(そこまでのところには自分出会ってないのだが)

周囲の目線的に院進は落ちるものではないという考えの人がほとんどで、僕自身もそう思っていたのだが、

それは内部院進に限った話で外部となると話は完全に別だなと感じている。

正直受かる未来がまだ見えなくてもがくように勉強したり説明会に出てはいるが、

いつも受験のことが頭をよぎって離れなくてしんどい

このさきどうなっていくのだろうか..

2018-04-06

anond:20180406105426

今は自然言語処理を愚直にこなしてコマンド入力していることが多いと思うけど、

業務が特化されれば、ショートカットコマンド(というかマクロ?)を発音すると、予め登録した作業が出来るようになったりして。

おまけにパーソナライズされて、個人ごとに違ったりすると、

固有名詞以外意味不明呪文が飛び交う、活気のある職場が出来上がり……なんか、楽しそう!

2018-03-14

大学への帰属感と人事の話

ドロドロした話ではなく,研究者業界を知らない人への一般的な話です.

大学研究者は各大学所属していますが,よく大学研究者個人事業主だと言われるように,

実際問題として大学への帰属意識はそれほど高くなく,業界帰属していると考えている人が多いように思います

一般会社員から見ると,大学研究者関係は,会社サラリーマン関係のように思えますし(雇用関係事実その通りなのですが)

心理的にはスポーツチームと選手関係に近いです.

たとえば,情報科学科というもの存在した時に,その中にはアルゴリズム研究者,VR・AR研究者DB研究者自然言語処理研究者

機械学習研究者コンピュータビジョン研究者などの様々な研究者がおります日本大学場合,それぞれが講座制として研究室運営されています

では,自然言語処理研究室助教(昔でいう助手)が准教授になるには,その研究室准教授ポストしか一般的にありえません.

他の選択肢は他大学自然言語処理研究室のみです.つまり,彼/彼女にとっては,A大学情報科学科に所属していると言えますが,

キャリアパスとしては,全国にある大学自然言語処理研究室ポストを見ていることになります

ピッチャーは自・他チームのピッチャーしかなれませんし,ゴールキーパーは自・他チームのゴールキーパーしかなれません.

一部の例外を除いて,他のポジションゴールキーパーフォワード)に移ることはありえないのです.

そう考えると,彼/彼女から見ると,あたか自然言語処理業界株式会社のような概念存在し,

その支店としてのA大学,B大学があると考える方が正しいように思います

そして,キャリアパスとして,うまくいけばA大学助教,B大学准教授,C大学教授栄転をしていくのです.

もちろん一部のエリートは,履歴書東大しかないような人もいますが,

それは会社でいうところの幹部候補生のようなものであまり一般的ではありません.

教授10-20年君臨することを考えると,そういう人は各業界において,10数年に1人の生産ペースです)

最後に少しドロっとした話をしますと,A大学の人事に,B大学教授が口を出すというケースもよくあります

これは,会社視点で考えると異常なことですよね.A大学とB大学は全く資本関係はないのです.

トヨタ部長人事に,日産社長が口を出すようなものです.

しかし,トヨタグループ会社だと考えると素直に理解できませんか?(子会社の人事に,親会社が口を出すというように)

資本上は一切関係がなくても,人的交流による様々なしがらみがあり,それが学閥であったり,業界ドンのような人を生み出しています

おわり.

2018-01-23

自然言語処理界隈

結局、有名大学の教員ポスト地頭いい人が全部占めてる。

要は、生まれつき数学の才能がある人ね。

小町先生とか、文系でもなんたらって言ってるけど、あれ、嘘だと思う。

小町先生自身地頭良いのに、たまたま学部文系に進んじゃっただけで、その後のキャリア全部理系だよね、あの先生

数学の才能ある人は理系行けってだけの話では。

2018-01-09

人工知能でも人あまり

話題人工知能研究者自然言語処理分野。任期あと3年。

3年後は人工知能の冬だ。

高齢ポスドクだのさんざん言われる中、絶対クビになる。研究者やめさせられる。妻子養えない。一家心中だ。

クビはいやだクビはいやだ。

ツイッター人工知能人材争奪戦とか言ってる奴、マジでふざけんな。

20-30代を費やしてくれる人材がほしいだけだろ。40超えたらポイ捨てだろ。業界に入ったときは俺もピチピチ20代だったが、3年後は40代になるんだよ!

俺を落とした大学の一覧でも貼り付けて一家心中でもするかなー。

2017-11-04

Google検索結果が本当に使いにくくなってきた

悪いのはクソアフィサイトを作るやつらと質の低いWebメディア会社、クソSEO会社なんだけど…

もう一度、あのサイト見たいなあと思っても、昔ながらのHTML素組みの個人ページレベルだと全然引っかからない。

自然言語処理で共起語やドキュメントベクトルが似てるサイト検索結果に出してるのかも知れんが、検索キーワードを含んでないページが引っかかり過ぎる。毎回ダブルクォート入れて検索してるけど、それでもまともな検索結果が得られることがあまりない。

2010年2014年ぐらいのロジックに戻してほしい…。

Google検索エンジントップブランドから失墜するのも余裕でありえる状況になってきた。チャンスだ。

2017-10-12

Googleにデコイを食わせろ!

「よろしい、ならば戦争だ」

Google検索と戦う方法を紹介します。

デコイ

デコイ(英: decoy)は、狩猟で囮に使う鳥の模型。これが元来の意味である

デコイ英語: decoy、Military dummy、囮とも)は、敵を欺瞞して本物の目標と誤認させる目的で展開する装備の総称

ネガティブSEO

リバースSEO」や「ネガティブSEO」とも呼ばれる逆SEO

逆SEOとは、特定サイト検索順位を下落させること

Matt Cutts氏が指摘するように、順位を下げるために付けたリンクが、期待とは正反対順位を上げる手助けをしてしまうこともあり得なくはありませんね。

リンクされているサイトではなく、リンク元サイトスパムかどうか判断していることをGoogleゲイリー・イリェーシュ氏がMarketing Landポッドキャストで明らかにしています

この説明にもネガティブSEOの具体例をあげて解説していることからペンギンアップデートネガティブSEO対策に力を入れていることがうかがえます

方針

  1. ネガティブSEOではなく、ポジティブSEO採用する。
  2. ポジティブSEOデコイを大量に投下する。

あなたプログラマーではない場合(手動)

  1. あなた名前を付けたブログTwitterアカウントを作る。(例:はてな次郎のダイエット日記
  2. 質の良い情報必要なので、趣味や特技を活かしたテーマ記事を書く。(例:スムージーオリジナルレシピを紹介)
  3. 業界有名人積極的メッセージを送る。(例:料理家・平野レミさんのちくわストローで飲むティスムージーレシピ感想を送る) https://twitter.com/Remi_Hirano/status/759208574694359044

 

目的は「はてな次郎」の文字列自分管理して、インターネット上に増やすこと。

 

  1. ブログ記事動画にして、YouTubeにアップする。(YouTuberビデオブログ
  2. ブログ記事書籍にする。(例:Amazon KindleAmazonオンデマンド印刷本)
  3. 書籍オーディオブックにする。(例:Amazon Audible

 

目的は「はてな次郎」の文字列を爆発的に増やすこと。

 

セルフプロデュースセルフブランディングするのがポジティブSEO王道です。

現在、「はてな次郎」をGoogle検索したら1万件ヒットする場合セルフブランディングした情報が3万件ヒットするぐらいを目指してください。

はてな次郎」に関する誤情報が、検索結果の10ページ以下に沈めばとりあえず成功です。

あなたプログラマー場合自動

はてな次郎」という文字列インターネット上で増殖させる作業を、手動ではなく自動で行うことも可能です。

 

  1. クローラー」を作り、Web上のデータ収集する。
  2. AI自然言語処理データを加工する。
  3. 加工したデータをもとにポータルサイトを作る。

 

(例)有名人応援するファンサイトを作り、各ページのタイトルやヘッダーに「はてな次郎」の文字列を入れる。

  1. Amazon商品データスクレイピングして、本=著者、CD歌手DVD監督俳優人物データベース作成する。
  2. その人に関する情報スクレイピングする。(DBディアAPI、あのひと検索スパイシーを参考にする)
  3. 日本語英語日本語の往復翻訳をするなどして、オリジナルデータを少し改変する。
  4. 人物に関するデータから、その人物の三行紹介を作成する。(マルコフ連鎖圧縮新聞のような記事を生成する) http://pha.hateblo.jp/entry/20071124/1195904502
  5. 自分が好きな歌手女優なら、自分で紹介記事を書いても良いです。(手動の作業も加えてOK

 

このような方法で、100万ページ程度のWebサイト自動的に作れます

データや加工方法を変えて、さらWebサイトを作れば「はてな次郎」の文字列インターネット上に1億個以上投下することも可能です。

いいね工場

アメリカ大統領選挙ロシア情報操作を行っていたと言われている「ロシアゲート事件」を参考にして、SNSデコイをばらまくことも可能です。

  1. 安いスマートフォンSIMカードを大量に用意する。
  2. SNS操作する専用アプリを作る。(DeployGateやTranspoterPadのようなデプロイツールを利用)
  3. はてな次郎」の情報自分で作ったブログWebサイトSNSアカウントなど)を拡散したり、いいねを送る。

 

ユーザー陳情を受付けないGoogle傲慢ですね?

やりたい放題のGoogleをブッ飛ばすには、プログラミング有効です。

頑張ってください。

 

追記

記事仮名が変更されたので本記事仮名も変更しました。(はてな次郎)

 

補足:

はてな次郎」の文字列自分管理

自分が書いた投稿なら、必要に応じて(自分権限で)表示/非表示を切り替えられるので管理上都合が良い、という意味です。

2017-09-16

株式会社はてな株主構成から見るはてな実態

今戯れに時価総額と持ち株比率から換算した資産表作った

近藤 淳也 66.33% 4482581400円 ○

(株)はてな 6.59% 445352200円

毛利 裕二 5.98% 404128400円

梅田 望夫 4.30% 290594000円

栗栖 義臣(社長) 2.61% 176383800円 ○

大西 康裕 1.97% 133132600円 ○

伊藤 直也 1.79% 120968200円 ○

田中 慎樹 1.41% 95287800円

田中 慎司 1.30% 87854000円 ○

小林 直樹 1.15% 77717000円

お金の額面はともかくの話なんだけど、

○をつけたのは、はてなコードを書いたことがあると"思われる人"。「名前 プログラミング」で検索して有意な結果が出た人に○つけた。各株主の詳細知りたい人は適当にググって

で、さら


はてな年収は524万円が平均年収です。(有価証券報告書調べ)

http://heikinnenshu.jp/joho/hatena.html

あると好ましい知識経験

スクリプト言語(主に Perl/PHP/Python/Ruby/JavaScript)によるアプリケーションライブラリ開発の経験

ScalaGoにおけるアプリケーションライブラリ開発の経験

iPhoneアプリ、もしくはAndroidアプリの開発経験

UNIX系OSRDBMS特に LinuxMySQL)についての基礎知識

オブジェクト指向プログラミングの基礎知識

コンピュータサイエンスアルゴリズムデータ構造分散技術自然言語処理技術機械学習データマイニング型理論)に関する基礎知識

ネットワーク技術HTTPDNSTCP/IPなど)についての基礎知識

大学卒/275,000円〜

http://hatenacorp.jp/recruit/fresh/application-engineer-entry

って、エンジニア待遇悪すぎじゃない?

この毛利 裕二という人の持ち株の資産新卒給料(計算だるかったか計算からボーナス抜いたけど、手取り分で考えたらボーナス分くらいは消えるだろう)で稼ぐとしたら122年かかるし、梅田 望夫という人は88年かかる。本当にこの人たちにはそれほどの価値(上にあげた新卒に求めるやたらと高いスペック)分の価値があるのか?いや、価値があると思ったから株をあてがったんだろうけど...

まぁなんていうか...、はてなのエンジニアのみなさんお疲れ様です...業務がんばってください

完全に外様の俺から言えるのは"エンジニアに"もっと給料たくさん払った方がいいんじゃないかということだけです

2017-03-18

自然言語処理に詳しい人向け

自分理解だけど、言語理論増田

word2vecでいうベクトル表現的な言語体系を目指してるんじゃないかと予想。

普通言語はそれこそone hot的な表現だけど、めちゃくちゃ単純化すれば自然言語ベクトル表現のように3つの記号で表すことができて

それこそ単語の足し算引き算みたいな事が可能になるレベル言語体系ができるんじゃないかって話だと予想してる。

2017-03-08

3/8の人工知能(AI)関連プレスリリーステクノロジー視点解説

日々流れる人工知能(AI)関連のプレスリリースAI研究者視点から軽く解説します。

ウェブ面接プラットフォームHireVue株式会社バンダイにおける導入利用のお知らせ

https://prtimes.jp/main/html/rd/p/000000019.000016792.html

人工知能技術ウェブ面接プラットフォーム上に溜まった会社情報候補者情報からマッチング

難易度】低

宿泊施設の料金設定の悩みを解消 MagicPrice(株式会社空)とホテルシステムのDynalution(ダイテック株式会社)が業務提携

https://prtimes.jp/main/html/rd/p/000000006.000019984.html

人工知能技術】MagicPriceはホテル宿泊施設データを用い、最適な料金設定をAIで行っている

【何が変わったかデータの定期的なアップロード作業必要だったが、宿泊施設データ管理システムDynalutionとの連携により不要に。利用者からはより簡単に利用でき、分析をするMagicPrice側からデータフォーマットのブレがなくなり分析やすくなった。

ユーザーがChatbotでリアルタイム試合情報を取得、AI×人の相互コミュニケーションによる新しい観戦スタイル

https://prtimes.jp/main/html/rd/p/000000027.000017379.html

サービス名】Live Sports Chatbot

概要日本チーム選手情報や、リアルタイムでの試合の実況情報などユーザーリクエストに対し、チャットボット自動応答。また特定選手についての質問や、過去の成績についても応答が可能

技術データスタジアムの「一球速報プラットフォーム」のデータベースから質問に対してチャットボットが応答。

本文引用一般的対話システムには、想定質問とそれに対する応答のQ&Aデータが予めインプットされており、ユーザーリクエストに対しそのデータベースから適する応答を返すというものが主流ですが、本サービスでは試合中、常に変化する実況情報リアルタイムユーザー配信します。』

この「リアルタイム」は「データベースリアルタイム更新されているだけ」であり、応答のセリフなどの部分については従来通りだと思われる。

【開発】Nextremer

英語学習AIロボットMusio(ミュージオ)、髙島屋と共に親子で英語に親しむ新しい体験提供

https://prtimes.jp/main/html/rd/p/000000012.000017199.html

サービス名】英語学習AIロボット「Musio」

技術音声認識(英語)、自然言語処理(英語)、対話モデル

英語対話データをもとに受け答えを行う。

本文引用会話内容だんだん覚えていく』

これはりんねプレミア(https://twitter.com/premieresao)と同じく、相手発言内容を記録していっている。

【開発】AKA

2017-03-02

LINE世界で負け続ける理由は、ニュースタブのことじゃねえよ、馬鹿

http://blogos.com/article/212112/

----------------------------

僕はLINEを愛してる。

愛してるがゆえにLINEをどんどん駄目にするLINE経営層が許せない。

はっきり言うが、彼らのやってることはグダグダだ。他社のチャットサービスが成長してる中、LINEが初めてユーザー数が減少したと言うがそれは当然だ。

説明しよう。

----------------------------

微妙にバズっているこの記事

多分に自己愛思い込みの強い著者が、アプリってのはこうグロースさせるもんなんだからそれをやれてないお前ら間違っている

一方的断じているもので、共感できるところは各タブに名前が入っていないことくらいのぶっちゃけ大して価値のない記事であった。

そもそもニュース領域twitterと違い、LINE株式会社側にLivedoor由来の編集チームがいてリソースが確保されている点、すでにLINENEWSという

基盤が存在している点で突然何の前触れもなくニュースを始めた日本twitterとはわけが違うだろう。

さら噴飯ものタイムラインについての評価で、まず誰も見ていないと断じているが、

リサーチベースではこんなものも出ている(http://gaiax-socialmedialab.jp/post-1891/

大体、広告事業としてのLINE ADS Platformは、このタイムラインベースにしたインフィードアドが中心であり、それで十分にマネタイズできている

ということは、タイムライン一定使われていて、広告インプ一定以上発生していることの証左だろう。

まり、この著者自体が、自分の見ている物事からしか評価判断のできない典型的な「マーケティング知らない人間なのだろう。

何をしてきた方かは存じ上げないが、いわゆるユーザーグロースのみをマーケティングであると思い込んでいるIT野郎

LINEニュースタブは、すでにユーザー一定以上グロースしている国内LINEユーザーに対してより多くの広告インプを発生させるためのレベニューグロース

としての側面が強いわけで、それも含めてマーケティングであるのだから、十分LINE現場も、経営陣もマーケティングを、経営理解していると言っていいだろう。

あ、後ユーザー数が減少と書いているけど、これはニュースタブを追加していない国についての話であって、そもそもの前提からしてもうめちゃくちゃ。調べずに書いてる感満載。


からこそ失望したのが、これなわけで。僕もLINEを愛しているけど、これはマジでないんじゃないか

http://jp.techcrunch.com/2017/03/02/line-clova/

----------------------------

スペインバルセロナで開催中のモバイルカンファレンスMobile World Congress(MWC) 2017」。そのキーノートにも登壇したLINE3月2日クラウドAIプラットフォーム「Clova(クローバ)」を発表した。

今後はClovaを搭載したアプリ「Clova App」を提供するほか、初の自社デバイスとなるスマートスピーカーWAVEウェーブ)」を今夏にも日本韓国で発売する予定だ。

今冬にはスマートディスプレイ「FACE(フェース)」の提供も控えるという。

----------------------------

要はAmazon Echoとか、Google Homeとか、スマートスピーカー領域(というか、音声会話をベースにしたインターフェース領域)に打って出るというわけだ。

これは一面ではすごく合理的に見える。つまりチャットサービスとしてユーザー間、ユーザー企業間でのコミュニケーションインフラ提供しているLINEが、textingから音声を介した

コミュニケーションインフラに舵を切るということ。事業の成長の向く先としてわかりやすい。

が。これ。マジで間違いなくうまくいかない。頓挫する。てかこれこそ、挑戦の美名に酔いしれてマーケティングを忘れた経営判断だろ、と思う。

何が問題か。答えは明白だ。 言語である

音声インターフェイスの要は、自然言語処理であり、発話された音声を正確に理解する技術にあるはずだ。

この点、AmazonGoogle基本的に「英語」という話者が圧倒的に多い言語に優先して開発を進めればよかった。現に英語自然言語処理はめちゃくちゃ進んでいる。

しかし、LINEは違う。英語圏ではまったく使われていないサービスなのだ。それどころか、LINEが浸透している主要国は日本台湾タイインドネシアの4カ国である

もうおわかりだろう。どの国も公用語がバラバなのだ

サービスを普及させるためには、地の利を生かすほかない。そういう意味英語圏は端から勝負しようがない。一方中華圏、圧倒的人口を誇るメインランドにはWeChatという

巨人存在し、市場に入ることすらできていない。

であるからして、浸透している主要4カ国で普及させる、という選択肢にせざるを得ないだろう。しかし、この4カ国ぶっちゃけ日本インドネシアしか1億を越える人口の国はない。

その上、GDPベースで考えてもスマートスピーカー短期的に人口膾炙するほど普及させられるマーケット日本と台湾しかない。

さらさらに、R&Dの視点からいって、4カ国それぞれの言語にあわせて自然言語処理一定水準まで高めるには、英語1つに絞って開発するのと比較して単純に4倍のコストと労力がかかる。

典型的な、労多くして実り少ない状況なわけだ。

どう考えても八方塞だ。

コミュニケーションプラットフォームである以上「言語」は避けて通れない問題。これを攻略する方法は正直、僕にはわからない。

からもはやLINEは、チャットサービスとして浸透している国の中で、その土台の上で、ニュースタブとかその他もろもろで、

きちんとレベニューグロースを続けるのであれば、ぜんぜん負け続けることなんてないのになーと僕は思います

事実世界でこんなに儲けているメッセージングアプリはないのだから、その時点で十分世界で勝ってんじゃん、と思うわけで。

経営陣には、熱病に浮かされることなく、着実に一つ一つできることを勝負して行っていただきたい、そう思う限りです。

2016-12-14

一部の層に"できない子"の存在が見えなくなっているのではという話

今秋、人工知能による東大合格を目指していた「東ロボくん」がその目標を断念したというニュースがあった。AI文章の読解(意味理解)が苦手である、というのが大きなネックだったようだ。

このニュース自体は、現在自然言語処理限界という観点からはそれほど驚くにはあたらない。だが同時に一つの問題が提起された。

「AIの性能を上げている場合ではない」──東ロボくん開発者が危機感を募らせる、AIに勝てない中高生の読解力 - ITmedia ニュース

AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?(湯浅誠) - 個人 - Yahoo!ニュース

文章意味理解できない東ロボよりも、得点の低い高校生がいるのは、どういうことだ?」

「この高校生たちは、文章意味理解できているのだろうか?」

義務教育で、教科書文章を読める力は本当についているのだろうか?」

その実例として挙げられているのが次のような問題である

例えば「仏教東南アジア東アジアに、キリスト教ヨーロッパ南北アメリカオセアニアに、イスラム教北アフリカ西アジア中央アジア東南アジアにおもに広がっている」という例文からオセアニアに広がっているのは(   )である」という文の空欄にあてはまるものを選ぶ問題がある。

文章をしっかり読めば、答えがキリスト教であることは明白だ。しかし、全国約1000人の中高生のうち、約3割が正答を選べなかったという。他にも問題文に回答が書いてあるような同様の問題で、文章を正しく読み取れない生徒が一定割合存在しているという。

複雑な論理関係や推論の必要ない、むしろほとんど同語反復に近いこの問題に、中高生の3割が誤答したという。

この問題は文中の語の意味理解することを必要とせず、文中の語と語の関係だけから答えを導くことができる。すなわち"AIが解ける"レベル問題なのに、である

この事実は、ある種の人々にとって衝撃的なニュースとして受け止められたようである

だが個人的にはむしろ納得のいく結果であると感じている。自分公立中学校に通っていた時の実感と合致するからだ。"そういう子"は間違いなく、そして少なからずいた。

この"実感"を言葉説明するのはなかなか難しい。音読は(一応)できる。目で文字を追って発声することはできる、が、その文の意味が明らかに理解されていない。あるいは会話をしていて「アルファベータカッパらったらイプシロンした」くらいならまあ通じるが、「アルファベータカッパらったらイプシロンしたけどデルタがゼータにイオタしたかベータデルタシグマった」みたいになるともう通じない。時間をかけて一つ一つ説明すれば通じるのだが、とっさには理解されない。中学の段階でそういう子は間違いなくいたのである

40人のクラスで3割と言えば十数人というになろうか、決して盛りすぎとはいえないと思う。

しかし、ある一定の層、特にある程度以上の学歴があって、社会でもリーダーシップを取っているような層の人にとってこの結果が衝撃的だというのは、つまりそのような人たちに"そういう子"の存在が見えていなかった、ということだろうと思われるのだ。

ある種の人達に、別のある種の人達存在が見えなくなっている、それは社会にある種の分断を生んでいるのではないか

"そういう子"が見えなくなる背景には、中学受験存在があるように思う。少なくとも都市部では、親に経済的余裕があって子ども学力一定以上なら中学受験は当たり前になっている。それも今に始まったことではなく、もう数十年に渡ってそうなのである

中学受験してしまえば周囲は一定以上の学力の子ばかりになる。彼らはそれ以降"そういう子"とはぜんぜん関わらずに過ごすことになる。

もちろん中学受験組も、小学校公立であればその間は読解力の低い子らと一緒くたに過ごすことになる。だが、小学生の段階ではそういう観点から相手客観視するまでには至らないだろう。

そして思春期以降は一定水準以上の仲間たちに囲まれ小学校の頃にいた "(なんとなく)できない子" の多くがその読解や学習上の困難を克服できぬまま中学を巣立っていくことも知らず、やがてそういう子らの存在を忘れてしまう、こういうことがひょっとして起きているのではないか

もしそうだとしたら、それは社会的な分断以外の何物でもない。

学習に困難を抱える子どもをどうケアするかというのはもちろん大きな課題であるが、もし社会にかような分断が生じているとしたら、その克服も一つの社会的課題だろう。

2016-12-12

誰かアフィまとめキュレーションを徹底的に避けたgoogleに代わる検索エンジン作れない?

・アフィ対策

文面がかなり似通った感じになるので自然言語処理クラスタ化してまるごと排除

まとめサイト対策

まとめ先が時系列で先行してることが確定できていたら除外

趣味まとめ系は結構有用なのが少し悩むが…

キュレーションサイト対策

同上

記事類似性から時系列的に先行してる一次資料特定できる場合自動的に除外

2016-11-24

トランプ大統領になって一番困ること。

自然言語処理界隈ではトランプカード大統領

分類することに困っている。

アーカイブ ヘルプ
ログイン ユーザー登録
ようこそ ゲスト さん