「自然言語処理」を含む日記 RSS

はてなキーワード: 自然言語処理とは

2015-09-28

[]トピック見出しわけわかめ

はてなブックマーク10周年新企画として導入されたトピック機能

トピックリスト上の見出しと、個別トピック開いた時の見出しが違ってわかりづらい。

http://b.hatena.ne.jp/topiclist

  

VWディーゼル排ガス不正問題を例にとる。

  

トピックリスト上では「独VW排ガス不正」、個別トピック開くと

vwって何? - はてなブックマーク

http://b.hatena.ne.jp/topic/300615183698808978

トピックリスト上では「BMW排ガス制限超え」、個別トピック開くと

フォルクスワーゲンって何? - はてなブックマーク

http://b.hatena.ne.jp/topic/300597687033236877

トピックリスト上では「欧州でも不正認める」、個別トピック開くと

vwって何? - はてなブックマーク

http://b.hatena.ne.jp/topic/300597724437095345

  

トピックリスト上の見出しと、個別トピック開いた時の見出しをわざわざ変える理由は何?

そもそも個別トピック見出しが「vw」「フォルクスワーゲン」「vw」ではニュース内容の説明に全くなってない。

  

自然言語処理技術を用いたタイトル自動生成がウリらしいが、その結果がこれ?

はてなブックマーク10周年新機能トピック」 - はてなブックマーク

http://b.hatena.ne.jp/10th/topic

自然言語処理技術を用いたはてなブックマークの新機能トピック」をベータリリースしました - はてなブックマーク開発ブログhttp://bookmark.hatenastaff.com/entry/2015/02/05/190331

はてなブックマークトピックページの裏側 - Hatena Developer Blog

http://developer.hatenastaff.com/entry/2015/02/12/165918

  

ベータリリースらしいが、2月リリースして半年以上経ってこの状態

リリースしただけで満足して放置してない?

実際に自動生成された見出しを人の手でチェックし、十分でないなら人力で見出し修正

また、自動生成の見出しが人力修正相当になるようプログラムを改良したりしてますか?

  

トピック機能のコンセプト自体は素晴らしい。

トピック見出しを追うだけでニュースの経過がざっとわかるようになれば嬉しい。

しかし今のままでは、使いづらい→利用者増えない→サービス需要ないんだ→開発放置、の悪循環になりそうで。

  

まずは個別トピック見出しトピックリスト上の見出し統一してもらいたい。

2015-08-12

おれ川内って言うんだけど

はてぶの新着トピック川内原発トピックタイトルが「川内」になっていてビクっとなったわ。

なんどか指摘されてるけど、自然言語処理技術で作られたっていう新着トピック機能ってあんまり頭良くないよね。

2015-07-16

http://anond.hatelabo.jp/20150716201716

タイトル意味不明数字だったり、変なところで切れてたり、あれは人手で修正したらいけないって決まりでもあるのかね。

自然言語処理技術自動生成ってのが売りかもしれんけど、どの程度の技術中の人はわかってただろうし、人間修正する仕組みが組み込まれてないのがよくわからん

2015-06-09

佐野  千遥 さの ちはる

セント・クレメンツ大学教授

ロシア科学アカデミースミルノフ物理学派論文審査員

東大基礎科学科卒。過去250~340年間世界の大数学者達が解こうとして解けなかった、世界史数学難問4つを解き、現在ロシア科学アカデミー数学の部で審査中。マスターした11ヶ国語を駆使したプロ通訳翻訳家矛盾だらけの現代物理学を初め、全科学自然社会人文科学)の主だった物を体系的に批判し各々に別体系を提起。各種受験生(医学部難関大学入試数学オリンピック社会人大学院入試、IT関連資格)支援

■経 歴

2002年 (至現在セント・クレメンツ国際大学 物理学教授

2001年 英国セント・クレメンツ大学で数理物理学博士号取得

2002年 ロシア科学アカデミー・スミルンフ物理学派論文審査員となる

1999年 英国ウィットフィールド大学コンピュータ科学人工知能博士号取得

1991年 (~1993年)University of California、 Irvine人工知能研究所確率論批判・学習システムの研究

1988年 (~1991年世界認知科学権威ロージャー・シャンクのCognitive Systemsのデータベース研究所IBSで自然言語処理研究

1986年 (~1988年)欧州先端科学研究プロジェクトESPRITにESPRITディレクターとして仏Telemecanique研究所より参加(生産ラインへの人工知能導入の研究)

1985年 西独ジーメンスミュンヘン研究所生産ラインへの人工知能導入の研究

1982年 (~1985年)[仏国]世界一速い列車TGVのメーカーAlsthom社の知能ロボット研究所

1981年 (~1982年)[仏国]グルノーブル大学院、ソルボンヌ大学院通訳国家免状取得

1980年 (~1981年)[スペイン]マドリード大学院言語学履修 西国政府給費留学生

1971年 東京大学基礎科学卒業数学物理学専攻)

■専門分野

数理物理学Ph.D.コンピュータ科学人工知能Ph.D.マスターした11カ国語を駆使したプロ通訳翻訳家

■講演テーマ

ビジネスマン文系社員理工系技術技術発明評価できる眼を」

近年世界大学ビジネス志向学生向けに、理系技術的な事がある程度分かるためのカリキュラム改変が始まっている。しかし申し訳程度であり、また理系の拠って立つ数学物理学科学理論自体に欠陥が有る事が最近明らかとなっているため、正しい数学物理学の粋を伝授し、文系でも本物の理系技術評価が出来るように支援する。

英語完璧に&現地語(非英語)を或る程度使えるマネジャー急遽創出と、社員の中から国語通訳ネーティブに肉薄する敏捷性と正確さで急遽育成を支援

海外プロジェクト企業と折衝するとき英語ネーティブ並みであったり、現地語を自社のディレクター自身がある程度こなせるか、英語、現地語につきネーティブ並みの社員通訳出来ると先方との話が大きく好転する場合が少なくない。それを本当に実現する教育訓練を私は提供できる。平明に説明し、実体験をしてみたい方がいらっしゃるなら講演会場で手解きをしてみたい。

発見された言語学理論外国語訓練方法論を基に、文科省英会話学校英語教育訓練方法論の根本的誤りの中枢を詳説」

統語法意味論、文脈意味論、実世界意味論の3レベルで進展するネーティブ母国語習得過程の中、言語能力の真の中枢は解説も無しに親の喋るのを聴いているだけで分かるようになる統語法的意味把握能力で、これは文法用語を全く使っていなくても徹底した文法訓練となっている。ネーティブが敏捷性、精度の点で万全であり、先ず文法的間違いをすることはない理由はここにある。全文法分野について書き換え問題の「即聞即答訓練」を一気に中学生以上の年齢の人に施し、全文法のビビッドな一覧性を習得させるとネーティブに肉薄する敏捷性と精度で外国語を使いこなせるようになることが発見された。

「<証明された欠陥数学> 確率統計と微積分学のビジネス金融工学保険業界での使用に対する警告と、それに取って代る新数学体系」

我々物理世界は離散値の世界であることが原因で、物理世界に住む人間頭脳が考え出した数学の中で連続実数値に基づく確率統計学微積分学だけが欠陥数学として発現していることが証明された。決して建設的な予測をすることができず、崩壊していく事象に後ろ向きにしか適用できず、せいぜいリスク管理にしか使い道の無い確率統計学ビジネス学の分野では金科玉条の如く信用し積極的やり方で利用しているが、ここに「理論」と現実との間に大きな食い違いが生じている点に警告を発したい。そのためそれに取って代る新数学体系を提起する。全てを分かり易く解説します。

「新エネルギーエコ向けの発想を大転回した技術的な重要な発明を提起」

20世紀初頭に数理物理学者Henri Poincareは二体問題までは解けるが三体問題(三つの星が互いに重力で引き合いながら運動している時の時々刻々の位置を計算で求める事)以上は微積分学を使って解く事が出来ない事を証明した。これは無限小差分を使う微積分は計算式中で交差する項をほぼ同等とみなして相殺してしまうため、作用反作用法則(F1*v1=-F2*v2)の取り違い(F1=-F2が作用反作用法則である圧倒的多数が信じている)と相俟って、交互に対称な運動しか記述できないため、対称性の有る二体までは記述できても対称性のない三体以上は記述できないためである。この欠陥数学微積分を基に二体までは「エネルギー保存則」を証明したものの三体以上の「エネルギー保存則」は本来的に証明不可能であることが明らかと成った。現に永久磁石エネルギー保存則を大きく超えることが実証され始めている。それらの実験につき具体的に物理学の素人の方々にも分かりやすく報告したい。

世界史的体系的誤りに迷い込んだ現代物理学とその使用者への警告とそれに取って代る新物理学

現代物理学の二本柱、量子力学相対論の中、量子力学水素原子原子核と軌道電子関係説明を辛うじて試みただけで、水素原子より複雑な原子分子の構造の説明に実は悉く失敗し、繰り込み・摂動理論はその失敗を隠すため後に持込まれた。軌道電子光速に比べ無視できぬ速度でクーロン力原子核に引かれて急カーブしながら等速加速度運動、大量のエネルギーを消費するが、半永久的に軌道を回る。しかしシュレーディンガー波動方程式(その波動関数とその共役関数の積は確率)はエネルギー消費に一切言及せず、エネルギーレベル一定に保たれるという明らかに矛盾した論を展開する。また確率を持ち込んだからには、エントロピー単調増大法則がここに適用され、水素原子は瞬時に粉々に飛び散らなければならぬ現実に反する二つ目の重大矛盾に遭遇するが、これもシュレーディンガーは見てみぬ振りをする。つまり水素原子の構造の説明にすら量子力学は完全に失敗した。量子力学とは動力学でなく各エネルギーレベルについての静力学でしかなく、「量子力学」の「力学」なる名前とは裏腹に力を論じられない。論じればエネルギー消費が起こりエネルギーレベル一定論が崩れる。

現代フォン・ノイマンコンピュータアーキテクチャーの誤りと、創るべき新コンピュータアーキテクチャー」

現代フォン・ノイマンコンピュータ計算機モデルが取りも直さずチューリングマシンのものであるチューリングマシンは決ったパラメータ数の状態間の遷移を静的モデル化したものであるのに対し、歴史的にその直前に発表されたアロンソチャーチ計算モデルラムダ・キャルキュラス(人工知能プラグラミング言語LISP言語理論でもある)は関数の中に関数が次々に入れ子のように代入されて行き擬パラメータが増えていくダイナミックな仕組みを持つ。この後者人間が作ったコンピュータを遥かに凌ぎ、宇宙の始原から発生した環境データから関数をf1(t),f2(t),.,fn(t)と次々に学習し入れ子のように代入進化し、次の一ステップ計算には宇宙の始原からの全ての関数f1,f2,...,fnを思い起こし、そのそれぞれの差分を取って掛け合わせる事をしているコンピュータとも言える物理世界とその時間学習進化時系列順に模写するのに持って来いの仕組である関数と言っても多項式で充分である事を世界の7大数学難問の一つPolynomial=Non-Polynomialの私の証明も交えて平明に解説する。これは日本の国と世界先進諸国コンピュータ科学の今後の研究方向を左右する発言となる。

■実 績

【講演実績】

大学大学院2002年以来常時講義

Trinity International University

コンピュータ科学」 学士号コースの学生卒業まで全コースを講義

St.-Clements University

金融工学必要数学物理学」の博士号コースの学生3年間に渡って講義、研究テーマと研究内容、博士論文アドバイス

St.-Clements University

研究テーマ「コルモゴロフ複雑系の二進ビットストリングの下限=Lower bound for binary bitstring in Kolmogorov complexity」の博士号コースの学生Dr. Bradley Ticeに英語アドバイス

St.-Clements University

外国語学部ポルトガル語伊語通訳翻訳学士号コースの学生教養学部レベルから社会科学経済学法律学社会学経営学)、人文科学哲学言語学心理学歴史学)、自然科学数学物理学化学生物学、医学、計算機数学)、エンジニヤリングInformation Technologyソフトウエア工学電気工学電子工学)の各々の学科の全講義を行う。

Госдарственный Университет Санктпетербургской Гражданской Авиации (サンクトペテルブルグ国立航空大学)

物理学学会の論文発表会で幾多の論文の露語によるプリゼンテーション。

メディア出演】

ロシアで3度物理学権威スミルノフ氏とTV出演、ロシア

【執筆】

学会物理学論文多数発表

ti-probabilistic Learning by Manifold Algebraic Geometry, SPIE Proceeding, 1992 Orlando 等 人工知能学会論文

日本国内では著書「人工生命人工知能」「超勉強法超批判」

2015-06-04

http://anond.hatelabo.jp/20150604084011

なんか、こう頭のレベルが違うと、

論点がズレて、変な決めつけで、違うんですが、

と言い返せば、あんたここそういうところじゃないよ?とか、

わけわからんことを言われる。

”頭のレベルが違って論点がずれている人”の発言は、どこからどこまで?

しかし、リアル社会でもあるよな、これ。

高学歴足切りある会社いった方がまだ理性的

人がいてやりやすいと思うよ。

馬鹿に媚び売らなきゃ、馬鹿がお前は社会的に認められない!

とか、いうてきますよ。

足切りある会社」とは?誰でも入社できる会社なんぞ、存在するのか?

高学歴足切りある会社いった方がまだ理性的な人がいてやりやすいと思うよ。」理性的論点うんぬんと前もって言っていたのだから、こういう文章には論理的という単語を使う方が意味が通じる。

馬鹿に媚び売らなきゃ、馬鹿がお前は社会的に認められない!」主語馬鹿?お前?

「いうてきますよ」とは、方言

なんで馬鹿程、理性もないのに自分が一番正しいとか

やれるのかなぁ?

自分が一番正しいとかやれる」

文章的には、やはり変。読み返しても気付かないのは、まともな日本語教育を受けていない人間外国語圏内の人間ならば、しょうがない。

そんなの自分のも含めて思想なんかいくらでもあるから

色んな現象対処できるのに。

思想」に対して「対処」という動詞は、通常ならば使わない。

以下は、もう面倒くさいから一言で。自嘲?

一番ワロタのは、

お前の身近ことだけで世界知った気になんな

→幅広いケースに実際に出会い、且つ研究もしてます

→何本読んで知った気になってんの?

そして、こちらの高学歴カードには、東大がいる増田で自慢すんな恥ずかしい

と、返され、しかし見ていた東大卒がいや、それすごいんだけど、

と、お前買いかぶり過ぎとフォローしてくれた。

高学歴とは、偏差値ないやつほど買いかぶりをし、

高いやつほど大したことない、そいつ次第という。

なんなんだろうな。本質を見抜くのはこちらのが高いけど、

こんな自称普通に常識的に生きてるDQNよりマシな人間とか、

宣言して、自分範囲外のことを全て品なく否定する奴って、

本当に普通人間なのか?

なんかクリーチャーというか、そんな奴が普通社会なんか

こちらから願い下げだし頭おかしいと思う。

まだ、はい論破ー、とかい高校生なら、

倒せば負けを認めるが、

変に社会のずるさとか覚えた大人だと、

浅い考えで、思考も深くする訓練もしてないのに、

社会全体を知った気でいて、本当話す価値がない。

けど、ムカつくので君が泣くまで殴るのをやめないに

なってしまうのである

どうも、自分の事を頭が良いと思って書いている文章のように読み取れたのだが、

たとえネット文章であっても、利口な人間が書くならば、ここまで文章が崩れて読み難い文章になることはない。これはどういう思想体系の人間においても、共通して言えること。

よって、控えめに”日本語が苦手だからと、外国人翻訳ソフトを使って作り出した日本語文章ならばしょうがない”としてレスを付けた。自分の興味は自然言語処理だったので、単純にその点を確認たかった。且つ、多少「本当に自分が頭良い人間と思っているの?だとしたら凄い度胸だ」と多少の揶揄を込めて書いたトラバだ。

以上、これでお気に召しただろうか?

2015-04-14

ハテブはもうちょっとカテゴリの判定をうまくやってほしい

マイノリティーがどうとかネトウヨがどうとか、そういう話題は見たくなくなってきたかテクノロジーとかアニメとかのカテゴリだけチェックするようになったけど、それでも見たくない話題がくるんだよな。

どろどろしたブクマは俺が手作業で、政治とか暮らしカテゴリーに送り返してるけど、見るだけで気がめいるか自動判定をしっかりしてほしいわ。

ちょっとまえに自然言語処理技術トピック機能作りましたって宣伝してたけど、その技術力をカテゴリ判定につかってほしい。

ツイッター揉め事があったらとりあえずテクノロジーみたいな安直な判定はやめて。

2014-12-22

ウェブ系,人工知能系,ソーシャルメディア系の国際会議〆切メモ

信号処理自然言語処理画像処理機械学習データベース,等々はよく知らない.

2014-04-26

円城塔本の雑誌の連載「書籍化までn光年」で取り上げた本のリスト

http://anond.hatelabo.jp/20140421200127

書籍化まで7光年 (2009年)

  1. アンドルー・クルミー 『ミスター・ミー』    「『ミスター・ミー』とドップラー効果恋愛小説
  2. ポール・オースター 『幻影の書』    「オースター百%の『幻影の書』と本のスカート
  3. ピエールバイヤール 『読んでいない本について堂々と語る方法』    「読んでいない本を語る方法と「特性のない本」」
  4. ジョン・クロウリーエンジンサマー』    「言葉の"ずれ"と物騒な本」
  5. 浅暮三文ぽんこつ喜劇』    「ひよこサクラ実験小説
  6. シュボーンロバーツ 『多面体と宇宙の謎に迫った幾何学者』    「迷走と眩惑の理学タイトルの謎」
  7. David Flanagan 『プログラミング言語 Ruby』    「プログラミング言語小説屋」
  8. ジャック・ルーボー 『麗しのオルタンス』    「超絶馬鹿技巧小説『麗しのオルタンス』に隠された秘密
  9. ジャック・ルーボー 『麗しのオルタンス』    「数と音楽の秩序で作られた希代の小説
  10. ヒュー・ケナー 『機械という名の詩神』    「文学テクノロジー作家関係
  11. チャールズ・ストロス 『アッチェレランド』    「全編ボケ倒しのすごい奴」
  12. 多和田葉子ボルドーの義兄』    「『ボルドーの義兄』謎の276文字を追う」

書籍化まで6光年 (2010年)

  1. パウル・クレー新版 クレー日記』    「小説のような日記日記のような小説
  2. 中野美代子ザナドゥーへの道』    「多幸感に満ちた文字の連なり」
  3. ジャック・ルーボー 『麗しのオルタンス』    「『麗しのオルタンス』ジャック・ルーボーに直撃質問!」
  4. ミロラド・パヴィッチ 『帝都最後の恋』    「タロットにしたがって読むパヴィッチの本」
  5. ダンガードナーリスクあなたは騙される』    「現実小説よりハッピーなのだ!」
  6. ティーヴ・トルツ 『ぼくを創るすべての要素のほんの一部 』    「長い小説が書けない理由!?」
  7. 大野克嗣 『非線形世界』    「単純素朴なのになぜか伝わらない本」
  8. ジル・プライスバートデービス 『忘れられない脳』    「ジル・プライス忘却のない人生
  9. クラーク・アシュトン・スミス 『ゾティーク幻妖怪異譚』    「「そういう人」スミスが好き」
  10. スタニスワフ・レム 『泰平ヨンの航星日記』    「レムの欠番を埋めるのは」
  11. エミーリ・ロサーレスまぼろし王都』    「見えないものが見える瞬間」
  12. イヴィッド・レヴィット 『数式に憑かれたインド数学者』    「稀代の数学者架空伝記」

書籍化まで5光年 (2011年)

  1. ブノワ・デュトゥールトゥル 『幼女煙草』    「不穏さに満ち満ちた『幼女煙草』」
  2. スマイル・カダレ 『死者の軍隊将軍』    「不思議な国アルバニア戦争小説
  3. 高橋陽一郎 『変化をとらえる』    「数学教科書いろいろ」
  4. サイモン・シンエツァート・エルンスト代替医療トリック』    「代替医療に挑む議論の書」
  5. 辻原登 『闇の奥』    「辻原登は変である
  6. 柏野牧夫 『音のイリュージョン』    「聴覚だって騙される」
  7. マックス・ブルックスWORLD WAR Z』    「語り伝える書」
  8. ジェラルディン・ブルックスマーチ家の父』    「網目だらけ」
  9. グレゴリー・コクランヘンリー・ハー ペンディング 『一万年進化爆発』    「淡々進化中」
  10. イヴィッド・グラン 『ロスト・シティZ』    「見えない都市
  11. Federico Biancuzzi、Shane Warden 『言語設計者たちが考えること』    「言葉を作る人たち」
  12. A・R・ルリヤ 『偉大な記憶力の物語』    「無限記憶を持つ男」

書籍化まで4光年 (2012年)

  1. V・S・ラマチャンドラン、D・ロジャース=ラマチャンドラン 『知覚は幻』    「美の起源?」
  2. Charles Yu 『How to Live Safely in a Science Fictional Universe』(『SF的な宇宙安全に暮らすっていうこと』)    「ウーのくすぐり芸」
  3. マット・リドレー 『繁栄』    「人類は滅亡しない?」
  4. ウンベルト・エーコ 『バウドリーノ』    「エーコが好きだ!」
  5. Steven Bird、Ewan Klein、Edward Loper 『入門 自然言語処理』    「見えない辞書
  6. エットハミ・ムライ・アメド 『モロッコ食卓』    「信楽焼タジン鍋
  7. ピーター・ペジック 『青の物理学』    「青の見取り図
  8. クリストファーチャブリス、ダニエルシモンズ錯覚科学』    「見えないゴリラ
  9. 大沢文夫 『大沢流 手づくり統計力学』    「百円玉実験不思議
  10. トルケル・フランセーン 『ゲーデル定理――利用と誤用の不完全ガイド』    「ゲーデルさんごめんなさい」
  11. Mark Kac 『Kac 統計的独立性』    「数学者をつくる本」
  12. ロザリー・L・コリー 『パラドクシア・エピデミカ』    「矛盾と逆理の入門書

書籍化まで3光年 (2013年)

  1. レベッカスクルート 『不死細胞ヒーラ』    「ヘンリエッタ細胞
  2. ジョン・パウエル 『響きの科楽』    「宇宙人にあげたい本」
  3. 山田風太郎旅人 国定龍次』    「山田風太郎輪郭
  4. レニー・ソールズベリー、アリー・スジョ 『偽りの来歴』    「世界改竄
  5. Bruce A. Tate 『7つの言語つの世界』    「たくさんの言語
  6. 寺田尚樹 『紙でつくる1/100の世界』    「これは本です」
  7. アンソニー・ドーアメモリー・ウォール』    「非SF作家SF
  8. オリヴァー・サックス 『心の視力』    「サックスおじさんの症状」
  9. ダニエル・アラルコン 『ロスト・シティレディオ』    「読んでも未知の本」
  10. P・Gウッドハウスジーヴスとねこさらい』    「"ゆるさ"のシリーズ
  11. ヴィクトリアブレイスウェイト 『魚は痛みを感じるか』    「魚の痛みの判定基準
  12. イヴィッド・イーグルマン意識は傍観者である』    「傍観者法学

書籍化まで2光年 (2014年)

  1. ブライアンクリスチャン機械より人間らしくなれるか?』    「純正人間の奮闘記」
  2. Clifford A. Pickover 『The Math Book』    「数学的あれこれ250」
  3. トレヴァー・ノートン 『世にも奇妙な人体実験歴史』    「楽しい自己人体実験
  4. フリオリャマサーレス無声映画のシーン』    「幸せ本棚
  5. ジョセフ・オルーク折り紙のすうり』    「折り紙数学
  6. ニール マクレガー 『100のモノが語る世界歴史』    「大英博物館のモノ」
  7. 根上生也四次元が見えるようになる本』    「四次元練習
  8. トーマス・トウェイツ『ゼロからトースター作ってみた』    「トースターを作る男」
  9. ロベルトボラーニョ『2666』    「ボラーニョの奔流」
  10. ガイ・ドイッチャー『言語が違えば、世界も違って見えるわけ』    「言語世界の見え方」
  11. D・マンフォード、C・シリーズ、D・ライトインドラの真珠』    「空海フラクタル
  12. V・S・ラマチャンドラン『脳のなかの天使』    「九つの美の法則

書籍化まで1光年 (2015年)

  1. 川添愛『白と黒のとびら』    「数学小説の融合」
  2. リチャード・パワーズ幸福遺伝子』    「純文とSF
  3. ロン・カリージュニア神は死んだ』    「真正突破短編集」
  4. ラウディアハモンド『脳の中の時間旅行』    「素朴に語る時間の話」
  5. Franco Moretti『Distant Reading』    「遠くから見る世界文学
  6. Lev Manovich『Software Takes Command』    「新しい思考の道具」
  7. デイヴィッド・マークソン『これは小説ではない』    「小説ではない小説
  8. シャロンバーチュ マグレイン『異端統計学 ベイズ』    「紛糾する統計学
  9. 内村直之『古都がはぐくむ現代数学 京大理解析研につどう人びと』    「数学という営み」
  10. Stanisław Lem『Summa Technologiae』    「レムの『技術学大全』」
  11. M・G・ヴァッサンジ『ヴィクラム・ラルの狭間世界』    「言葉より速く」
  12. 語り手 姉崎等、聞き書き 片山龍峯『クマにあったらどうするか』    「クマにあったら」

書籍化まで○光年 (2016年)

  1. ピーター・H・ディアマンディス、スティーヴン・コトラー『楽観主義者未来予測』    「未来は本当に暗いのか」
  2. ジェシーケラーマン駄作』    「いない、いない、の本」
  3. キャサリン・ゴヴィエ 『北斎と応為』    「歴史小説の書き方」
  4. 横山悠太『吾輩ハ猫ニナル』    「色んな言葉が混ざる小説
  5. 佐久間保明監修、本庄千代編『しかけ絵本世界』    「四角な本の大革新
  6. エミリー・オスター『お医者さんは教えてくれない 妊娠出産常識ウソホント』    「経済学者出産育児論」
  7. クレイグ・モド『ぼくらの時代』    「オモチャ電子書籍
  8. Noam Nisan、Shimon Schocken『コンピュータシステム理論実装』    「コンピュータをつくる」
  9. マーティンガードナーガードナー数学パズルゲーム』    「人生を変える数学パズル
  10. ピーターメンデルサンド『本を読むときに何が起きているのか』    「「読む」を考えさせる本」
  11. 遠藤侑介『あなたの知らない超絶技巧プログラミング』    「プログラミングロマン
  12. ベン・H・ウィンタース世界の終わりの七日間』    「世界の終わりへ続く日々」

書籍化まで△光年 (2017年)

  1. 奥修『珪藻美術館』    「ぞわぞわ感の境界
  2. マークチャンバーランド『ひとけたの数に魅せられて』    「ひとけたの数を語る本」
  3. ピーター・ウォード、ジョゼフ・カーシュヴィンク『生物はなぜ誕生たか』    「地球が生まれから歴史
  4. ライナー・クニツィアダイスゲーム百科』    「機械が作るゲーム
  5. ウンベルト・エーコプラハ墓地』    「史上最大の偽書の成立秘話
  6. ユーディット・シャランスキー『奇妙な孤島の物語』    「紙に書かれた五〇の島の物語
  7. 高野秀行『謎のアジア納豆』    「納豆とはにかみ」
  8. ロビンダンバー人類進化の謎を解き明かす』    「友達は二百人できません」
  9. アンソニー・ドーア『すべての見えない光』    「ドーア言語兵器
  10. ティーヴン・ウィット『誰が音楽をタダにした?』    「変化する音楽生態系
  11. 鈴木真治『巨大数』    「書くことのできない数」
  12. コマヤスカン新幹線のたび 金沢から新函館北斗札幌へ』    「視点がひっくり返る絵本

書籍化まで□光年 (2018年)

  1. まつもとゆきひろまつもとゆきひろ 言語のしくみ』    「言語のつくり方」
  2. 原武史政治思想史』    「物から読み解く政治思想
  3. マリオ・レブレーロ『場所』    「どこまでも続く部屋」
  4. 横山茂雄『神の聖なる天使たち』    「ディーとケリーの奇妙な運命
  5. ルシオ・デ・ソウザ、 岡美穂子『大航海時代日本人奴隷』    「記録に残されなかった者たち」
  6. 倉谷滋『分節幻想 動物のボディプラン起源をめぐる科学思想史』    「「発生」をめぐる学問歴史
  7. イチカワヨウスケ『野菜だし』    「レシピと伝達」
  8. 古賀弘幸『文字と書の消息』    「文字歴史の広がり」
  9. 赤野工作『ザ・ビデオゲームウィズ・ノーネーム』    「2115年のゲームレビュー
  10. 本山尚義『全196ヵ国おうちで作れる世界レシピ』    「世界196ヵ国の家庭料理
  11. フレット・スメイヤーズ『カウンターパンチ 16世紀活字製作現代書体デザイン』    「美しい活字への道」
  12. ジェニファー・ダウドナ、サミュエルスターバーグ『CRISPR(クリスパー) 究極の遺伝子編集技術発見』    「遺伝子編集の新技術

2013-08-16

このアイデアどう思う

日本語おかしいかも。

TwitterとかFacebookとか、あるいは2chや、はてブとか使って、ある記事とか情報に対してこう思ってます的な意見が気軽に出せるようになってる中で、そういった意見勝手に集めてきて、その記事に対してみんなこんな風に思ってるんだよねーって(その意見自然言語処理で肯定的か否定的か判断するみたいな)のが出てくればいいなと思った。

そういうのマーケティング的な何かですでにやられてそうだなぁと思ったけど、なんかこういうサービスとか知らない?

こんなニートが考えるぐらいだし、ズルズル出てきそうだよな…

2013-06-18

気づいたら大学三年生になってしまった。

情報系としての今までの経験です、と言ってアピールできるような成果物も経歴(バイトとか)も無い。

プログラミングできるようになれば面白いんだろうなー面白いwebサービス自分で作れるようになりたいなーと思いつつも

チュートリアルをこなすだけで匙を投げてしまう。

自然言語処理とか機械学習とか面白そうだなーと手を出そうとしたが、いかんせん数学が難しい。これをライフワークとして続けられる自信はない。

ただただアニメを見て、漫画を読んで、ネット上の記事(はてなアニメ批評界隈とか)を読んでいたら二年間が過ぎていた。

インターンも申し込んでない。というか面接に行ったとして自分をどうやってアピールすればいいのかわからない。

これから俺はどこでどうやって生きればいいんだ。

だれかアドバイスをください…。

2013-05-06

gunosyはてな蜜月関係

http://gunosy.tumblr.com/post/49731783015/gunosy

公式に「所感」が出されたので、記念にこれ貼っておくよ

gunosyはてブのパクり」ってネタサービス開始当初からあって、実は増田にもこんなのがあがってたんだよね

今は削除されてるけど、なんかのためにとevernoteクリップしておいたのを思い出したのでここに転載しておくよ

↓↓↓

東大生詐欺サービス名前を売るまで

1 :増田ゲノムクローンさん:2012/01/03(火) 00:22:01.00 ID:82R.hK77O.

●登場人物

ふっきー(東大生

プログラミング始めて一年くらいの学生起業家志望

ほか二名

●あらすじ

はてぶのホッテントリをテキトーに選んで毎日10メールで流すサービスを始めた

記事は全部、はてぶからパクリ。例外1つもなし。

自然言語処理ユーザーの好みを学習、ともっともらしいことを言ってみる

UIはSummifyからパクった

すると・・・はてぶを知らない情弱に大ウケ!

毎日配信される記事が全て前日のホッテントリなのに・・・

情弱「この記事どこから探してくるの?すごい!」

でもバレかかる・・・

最初許可していたはてなアカウントでのログインを禁止しボタンもこっそり削除

でも名残がテキスト説明に残ってる

だんまりを決め込んだまま賞に出展、騙された会社からいくつか受賞

ほとぼりが覚めたころ復活・・・

ふっきー「はてなゴミだな、俺たち買収すればいいのに!」

そのサービスの名は…Gunosy実在するお

http://gunosy.com/

結論・・・情弱ははてぶを使え

次回予告・・・パーソナルマガジンなのに、みんなに同じ記事が送られている!?

2012-05-06

http://anond.hatelabo.jp/20120322025117

外資系蹴って未来検索ブラジル行けよ

全文検索エンジンgroongaの開発、またはgroongaを用いたアプリケーションの開発を行っていただきます

以下の条件を満たしている必要があります

以下の技術分野に関する知識・経験があるとなお良いです。

http://razil.jp/recruit.html

英語論文が読めて、アルゴリズムについて知識がある人材求めているぞ

2012-02-14

http://anond.hatelabo.jp/20120214165137

横だけど、自然言語処理技術を活かしてこういう勝利宣言系の書き込みを自動で非表示にできる機能欲しいな

2009-04-03

2ch工作員存在を公にできるかもしれない件

http://shadow-city.blogzine.jp/net/2009/04/300_1300.html

これが本当の話かどうかは分からないが、本当に「ネトウヨ」等の特定単語の出現頻度がアクセス制限の前と後で大きく変化しているかは、集計してグラフにしてみれば簡単に分かる筈。

そして、それを誰もが客観的に確認できる形にできたなら、何かが起こるような気がする。

誰かやってくれ。俺はやらん。

やる場合は、集計元データ捏造されたデータを含んでしまわないように注意すべきかもしれん。

(尚、信憑性は全く無いが、ひろゆきが某社サイドであるという噂も出ている。)

それから、「客観的に、集計元データが改竄されていない事」を保証する何らかの手段が必要になるかもしれん。

ちなみに俺は、 http://anond.hatelabo.jp/20090402034532 を書いた元増田だが、もっと煽るような書き方にしないと駄目だと言われたので、こうして書き直してみた。

最後に一応言っておくと、「集計したら別に出現頻度に変化はなかったぜ」という事になる可能性もあるんだぜ!

これは単に、特定単語の出現頻度調査の提案をしてるだけなんだぜ!

簡単な自然言語処理の問題なんだぜ!

2009-03-30

自然言語処理Python がいちばん」について

http://d.hatena.ne.jp/mamoruk/20090327/p1

「いちばん」かどうかはわかりませんが、うちの会社製品ではpythonを主力に使った自然言語処理を含む製品を販売しているので、実際の感想を。

うちでは、pythonを元データの整備のための運用バッチ処理から、客が最終的に手にする情報の生成、実際に客が使うWEBインターフェースまで、pythonを主力にしています。

別のチームが作った別の製品ではS2Struts(JAVAね。)でWEBを作っている部分もありますが。

自然言語処理ぶっちゃけどの言語でも可能だとは思います。

mecabが使えて、Unicodeが使えて、正規表現が使えれば、まあ、どの言語を使ってもそんなに大差はないのではないでしょうか。

あとはsennaのような日本語用の全文検索エンジンなども使いますが、そこらへんに近い部分は基本的にC++で書きます。

pythonとは言っても、速度を重視する部分はやはり迷わずC++です。

C++で書いたものはswigを使うか、又はC言語で手書きのbindingを使ってpython接続します。

もこないだswigでつないで製品リリースしたら、WEBからの並列アクセスswigがうまく対応できず、リリースした日に急いで手書きbindingを書いた経験があります。swigの使い方はきちんと理解していないので非常に難しい。

nltkとか、wordnetの話はたしかに使えそうかもと思ったことはありますが、nltkはうちでは使っていません。

うちの会社では自然言語処理研究段階から自社で行っているので、nltkにあるようなできあいのルーチンを実戦投入する事はなく、基本的に地味に自分達でpythonで書いています。

自然言語処理と言っても、核心の処理はやはり泥臭い個別事例への対処が多いです。不要語処理とか。

自然言語処理アルゴリズムは8割程度の精度を出すのは簡単で、すぐに思いつきで書けるものですが、残り2割の精度をいかに埋めて行くかが、頭のいい人とそうでない人の差が現れる部分だと思います。

どうしてもいいアルゴリズムを思いつかない場合は、泥臭い個別事例処理がうねうねと並んだプログラムになります。学術的なものではなく商売になればいいので、うちはとりあえずそれで十分。(これは自然言語処理に使う機械学習アルゴリズムたちも同様。というか自然言語処理機械学習て、区分けがあいまいな部分が多いですよね。)

そういう感じなので、pythonの可読性の高さは非常に有効。

また、変数名や関数名などをexplicitに書く文化も業務で使うのに適していると思います。(他の言語でもexplicitに書けばいいだけですが、それを言語開発者自身が推奨するほど強調はしていないですよね。)

英文の処理で、wordnet辞書データの一部を研究に使った記憶はある。

しかし、あそこまで精緻辞書データを使う程高度な処理は今の所必要ない。

うちで自作した不要英単語辞書と、特別扱いする英単語辞書で間に合わせていたと思います。(その辺記憶あいまい。)

WEBユーザーインターフェースdjangoで。

djangoは非常に明快で、快適。

画面の機能を追加するのに、例えばS2Strutsアクション定義の煩雑さに比較すると、天と地との差ほどにdjangoは簡単。

あと、pythonを使える開発者日本には少ないとの事ですが、うちでもそれは同様です。

しかし、自分の隣の席の同僚はperlに非常に熟達していて、彼はすぐにpythonの達人に変わりました。

優秀な方にとっては言語なんて何をつかってもあまり変わらないみたい。

でも、彼も自分自然言語処理JAVAC++のようなまわりくどい言語は使ってられないという点では同意しています。

2009-01-08

otsuneさんブクマbotを作った


みんな大好きb:id:otsuneさんのブクマbotを作った

http://b.hatena.ne.jp/otsnue/

概要

otsuneさんっぽくコメントを付けるbotを目指して年末年始返上で制作

相手をdisり「頭が気の毒です」で締めるotsuneさんの個性をうまく表現できたと思う

bot技術解説

botの仕組みを説明しておく

  • ブラウザを開いてdisりたい相手を探す
  • dis
  • 文末は「頭が気の毒です」で締める
  • 保存

Plagger+自然言語処理を噛ませたbotも作ったのだけど鯖でCold Fusionしてしまったので断念

手動でコメント書くのが一番手っ取り早かった

使い方

ニヤニヤしてください

もしこのbotが迷惑でしたら対応(削除)しますのでブクマ等で言ってください

2009-01-02

http://anond.hatelabo.jp/20090102145542

日本geek って、perl/php/javascript をボクが一番うまく使えるんだって人のことなんだね。

コンピュータサイエンス的な理論もしったこっちゃない。

自然言語処理?むりむり。検索エンジン作れ?むりむり。数値解析?チラネ。

信号処理?それおいしいの?CG?それフレームワーク

ログイン ユーザー登録
ようこそ ゲスト さん