はてなブックマーク 10周年新機能「トピック」 - はてなブックマーク
http://b.hatena.ne.jp/10th/topic
自然言語処理技術を用いたはてなブックマークの新機能「トピック」をベータリリースしました - はてなブックマーク開発ブログ http://bookmark.hatenastaff.com/entry/2015/02/05/190331
はてなブックマークのトピックページの裏側 - Hatena Developer Blog
http://developer.hatenastaff.com/entry/2015/02/12/165918

ベータリリースらしいが、2月にリリースして半年以上経ってこの状態？

リリースしただけで満足して放置してない？

実際に自動生成された見出しを人の手でチェックし、十分でないなら人力で見出しを修正し

また、自動生成の見出しが人力修正相当になるようプログラムを改良したりしてますか？

トピック機能のコンセプト自体は素晴らしい。

トピックの見出しを追うだけでニュースの経過がざっとわかるようになれば嬉しい。

しかし今のままでは、使いづらい→利用者増えない→サービスの需要ないんだ→開発放置、の悪循環になりそうで。

まずは個別トピックの見出しをトピックリスト上の見出しと統一してもらいたい。

Permalink | 記事への反応(0) | 22:49

2015-08-12

■おれ川内って言うんだけど

はてぶの新着トピックの川内原発のトピックのタイトルが「川内」になっていてビクっとなったわ。

なんどか指摘されてるけど、自然言語処理技術で作られたっていう新着トピック機能ってあんまり頭良くないよね。

Permalink | 記事への反応(0) | 10:17

2015-07-17

■http://anond.hatelabo.jp/20150716201716

自称Sediment

アジャイル開発って呼ぶのか何なのか知らんけど、はてなのサービスはスモールスタートだからなぁ。

はてなブログも初期はひどかったぞ、フォトライフと連携する機能とかもなかったし。

http://oidon.hatenablog.com/entry/2012/01/02/202339

トピックとはてブの検索ってさ、自然言語処理と検索って共通項があって、はてブ検索の改善とかはしてるみたいだから、その内、生きてくんじゃねーの？　知らんが。

http://b.hatena.ne.jp/entry/https://speakerdeck.com/takuyaa/hatenabutukumakuquan-wen-jian-suo-falsejing-du-gai-shan

当然、最初からひどかった。

http://b.hatena.ne.jp/entry/developer.hatenastaff.com/entry/2015/02/12/165918

Permalink | 記事への反応(0) | 18:15

2015-07-16

■http://anond.hatelabo.jp/20150716201716

タイトルが意味不明な数字だったり、変なところで切れてたり、あれは人手で修正したらいけないって決まりでもあるのかね。

自然言語処理の技術で自動生成ってのが売りかもしれんけど、どの程度の技術か中の人はわかってただろうし、人間が修正する仕組みが組み込まれてないのがよくわからん。

Permalink | 記事への反応(0) | 20:29

2015-06-09

■佐野　　千遥　さの　ちはる

セント・クレメンツ大学教授

ロシア科学アカデミー・スミルノフ物理学派論文審査員

東大基礎科学科卒。過去250～340年間世界の大数学者達が解こうとして解けなかった、世界史的数学難問4つを解き、現在ロシア科学アカデミー数学の部で審査中。マスターした11ヶ国語を駆使したプロの通訳・翻訳家。矛盾だらけの現代物理学を初め、全科学（自然、社会、人文科学）の主だった物を体系的に批判し各々に別体系を提起。各種受験生(医学部、難関大学入試、数学オリンピック、社会人大学院入試、IT関連資格)支援。

■経　歴

2002年（至現在）セント・クレメンツ国際大学　物理学教授

2001年英国系セント・クレメンツ大学で数理物理学の博士号取得

2002年ロシア科学アカデミー・スミルンフ物理学派論文審査員となる

1999年英国系ウィットフィールド大学でコンピュータ科学人工知能の博士号取得

1991年（～1993年）University of California、 Irvine 人工知能研究所で確率論批判・学習システムの研究

1988年（～1991年）世界の認知科学の権威ロージャー・シャンクのCognitive Systemsのデータベース研究所IBSで自然言語処理研究

1986年（～1988年）欧州先端科学研究プロジェクトESPRITにESPRITディレクターとして仏Telemecanique研究所より参加（生産ラインへの人工知能導入の研究）

1985年西独ジーメンスのミュンヘン研究所で生産ラインへの人工知能導入の研究

1982年（～1985年）[仏国]世界一速い列車TGVのメーカーAlsthom社の知能ロボット研究所

1981年（～1982年）[仏国]グルノーブル大学院、ソルボンヌ大学院で通訳の国家免状取得

1980年（～1981年）[スペイン]マドリード大学院で言語学履修　西国政府給費留学生

1971年東京大学基礎科学科卒業（数学・物理学専攻）

■専門分野

数理物理学 Ph.D.、コンピュータ科学人工知能 Ph.D.、マスターした11カ国語を駆使したプロの通訳・翻訳家

■講演テーマ

「ビジネスマン、文系卒社員に理工系技術と技術的発明を評価できる眼を」

近年世界の大学でビジネス志向の学生向けに、理系の技術的な事がある程度分かるためのカリキュラム改変が始まっている。しかし申し訳程度であり、また理系の拠って立つ数学物理学の科学理論自体に欠陥が有る事が最近明らかとなっているため、正しい数学と物理学の粋を伝授し、文系でも本物の理系技術評価が出来るように支援する。

「英語を完璧に&現地語（非英語）を或る程度使えるマネジャー急遽創出と、社員の中から各国語通訳をネーティブに肉薄する敏捷性と正確さで急遽育成を支援」

海外のプロジェクトや企業と折衝するとき、英語がネーティブ並みであったり、現地語を自社のディレクター自身がある程度こなせるか、英語、現地語につきネーティブ並みの社員が通訳出来ると先方との話が大きく好転する場合が少なくない。それを本当に実現する教育訓練を私は提供できる。平明に説明し、実体験をしてみたい方がいらっしゃるなら講演会場で手解きをしてみたい。

「発見された言語学理論と外国語訓練方法論を基に、文科省と英会話学校の英語教育訓練方法論の根本的誤りの中枢を詳説」

統語法意味論、文脈意味論、実世界意味論の3レベルで進展するネーティブの母国語習得過程の中、言語能力の真の中枢は解説も無しに親の喋るのを聴いているだけで分かるようになる統語法的意味把握能力で、これは文法用語を全く使っていなくても徹底した文法訓練となっている。ネーティブが敏捷性、精度の点で万全であり、先ず文法的間違いをすることはない理由はここにある。全文法分野について書き換え問題の「即聞即答訓練」を一気に中学生以上の年齢の人に施し、全文法のビビッドな一覧性を習得させるとネーティブに肉薄する敏捷性と精度で外国語を使いこなせるようになることが発見された。

「＜証明された欠陥数学＞　確率統計と微積分学のビジネス、金融工学、保険業界での使用に対する警告と、それに取って代る新数学体系」

我々物理世界は離散値の世界であることが原因で、物理世界に住む人間の頭脳が考え出した数学の中で連続実数値に基づく確率統計学と微積分学だけが欠陥数学として発現していることが証明された。決して建設的な予測をすることができず、崩壊していく事象に後ろ向きにしか適用できず、せいぜいリスク管理にしか使い道の無い確率統計学をビジネス学の分野では金科玉条の如く信用し積極的やり方で利用しているが、ここに「理論」と現実との間に大きな食い違いが生じている点に警告を発したい。そのためそれに取って代る新数学体系を提起する。全てを分かり易く解説します。

「新エネルギー・エコ向けの発想を大転回した技術的な重要な発明を提起」

20世紀初頭に数理物理学者Henri Poincareは二体問題までは解けるが三体問題(三つの星が互いに重力で引き合いながら運動している時の時々刻々の位置を計算で求める事)以上は微積分学を使って解く事が出来ない事を証明した。これは無限小差分を使う微積分は計算式中で交差する項をほぼ同等とみなして相殺してしまうため、作用反作用の法則(F1*v1=-F2*v2)の取り違い(F1=-F2が作用反作用の法則であると圧倒的多数が信じている)と相俟って、交互に対称な運動しか記述できないため、対称性の有る二体までは記述できても対称性のない三体以上は記述できないためである。この欠陥数学微積分を基に二体までは「エネルギー保存則」を証明したものの三体以上の「エネルギー保存則」は本来的に証明不可能であることが明らかと成った。現に永久磁石がエネルギー保存則を大きく超えることが実証され始めている。それらの実験につき具体的に物理学の素人の方々にも分かりやすく報告したい。

「世界史的体系的誤りに迷い込んだ現代物理学とその使用者への警告とそれに取って代る新物理学」

現代物理学の二本柱、量子力学と相対論の中、量子力学は水素原子の原子核と軌道電子の関係説明を辛うじて試みただけで、水素原子より複雑な原子や分子の構造の説明に実は悉く失敗し、繰り込み・摂動理論はその失敗を隠すため後に持込まれた。軌道電子は光速に比べ無視できぬ速度でクーロン力で原子核に引かれて急カーブしながら等速加速度円運動、大量のエネルギーを消費するが、半永久的に軌道を回る。しかしシュレーディンガーの波動方程式(その波動関数とその共役関数の積は確率)はエネルギー消費に一切言及せず、エネルギー・レベルが一定に保たれるという明らかに矛盾した論を展開する。また確率を持ち込んだからには、エントロピー単調増大法則がここに適用され、水素原子は瞬時に粉々に飛び散らなければならぬ現実に反する二つ目の重大矛盾に遭遇するが、これもシュレーディンガーは見てみぬ振りをする。つまり水素原子の構造の説明にすら量子力学は完全に失敗した。量子力学とは動力学でなく各エネルギー・レベルについての静力学でしかなく、「量子力学」の「力学」なる名前とは裏腹に力を論じられない。論じればエネルギー消費が起こりエネルギーレベル一定論が崩れる。

「現代のフォン・ノイマン型コンピュータ・アーキテクチャーの誤りと、創るべき新コンピュータ・アーキテクチャー」

現代のフォン・ノイマン型コンピュータの計算機モデルが取りも直さずチューリングマシンそのものである。チューリングマシンは決ったパラメータ数の状態間の遷移を静的モデル化したものであるのに対し、歴史的にその直前に発表されたアロンソ・チャーチの計算モデルのラムダ・キャルキュラス(人工知能プラグラミング言語 LISPの言語理論でもある)は関数の中に関数が次々に入れ子のように代入されて行き擬パラメータが増えていくダイナミックな仕組みを持つ。この後者は人間が作ったコンピュータを遥かに凌ぎ、宇宙の始原から発生した環境データから関数をf1(t),f2(t),.,fn(t)と次々に学習し入れ子のように代入進化し、次の一ステップの計算には宇宙の始原からの全ての関数f1,f2,...,fnを思い起こし、そのそれぞれの差分を取って掛け合わせる事をしているコンピュータとも言える物理世界とその時間の学習・進化を時系列順に模写するのに持って来いの仕組である。関数と言っても多項式で充分である事を世界の7大数学難問の一つPolynomial=Non-Polynomialの私の証明も交えて平明に解説する。これは日本の国と世界の先進諸国のコンピュータ科学の今後の研究方向を左右する発言となる。

■実　績

【講演実績】

大学・大学院で2002年以来常時講義

Trinity International University

「コンピュータ科学」　学士号コースの学生に卒業まで全コースを講義

St.-Clements University

「金融工学に必要な数学・物理学」の博士号コースの学生3年間に渡って講義、研究テーマと研究内容、博士論文のアドバイス

St.-Clements University

研究テーマ「コルモゴロフ複雑系の二進ビット・ストリングの下限＝Lower bound for binary bitstring in Kolmogorov complexity」の博士号コースの学生Dr. Bradley Ticeに英語でアドバイス

St.-Clements University

外国語学部のポルトガル語・伊語の通訳・翻訳の学士号コースの学生に教養学部のレベルから全社会科学（経済学、法律学、社会学、経営学）、人文科学（哲学、言語学、心理学、歴史学）、自然科学（数学、物理学、化学、生物学、医学、計算機数学）、エンジニヤリング（Information Technology、ソフトウエア工学、電気工学、電子工学）の各々の学科の全講義を行う。

Госдарственный Университет Санктпетербургской Гражданской Авиации (サンクトペテルブルグ国立航空大学)

物理学学会の論文発表会で幾多の論文の露語によるプリゼンテーション。

【メディア出演】

ロシアで3度物理学権威スミルノフ氏とTV出演、ロシア

【執筆】

学会で物理学論文多数発表

ti-probabilistic Learning by Manifold Algebraic Geometry, SPIE Proceeding, 1992 Orlando 等　人工知能学会論文

日本国内では著書「人工生命と人工知能」「超勉強法超批判」

Permalink | 記事への反応(0) | 18:31

2015-06-04

■ http://anond.hatelabo.jp/20150604084011

なんか、こう頭のレベルが違うと、
論点がズレて、変な決めつけで、違うんですが、
と言い返せば、あんたここそういうところじゃないよ？とか、
わけわからんことを言われる。

”頭のレベルが違って論点がずれている人”の発言は、どこからどこまで？

しかし、リアル社会でもあるよな、これ。
高学歴は足切りある会社いった方がまだ理性的な
人がいてやりやすいと思うよ。
馬鹿に媚び売らなきゃ、馬鹿がお前は社会的に認められない！
とか、いうてきますよ。

「足切りある会社」とは？誰でも入社できる会社なんぞ、存在するのか？

「高学歴は足切りある会社いった方がまだ理性的な人がいてやりやすいと思うよ。」理性的？論点うんぬんと前もって言っていたのだから、こういう文章には論理的という単語を使う方が意味が通じる。

「馬鹿に媚び売らなきゃ、馬鹿がお前は社会的に認められない！」主語は馬鹿？お前？

「いうてきますよ」とは、方言？

なんで馬鹿程、理性もないのに自分が一番正しいとか
やれるのかなぁ？

「自分が一番正しいとかやれる」

文章的には、やはり変。読み返しても気付かないのは、まともな日本語教育を受けていない人間。外国語圏内の人間ならば、しょうがない。

そんなの自分のも含めて思想なんかいくらでもあるから、
色んな現象に対処できるのに。

「思想」に対して「対処」という動詞は、通常ならば使わない。

以下は、もう面倒くさいから一言で。自嘲？

一番ワロタのは、
お前の身近ことだけで世界知った気になんな
→幅広いケースに実際に出会い、且つ研究もしてますが
→何本読んで知った気になってんの？
そして、こちらの高学歴カードには、東大がいる増田で自慢すんな恥ずかしい
と、返され、しかし見ていた東大卒がいや、それすごいんだけど、
と、お前買いかぶり過ぎとフォローしてくれた。
高学歴とは、偏差値ないやつほど買いかぶりをし、
高いやつほど大したことない、そいつ次第という。
なんなんだろうな。本質を見抜くのはこちらのが高いけど、
こんな自称、普通に常識的に生きてるDQNよりマシな人間とか、
宣言して、自分の範囲外のことを全て品なく否定する奴って、
本当に普通の人間なのか？
なんかクリーチャーというか、そんな奴が普通の社会なんか
こちらから願い下げだし頭おかしいと思う。
まだ、はい、論破ー、とかいう高校生なら、
倒せば負けを認めるが、
変に社会のずるさとか覚えた大人だと、
浅い考えで、思考も深くする訓練もしてないのに、
社会全体を知った気でいて、本当話す価値がない。
けど、ムカつくので君が泣くまで殴るのをやめないに
なってしまうのである。

どうも、自分の事を頭が良いと思って書いている文章のように読み取れたのだが、

たとえネット文章であっても、利口な人間が書くならば、ここまで文章が崩れて読み難い文章になることはない。これはどういう思想体系の人間においても、共通して言えること。

よって、控えめに”日本語が苦手だからと、外国人が翻訳ソフトを使って作り出した日本語文章ならばしょうがない”としてレスを付けた。自分の興味は自然言語処理だったので、単純にその点を確認したかった。且つ、多少「本当に自分が頭良い人間と思っているの？だとしたら凄い度胸だ」と多少の揶揄を込めて書いたトラバだ。

以上、これでお気に召しただろうか？

Permalink | 記事への反応(1) | 10:05

2015-04-14

■ハテブはもうちょっと カテゴリの判定をうまくやってほしい

マイノリティーがどうとかネトウヨがどうとか、そういう話題は見たくなくなってきたからテクノロジーとかアニメとかのカテゴリだけチェックするようになったけど、それでも見たくない話題がくるんだよな。

どろどろしたブクマは俺が手作業で、政治とか暮らしのカテゴリーに送り返してるけど、見るだけで気がめいるから自動判定をしっかりしてほしいわ。

ちょっとまえに自然言語処理の技術でトピックの機能を作りましたって宣伝してたけど、その技術力をカテゴリ判定につかってほしい。

ツイッターで揉め事があったらとりあえずテクノロジーみたいな安直な判定はやめて。

Permalink | 記事への反応(0) | 14:55

2015-02-26

■自然言語処理 技術を用いたはてなブックマークの新機能「トピック」をベータ リリースしました

って．

手法を売りにするって如何なものか．

Permalink | 記事への反応(1) | 17:37

2014-12-22

■

ウェブ系，人工知能系，ソーシャルメディア系の国際会議〆切メモ．

信号処理，自然言語処理，画像処理，機械学習，データベース，等々はよく知らない．

ESWC 2015（1/17〆切，3/9通知，5/31-6/4開催＠スロベニア）
- http://2015.eswc-conferences.org/important-dates

WWW 2015 WebScienceTrack（1/19〆切，2/27通知，5/18-22開催＠イタリア・フローレンス）
- http://www.www2015.it/call-for-web-science-track/

SIGIR 2015（1/28〆切，4/20通知，8/9-13開催＠チリ・サンチアゴ）
- http://www.sigir2015.org/callforpapers/fullpapers

IJCAI 2015（2/8〆切，4/16通知，7/25-8/1開催＠アルゼンチン・ブエノスアイレス）
- http://ijcai-15.org/index.php/call-for-papers/ijcai-call-for-papers

KDD 2015（2/20〆切，8/10-13開催＠オーストラリア・シドニー）
- http://www.kdd.org/kdd2015/calls.html#calls-cfprt-paper-submission-and-deadlines

ICWSM 2015（2/24〆切，8/24-25開催＠マレーシア・クアラルンプール）
- https://www.waset.org/conference/2015/08/kuala-lumpur/ICWSM

Hypertext 2015（去年は3/21〆切，去年は5/23通知，9/2-4開催＠キプロス）
- http://ht.acm.org/ht2015/

OpenSym2015（3/29〆切，8/19-21開催＠米国・サンフランシスコ）
- http://www.opensym.org/category/opensym-2015/

Multimedia 2015（3/31〆切，7/6通知，10/26-30開催＠豪州・ブリスベン）
- http://www.acmmm.org/2015/

WI-IAT 2015（4/15〆切，6/1通知，12/6-9開催＠シンガポール）
- http://wi-iat15.ntulily.org/

ISWC 2015（4/23〆切，6/15通知，10/11-15開催＠米国・ペンシルバニア）
- http://iswc2015.semanticweb.org/

RecSys2015（5/上旬〆切，9/16-20開催＠オーストリア
- http://recsys.acm.org/recsys15/important-dates/

ISMIR2015（5/上旬〆切，10/27-31開催＠スペイン・マラガ）
- http://www.ismir.net/

CIKM 2015（5/17〆切，10/19-23開催＠オーストラリア・メルボルン）
- http://www.cikmconference.org/

Permalink | 記事への反応(0) | 17:52

2014-04-26

■円城塔が本の雑誌の連載「書籍化までn光年」で取り上げた本のリスト

http://anond.hatelabo.jp/20140421200127

書籍化まで7光年 (2009年)

アンドルー・クルミー『ミスター・ミー』　　　「『ミスター・ミー』とドップラー効果の恋愛小説」
ポール・オースター『幻影の書』　　　「オースター百%の『幻影の書』と本のスカート」
ピエール・バイヤール『読んでいない本について堂々と語る方法』　　　「読んでいない本を語る方法と「特性のない本」」
ジョン・クロウリー『エンジン・サマー』　　　「言葉の"ずれ"と物騒な本」
浅暮三文『ぽんこつ喜劇』　　　「ひよことサクラと実験小説」
シュボーン・ロバーツ『多面体と宇宙の謎に迫った幾何学者』　　　「迷走と眩惑の理学系タイトルの謎」
David Flanagan 『プログラミング言語 Ruby』　　　「プログラミング言語と小説屋」
ジャック・ルーボー『麗しのオルタンス』　　　「超絶馬鹿技巧小説『麗しのオルタンス』に隠された秘密」
ジャック・ルーボー『麗しのオルタンス』　　　「数と音楽の秩序で作られた希代の小説」
ヒュー・ケナー『機械という名の詩神』　　　「文学とテクノロジーと作家の関係」
チャールズ・ストロス『アッチェレランド』　　　「全編ボケ倒しのすごい奴」
多和田葉子『ボルドーの義兄』　　　「『ボルドーの義兄』謎の276文字を追う」

書籍化まで6光年 (2010年)

パウル・クレー『新版クレーの日記』　　　「小説のような日記と日記のような小説」
中野美代子『ザナドゥーへの道』　　　「多幸感に満ちた文字の連なり」
ジャック・ルーボー『麗しのオルタンス』　　　「『麗しのオルタンス』ジャック・ルーボーに直撃質問!」
ミロラド・パヴィッチ『帝都最後の恋』　　　「タロットにしたがって読むパヴィッチの本」
ダン・ガードナー『リスクにあなたは騙される』　　　「現実は小説よりハッピーなのだ!」
スティーヴ・トルツ『ぼくを創るすべての要素のほんの一部』　　　「長い小説が書けない理由!?」
大野克嗣『非線形な世界』　　　「単純素朴なのになぜか伝わらない本」
ジル・プライス、バート・デービス『忘れられない脳』　　　「ジル・プライスの忘却のない人生」
クラーク・アシュトン・スミス『ゾティーク幻妖怪異譚』　　　「「そういう人」スミスが好き」
スタニスワフ・レム『泰平ヨンの航星日記』　　　「レムの欠番を埋めるのは」
エミーリ・ロサーレス『まぼろしの王都』　　　「見えないものが見える瞬間」
デイヴィッド・レヴィット『数式に憑かれたインドの数学者』　　　「稀代の数学者の架空伝記」

書籍化まで5光年 (2011年)

ブノワ・デュトゥールトゥル『幼女と煙草』　　　「不穏さに満ち満ちた『幼女と煙草』」
イスマイル・カダレ『死者の軍隊の将軍』　　　「不思議な国アルバニアの戦争小説」
高橋陽一郎『変化をとらえる』　　　「数学の教科書いろいろ」
サイモン・シン、エツァート・エルンスト『代替医療のトリック』　　　「代替医療に挑む議論の書」
辻原登『闇の奥』　　　「辻原登は変である」
柏野牧夫『音のイリュージョン』　　　「聴覚だって騙される」
マックス・ブルックス『WORLD WAR Z』　　　「語り伝える書」
ジェラルディン・ブルックス『マーチ家の父』　　　「網目だらけ」
グレゴリー・コクラン、ヘンリー・ハーペンディング『一万年の進化爆発』　　　「淡々と進化中」
デイヴィッド・グラン『ロスト・シティZ』　　　「見えない都市」
Federico Biancuzzi、Shane Warden 『言語設計者たちが考えること』　　　「言葉を作る人たち」
A・R・ルリヤ『偉大な記憶力の物語』　　　「無限の記憶を持つ男」

書籍化まで4光年 (2012年)

V・S・ラマチャンドラン、D・ロジャース=ラマチャンドラン『知覚は幻』　　　「美の起源?」
Charles Yu 『How to Live Safely in a Science Fictional Universe』(『ＳＦ的な宇宙で安全に暮らすっていうこと』)　　　「ウーのくすぐり芸」
マット・リドレー『繁栄』　　　「人類は滅亡しない?」
ウンベルト・エーコ『バウドリーノ』　　　「エーコが好きだ!」
Steven Bird、Ewan Klein、Edward Loper 『入門自然言語処理』　　　「見えない辞書」
エットハミ・ムライ・アメド『モロッコの食卓』　　　「信楽焼のタジン鍋」
ピーター・ペジック『青の物理学』　　　「青の見取り図」
クリストファー・チャブリス、ダニエル・シモンズ『錯覚の科学』　　　「見えないゴリラ」
大沢文夫『大沢流手づくり統計力学』　　　「百円玉実験の不思議」
トルケル・フランセーン『ゲーデルの定理――利用と誤用の不完全ガイド』　　　「ゲーデルさんごめんなさい」
Mark Kac 『Kac 統計的独立性』　　　「数学者をつくる本」
ロザリー・L・コリー『パラドクシア・エピデミカ』　　　「矛盾と逆理の入門書」

書籍化まで3光年 (2013年)

レベッカ・スクルート『不死細胞ヒーラ』　　　「ヘンリエッタの細胞」
ジョン・パウエル『響きの科楽』　　　「宇宙人にあげたい本」
山田風太郎『旅人国定龍次』　　　「山田風太郎の輪郭」
レニー・ソールズベリー、アリー・スジョ『偽りの来歴』　　　「世界の改竄」
Bruce A. Tate 『７つの言語７つの世界』　　　「たくさんの言語」
寺田尚樹『紙でつくる1/100の世界』　　　「これは本です」
アンソニー・ドーア『メモリー・ウォール』　　　「非SF作家のSF」
オリヴァー・サックス『心の視力』　　　「サックスおじさんの症状」
ダニエル・アラルコン『ロスト・シティ・レディオ』　　　「読んでも未知の本」
P・G・ウッドハウス『ジーヴスとねこさらい』　　　「"ゆるさ"のシリーズ」
ヴィクトリア・ブレイスウェイト『魚は痛みを感じるか』　　　「魚の痛みの判定基準」
デイヴィッド・イーグルマン『意識は傍観者である』　　　「傍観者の法学」

書籍化まで2光年 (2014年)

ブライアン・クリスチャン『機械より人間らしくなれるか?』　　　「純正の人間の奮闘記」
Clifford A. Pickover 『The Math Book』　　　「数学的あれこれ250」
トレヴァー・ノートン『世にも奇妙な人体実験の歴史』　　　「楽しい自己人体実験」
フリオ・リャマサーレス『無声映画のシーン』　　　「幸せの本棚」
ジョセフ・オルーク『折り紙のすうり』　　　「折り紙の数学」
ニールマクレガー『100のモノが語る世界の歴史』　　　「大英博物館のモノ」
根上生也『四次元が見えるようになる本』　　　「四次元の練習」
トーマス・トウェイツ『ゼロからトースターを作ってみた』　　　「トースターを作る男」
ロベルト・ボラーニョ『2666』　　　「ボラーニョの奔流」
ガイ・ドイッチャー『言語が違えば、世界も違って見えるわけ』　　　「言語と世界の見え方」
D・マンフォード、C・シリーズ、D・ライト『インドラの真珠』　　　「空海とフラクタル」
V・S・ラマチャンドラン『脳のなかの天使』　　　「九つの美の法則」

書籍化まで1光年 (2015年)

川添愛『白と黒のとびら』　　　「数学と小説の融合」
リチャード・パワーズ『幸福の遺伝子』　　　「純文とSF」
ロン・カリー・ジュニア『神は死んだ』　　　「真正面突破の短編集」
ラウディア・ハモンド『脳の中の時間旅行』　　　「素朴に語る時間の話」
Franco Moretti『Distant Reading』　　　「遠くから見る世界文学」
Lev Manovich『Software Takes Command』　　　「新しい思考の道具」
デイヴィッド・マークソン『これは小説ではない』　　　「小説ではない小説」
シャロン・バーチュマグレイン『異端の統計学ベイズ』　　　「紛糾する統計学」
内村直之『古都がはぐくむ現代数学京大数理解析研につどう人びと』　　　「数学という営み」
Stanisław Lem『Summa Technologiae』　　　「レムの『技術学大全』」
M・G・ヴァッサンジ『ヴィクラム・ラルの狭間の世界』　　　「言葉より速く」
語り手姉崎等、聞き書き片山龍峯『クマにあったらどうするか』　　　「クマにあったら」

書籍化まで○光年 (2016年)

ピーター・H・ディアマンディス、スティーヴン・コトラー『楽観主義者の未来予測』　　　「未来は本当に暗いのか」
ジェシー・ケラーマン『駄作』　　　「いない、いない、の本」
キャサリン・ゴヴィエ『北斎と応為』　　　「歴史小説の書き方」
横山悠太『吾輩ハ猫ニナル』　　　「色んな言葉が混ざる小説」
佐久間保明監修、本庄美千代編『しかけ絵本の世界』　　　「四角な本の大革新」
エミリー・オスター『お医者さんは教えてくれない妊娠・出産の常識ウソ・ホント』　　　「経済学者の出産・育児論」
クレイグ・モド『ぼくらの時代』　　　「オモチャの電子書籍」
Noam Nisan、Shimon Schocken『コンピュータシステムの理論の実装』　　　「コンピュータをつくる」
マーティン・ガードナー『ガードナーの数学パズル・ゲーム』　　　「人生を変える数学パズル」
ピーター・メンデルサンド『本を読むときに何が起きているのか』　　　「「読む」を考えさせる本」
遠藤侑介『あなたの知らない超絶技巧プログラミング』　　　「プログラミングとロマン」
ベン・H・ウィンタース『世界の終わりの七日間』　　　「世界の終わりへ続く日々」

書籍化まで△光年 (2017年)

奥修『珪藻美術館』　　　「ぞわぞわ感の境界」
マーク・チャンバーランド『ひとけたの数に魅せられて』　　　「ひとけたの数を語る本」
ピーター・ウォード、ジョゼフ・カーシュヴィンク『生物はなぜ誕生したか』　　　「地球が生まれてからの歴史」
ライナー・クニツィア『ダイスゲーム百科』　　　「機械が作るゲーム」
ウンベルト・エーコ『プラハの墓地』　　　「史上最大の偽書の成立秘話」
ユーディット・シャランスキー『奇妙な孤島の物語』　　　「紙に書かれた五〇の島の物語」
高野秀行『謎のアジア納豆』　　　「納豆とはにかみ」
ロビン・ダンバー『人類進化の謎を解き明かす』　　　「友達は二百人できません」
アンソニー・ドーア『すべての見えない光』　　　「ドーアの言語兵器」
スティーヴン・ウィット『誰が音楽をタダにした?』　　　「変化する音楽の生態系」
鈴木真治『巨大数』　　　「書くことのできない数」
コマヤスカン『新幹線のたび金沢から新函館北斗、札幌へ』　　　「視点がひっくり返る絵本」

書籍化まで□光年 (2018年)

まつもとゆきひろ『まつもとゆきひろ言語のしくみ』　　　「言語のつくり方」
原武史『政治思想史』　　　「物から読み解く政治思想」
マリオ・レブレーロ『場所』　　　「どこまでも続く部屋」
横山茂雄『神の聖なる天使たち』　　　「ディーとケリーの奇妙な運命」
ルシオ・デ・ソウザ、岡美穂子『大航海時代の日本人奴隷』　　　「記録に残されなかった者たち」
倉谷滋『分節幻想動物のボディプランの起源をめぐる科学思想史』　　　「「発生」をめぐる学問の歴史」
イチカワヨウスケ『野菜だし』　　　「レシピと伝達」
古賀弘幸『文字と書の消息』　　　「文字と歴史の広がり」
赤野工作『ザ・ビデオ・ゲーム・ウィズ・ノーネーム』　　　「2115年のゲームレビュー」
本山尚義『全196ヵ国おうちで作れる世界のレシピ』　　　「世界196ヵ国の家庭料理」
フレット・スメイヤーズ『カウンターパンチ 16世紀の活字製作と現代の書体デザイン』　　　「美しい活字への道」
ジェニファー・ダウドナ、サミュエル・スターンバーグ『CRISPR(クリスパー) 究極の遺伝子編集技術の発見』　　　「遺伝子編集の新技術」

Permalink | 記事への反応(3) | 23:48

2013-08-16

■このアイデアどう思う

日本語おかしいかも。

TwitterとかFacebookとか、あるいは2chや、はてブとか使って、ある記事とか情報に対してこう思ってます的な意見が気軽に出せるようになってる中で、そういった意見を勝手に集めてきて、その記事に対してみんなこんな風に思ってるんだよねーって(その意見を自然言語処理で肯定的か否定的か判断するみたいな)のが出てくればいいなと思った。

そういうのマーケティング的な何かですでにやられてそうだなぁと思ったけど、なんかこういうサービスとか知らない？

こんなニートが考えるぐらいだし、ズルズル出てきそうだよな…

Permalink | 記事への反応(1) | 21:02

2013-06-18

■気づいたら大学三年生になってしまった。

情報系としての今までの経験です、と言ってアピールできるような成果物も経歴（バイトとか）も無い。

プログラミングできるようになれば面白いんだろうなー面白い webサービス自分で作れるようになりたいなーと思いつつも

チュートリアルをこなすだけで匙を投げてしまう。

自然言語処理とか機械学習とか面白そうだなーと手を出そうとしたが、いかんせん数学が難しい。これをライフワークとして続けられる自信はない。

ただただアニメを見て、漫画を読んで、ネット上の記事（はてなのアニメ批評界隈とか）を読んでいたら二年間が過ぎていた。

インターンも申し込んでない。というか面接に行ったとして自分をどうやってアピールすればいいのかわからない。

これから俺はどこでどうやって生きればいいんだ。

だれかアドバイスをください…。

Permalink | 記事への反応(6) | 00:57

2013-05-06

■gunosyとはてなの蜜月 関係

http://gunosy.tumblr.com/post/49731783015/gunosy

公式に「所感」が出されたので、記念にこれ貼っておくよ

「gunosy＝はてブのパクり」ってネタはサービス開始当初からあって、実は増田にもこんなのがあがってたんだよね

今は削除されてるけど、なんかのためにとevernoteにクリップしておいたのを思い出したのでここに転載しておくよ

↓↓↓

東大生が詐欺サービスで名前を売るまで

1 ：増田ゲノムのクローンさん：2012/01/03(火) 00:22:01.00 ID:82R.hK77O.

●登場人物

ふっきー（東大生）

プログラミング始めて一年くらいの学生起業家志望

ほか二名

●あらすじ

はてぶのホッテントリをテキトーに選んで毎日 10個メールで流すサービスを始めた

記事は全部、はてぶからパクリ。例外1つもなし。

自然言語処理でユーザーの好みを学習、ともっともらしいことを言ってみる

UIはSummifyからパクった

すると・・・はてぶを知らない情弱に大ウケ！

毎日配信される記事が全て前日のホッテントリなのに・・・

情弱「この記事どこから探してくるの？すごい！」

でもバレかかる・・・

最初許可していたはてなアカウントでのログインを禁止しボタンもこっそり削除

でも名残がテキスト説明に残ってる

だんまりを決め込んだまま賞に出展、騙された会社からいくつか受賞

ほとぼりが覚めたころ復活・・・！

ふっきー「はてなゴミだな、俺たち買収すればいいのに！」

そのサービスの名は…Gunosy！実在するお

http://gunosy.com/

結論・・・情弱ははてぶを使え

次回予告・・・パーソナルマガジンなのに、みんなに同じ記事が送られている！？

Permalink | 記事への反応(0) | 11:01

2012-05-06

■http://anond.hatelabo.jp/20120322025117

外資系蹴って未来検索ブラジル行けよ

全文検索エンジンgroongaの開発、またはgroongaを用いたアプリケーションの開発を行っていただきます。
以下の条件を満たしている必要があります。
C言語でマルチスレッドやソケット通信を用いた実用的なプログラムを開発した経験がある
計算量のオーダについて理解し、問題領域に最適なアルゴリズムを選択して設計と実装が行える
海外論文誌等に提案されている新たなアルゴリズムを理解し、実装することができる
以下の技術分野に関する知識・経験があるとなお良いです。
自然言語処理
機械学習
データマイニング
並列コンピューティング
プログラミング言語処理
アセンブリ言語(x86 アーキテクチャ)
サーバ運用(LinuxあるいはFreeBSD)
オープンソースソフトウェア開発
http://razil.jp/recruit.html

英語の論文が読めて、アルゴリズムについて知識がある人材求めているぞ

Permalink | 記事への反応(0) | 17:32

2012-02-14

■http://anond.hatelabo.jp/20120214165137

横だけど、自然言語処理の技術を活かしてこういう勝利宣言系の書き込みを自動で非表示にできる機能欲しいな

Permalink | 記事への反応(0) | 17:05

2009-04-03

■2ch 工作員の存在を公にできるかもしれない件

http://shadow-city.blogzine.jp/net/2009/04/300_1300.html

これが本当の話かどうかは分からないが、本当に「ネトウヨ」等の特定単語の出現頻度がアクセス制限の前と後で大きく変化しているかは、集計してグラフにしてみれば簡単に分かる筈。

そして、それを誰もが客観的に確認できる形にできたなら、何かが起こるような気がする。

誰かやってくれ。俺はやらん。

やる場合は、集計元データに捏造されたデータを含んでしまわないように注意すべきかもしれん。

(尚、信憑性は全く無いが、ひろゆきが某社サイドであるという噂も出ている。)

それから、「客観的に、集計元データが改竄されていない事」を保証する何らかの手段が必要になるかもしれん。

ちなみに俺は、 http://anond.hatelabo.jp/20090402034532 を書いた元増田だが、もっと煽るような書き方にしないと駄目だと言われたので、こうして書き直してみた。

最後に一応言っておくと、「集計したら別に出現頻度に変化はなかったぜ」という事になる可能性もあるんだぜ！

これは単に、特定単語の出現頻度調査の提案をしてるだけなんだぜ！

簡単な自然言語処理の問題なんだぜ！

Permalink | 記事への反応(0) | 01:00

2009-03-30

■「自然言語処理は Python がいちばん」について

http://d.hatena.ne.jp/mamoruk/20090327/p1

「いちばん」かどうかはわかりませんが、うちの会社の製品ではpythonを主力に使った自然言語処理を含む製品を販売しているので、実際の感想を。

うちでは、pythonを元データの整備のための運用バッチ処理から、客が最終的に手にする情報の生成、実際に客が使うWEB インターフェースまで、pythonを主力にしています。

別のチームが作った別の製品ではS2Struts(JAVAね。)でWEBを作っている部分もありますが。

自然言語処理はぶっちゃけどの言語でも可能だとは思います。

mecabが使えて、Unicodeが使えて、正規表現が使えれば、まあ、どの言語を使ってもそんなに大差はないのではないでしょうか。

あとはsennaのような日本語用の全文検索エンジンなども使いますが、そこらへんに近い部分は基本的にC++で書きます。

pythonとは言っても、速度を重視する部分はやはり迷わずC++です。

C++で書いたものはswigを使うか、又はC言語で手書きのbindingを使ってpythonに接続します。

でもこないだswigでつないで製品をリリースしたら、WEBからの並列アクセスにswigがうまく対応できず、リリースした日に急いで手書きbindingを書いた経験があります。swigの使い方はきちんと理解していないので非常に難しい。

nltkとか、wordnetの話はたしかに使えそうかもと思ったことはありますが、nltkはうちでは使っていません。

うちの会社では自然言語処理の研究段階から自社で行っているので、nltkにあるようなできあいのルーチンを実戦投入する事はなく、基本的に地味に自分達でpythonで書いています。

自然言語処理と言っても、核心の処理はやはり泥臭い個別事例への対処が多いです。不要語処理とか。

自然言語処理のアルゴリズムは8割程度の精度を出すのは簡単で、すぐに思いつきで書けるものですが、残り2割の精度をいかに埋めて行くかが、頭のいい人とそうでない人の差が現れる部分だと思います。

どうしてもいいアルゴリズムを思いつかない場合は、泥臭い個別事例処理がうねうねと並んだプログラムになります。学術的なものではなく商売になればいいので、うちはとりあえずそれで十分。（これは自然言語処理に使う機械学習のアルゴリズムたちも同様。というか自然言語処理と機械学習て、区分けがあいまいな部分が多いですよね。）

そういう感じなので、pythonの可読性の高さは非常に有効。

また、変数名や関数名などをexplicitに書く文化も業務で使うのに適していると思います。（他の言語でもexplicitに書けばいいだけですが、それを言語開発者自身が推奨するほど強調はしていないですよね。）

英文の処理で、wordnetの辞書データの一部を研究に使った記憶はある。

しかし、あそこまで精緻な辞書データを使う程高度な処理は今の所必要ない。

うちで自作した不要英単語辞書と、特別扱いする英単語辞書で間に合わせていたと思います。（その辺記憶があいまい。）

WEBのユーザーインターフェースはdjangoで。

djangoは非常に明快で、快適。

画面の機能を追加するのに、例えばS2Strutsのアクションの定義の煩雑さに比較すると、天と地との差ほどにdjangoは簡単。

あと、pythonを使える開発者は日本には少ないとの事ですが、うちでもそれは同様です。

しかし、自分の隣の席の同僚はperlに非常に熟達していて、彼はすぐにpythonの達人に変わりました。

優秀な方にとっては言語なんて何をつかってもあまり変わらないみたい。

でも、彼も自分も自然言語処理でJAVAやC++のようなまわりくどい言語は使ってられないという点では同意しています。