「機械翻訳」を含む日記 RSS

はてなキーワード: 機械翻訳とは

2017-03-08

http://anond.hatelabo.jp/20170308180625

エクセル計算したのでは信頼置けないか

電卓計算し直すとかやってるところを見る限り、

機械翻訳では駄目という信条が優先されてしまう場がおおくて

どうにもならなくなるのではないか

もうさ20年後30年後には機械翻訳がすごいことになるのはわかりきってるじゃん

小学生英語教育とかやってる場合じゃないよな。

まあ、電卓コンピュータ時代になっても、習い事そろばんをやってたおかげで計算が速いとか言えるから頭の体操はいいかもしれんけど。

2017-03-05

ブクマが多い×コメントが少ない=良エントリ法則

ブクマが多いからと言っていいエントリとは限らない。読む価値のあるエントリには無言ブクマが並ぶ気がする。と書いてる増田をどこかで見かけた気がする。(ソースが見つからなくてごめん)

先月の増田検証してみたい。

2017年2月増田エントリ

コメントタイトルコメント数/ブクマリンク
12.4%読書に限らず、何か行動を起こしたいときには抵抗の順番に環境コントロ..172/1382anond:20170214093727
13.8%Adobe/Adobe 代替のためのソフト+α (2017/2/06更新)74/537anond:20160319160526
17.3%Google翻訳オープンソースプロジェクトに使うのはダメなのか?53/307anond:20170225195916
19.2%釣りむちゃくちゃな理由JASRACを勝たせた判例ベスト10(前半)41/213リンク切れ
19.3%ADHD管理職をやっている者なんだが201/1042anond:20170227161628
21.7%息子に吃音症の兆候が 出ている122/563anond:20170218153941
23.1%90%女性デートに誘い出す方法リークする166/718anond:20170214110304
23.4%セフレ無修正動画に出てた121/518anond:20170201191934
23.4%自分の思う通りにいかなかったからでしょうね。 思う通りってのはつまり、..158/674anond:20170218020456
24.0%中学受験体験255/1062anond:20170206102543
24.0%無能と思われたら職場を変えたらいい582/2423anond:20170204103326
24.9%釣りむちゃくちゃな理由JASRACを勝たせた判例ベスト10(後半)86/346リンク切れ
25.1%左遷先で狂い咲いてる人がいる116/462anond:20170203221134
25.9%統合失調症の母をついに入院させた話238/920anond:20170203210126
26.5%Ubuntu機械翻訳おじさんの騒動を見ていて胸が苦しくなった40/151anond:20170225141347
27.0%1人で初ラブホテルに行った140/518anond:20170214145614
28.1%教育困難校勤務の国語教員から239/852anond:20170208200842
29.0%学術論文文法111/383anond:20170203162721
29.7%教師との恋愛という罪の告白149/501anond:20170211003031
29.9%日本人投手メジャーリーグ登板数を集計したら感覚結構ずれていた35/117anond:20170214000243
31.0%珍名さん44/142anond:20170215025002
31.6%清水富美加のレプロ能年玲奈のレプロ話題になってるけど66/209anond:20170212011429
32.7%日本社会の本格的な分断はこれから来る184/562anond:20170216121824
32.7%弁当作りにハマってしまった56/171anond:20170225114511
32.9%x けものフレンズを観ているとIQが下がる o けものフレンズを観ていると我々..107/325anond:20170211212558

悪くない感じ。

2017年2月増田ソエントリ(失敬)

コメントタイトルコメント数/ブクマ
73.9%トンカツ牛肉版があれば流行ると思う209/283
73.2%聖戦士になりたい52/71
72.9%子供の人権尊重している一方、老人の人権は平気で蹂躙されてしかるべきと考えているはてなーたち151/207
71.8%人が溺れています、誰を助けますか?222/309
70.8%もうやめてほしいラノベ漫画表現109/154
70.0%四大有名 ○○○号126/180
68.9%悪い宗教と良い宗教があるのか252/366
66.0%ヘレン!これが水なのよ!今触ってるのが水なのよ!31/47
65.5%一人称を「私」呼びする男性が嫌い545/832
64.7%降りてみたい行先表示駅66/102
64.6%Amazon大好き楽天大嫌いな、はてな民259/401
64.2%(ぉ とか(マテ の解説一覧がほしい122/190
63.8%んふんふーん44/69
63.6%諸星といえば119/187
63.6%正しいでしょ。例えば、二桁の整数の和を返すプログラムなら簡単完璧に..157/247
63.5%世の中の人ってそんなにテレビ見てないのかな? わたし結構見てるかもし..172/271
63.2%三大うんこっぽい食べ物74/117
63.0%美人から奢ってくれるって言うけど違うだろ324/514
62.5%かつて、菩薩と言われたキャラって何がある?(けものフレンズ70/112
62.2%女だけど女は子供産んだら会社辞めて欲しい324/521
62.0%お前ら「まとめサイトくそ235/379
62.0%みんな、どうしてテレビゲームに飽きちゃったんですか?285/460
61.8%シュークリームを買ってくる上司殺意188/304
61.2%一週間カレー食わせたら嫁が切れた350/572
60.7%いい加減男性から性的搾取が酷い241/397

必ずしもダメと限らないけど読んで損した気分になる釣り記事が含まれてる気がする。

2017-02-25

Google翻訳オープンソースプロジェクトに使うのはダメなのか?

免責: これは法律専門家によるアドバイスではありません。この情報にしたがって行動した結果に対して責任を負うことはできません。

最近プログラマの間で

Web翻訳の結果をオープンソースソフトウェア(OSS)の翻訳に突っ込んではいけませんという話」

http://blog.goo.ne.jp/ikunya/e/37e5a52e10ab26fcbd4f7ff867e9eace

が、話題になってますね。

Ubuntu翻訳プロジェクトで発生したトラブルの話です。

この話では、「もちろん、利用規約的に問題なければWeb翻訳の結果をOSS翻訳に突っ込んでも*ライセンス的には*問題ありません。」という追記がされてます

ですが、プログラマの間で単にWeb翻訳OSSに使ってはいけないんだという認識が広まってるように見えます個人的には、この認識が広まってしまうのはいやだなと感じたのでこの文を書いています

どういう話かというと、自分個人で開発しているオープンソースソフトウェア(OSS)のドキュメントの日英訳をするにあたってGoogle翻訳を利用するか検討して権利まわりの情報をしらべた結果、これは白に近いグレーだろうという判断したので下訳に使ったという話です。(日英両方についてのドキュメント自体も、オープンソースライセンスで公開しています)

注意書き

念のため言っておきますが、これは元記事問題になっている人を擁護するようなものではありません。翻訳コミュニティの人たちが自分たちのものにグレーなものを入れたくないと思うのは当然でしょうし、権利問題以外にも翻訳クオリティやその他の問題行動の話もあります

コミュニティ思想にそぐわない人が、そのコミュニティの中で作業していくのは難しいでしょう。

Google翻訳利用規約について

もとの記事のとおり、Excite翻訳利用規約には私的利用を超えた利用についての禁止が明記されています。こういった明確に禁止されているものについての話はここではしません。

ここでは、Google翻訳に焦点を当てた話をします。Google翻訳利用規約はどうか?というと、Google利用規約については翻訳結果の利用についての記載がありません。

https://www.google.com/intl/ja/policies/terms/

記載がないということは、使用してよいのか?使用してはいけないのか?いったいどちらなのでしょうか?

GPLコンパイラの例

機械翻訳権利問題と似た構造の話に、GPLGNU一般公衆ライセンス)で許諾されたコンパイラによってコンパイルした結果の利用があります

GPLの本文には、GPLプログラムの出力結果自体GPLのものを含む場合にのみその出力結果にGPL適用されることについての記述がありますが、GPLのものを含まない出力結果についてどういう許諾がされているか記載はありません。

これについては、コンパイラによるコンパイル結果に対して、コンパイラ著作者はなんら権利を持たないと考えるのが一般的です。

GNU自体もそういう見解を持っています

https://www.gnu.org/licenses/gpl-faq.ja.html#GPLOutput

著作権法は人々があなたプログラムとかれらのデータを使って作った出力結果の利用に関して、あなたに何の発言権も与えていません。

コンパイラ機械翻訳ツールとの違いが、対象が人工の言語であるか、自然言語かので違いしかないと考えるならば、Google翻訳の結果をOSSに利用することも問題ないということになります

ウィキメディア財団見解

ウィキメディア財団法務チームは、Google翻訳した文書ウィキペディア内での利用についての見解を公開しています

https://meta.wikimedia.org/wiki/Wikilegal/Copyright_for_Google_Translations

これはアメリカ法律に基づく話ですが、CC-BY-SA 3.0やそれに類似するライセンスコンテンツGoogle翻訳翻訳してウィキペディア使用してもGoogle著作権侵害する可能性はとても低い(very unlikely)と結論づけています

要点をまとめると以下の通りです。

ウィキメディア財団見解には含まれていませんがアメリカ法律でいえば、さらにもう一つ「フェアユース」にあたるのではという話があります。これはGoogle自体がよく知っている話かもしれません。

Oracle vs GoogleJava API訴訟

これはAndroidAPIJavaAPIが流用されていることについて、OracleGoogle訴訟したものです。

これについて、Java APIについての著作権が認められたものの、Androidでの使用は「フェアユース」に該当するとGoogleは主張し、カリフォルニア州サンフランシスコ地裁では著作権使用料支払いの対象にはならないという判決が下っています

(この裁判自体はまだ続いているようです)

フェアユース」というのは、アメリカ著作権法上の概念で、以下の4要素を判断指針として考えて公正な利用と認められれば、著作権侵害とはしないと考えるものです。

Google翻訳結果のOSSでの利用をこれに当てはめると

ということになり、4つの要素どれをとっても、フェアユースであると認めることに対して有利に働きます。これは、AndroidJava APIの流用と比べても、さらにフェアな利用であるように見えます

さて、ここまではアメリカ法律での話でした。

(ちなみにGoogle利用規約には、「カリフォルニア州抵触法を除き、本規約または本サービスに起因するまたは関連するいかなる紛争に関しても、アメリカ合衆国カリフォルニア州法律適用されます。」と書かれています)

文化庁見解

今度は日本法律に基づく話です。

著作権情報センターサイトに、 コンピュータ創作物についての文化庁報告書記載されています

http://www.cric.or.jp/db/report/h5_11_2/h5_11_2_main.html

この報告書は、機械翻訳ユーザー機械翻訳システム使用するために行う原文の編集や出力の編集創作的寄与となりうることを認めている一方で、機械翻訳開発者翻訳物の著作者になるということについては否定的です。

なお、原文解析等のプログラム作成者及び汎用的な辞書データベース作成者は、一般的翻訳物の作成の精度、正確度等を高めることに寄与することとなるが、特定翻訳物の作成自体にかかわっているわけではないので、その著作者とはなり得ないと考えられる。

これは平成5年とかなり昔に書かれた報告書であり、それから機械翻訳技術は大幅に進歩しましたが、創造個性表現を目指して作られているもので無い機械翻訳であれば、やはり翻訳の結果の利用について問題がないようにみえます

これにしたがえば、単純に文章をそのまま機械翻訳に投げ入れた出力結果は、原文の著作者著作物機械翻訳に投げ入れる前や後に十分な編集をしていれば、加えてその編集した人間二次著作物になるということになりそうです。

白に近いグレー

これまで、どうしてGoogle翻訳の結果をOSSに使うことが白に近いと言っているか説明してきました。

では、どうしてグレーなのかというと、新しい種類の権利問題なので判例がないからです。実際に訴えられたら負けました、ということもまったくありえない話ではないでしょう。

グレーなものを作ることの良し悪し

だいたい、ここまでが話したいことの半分です。ここからはグレーなものの良し悪しの話をします。

著作権などの権利問題についてグレーなことをやっているOSSというのはそれほど珍しいわけではありません。

有名なところでいうと、Monoが思いつきますAndroidDalvikJavaAPIを真似したものであるのと同じように、MonoMicrosoft.NETフレームワークを真似しています。つまりMonoについても訴訟リスクはあっただろうということです。

しかし、OracleGoogle対立したのとは対照的な道をMonoはたどります

2016年Monoプロジェクト運営していたXamarin社は、そのMicrosoft自身によって買収されました。権利的にグレーだったMonoMicrosoft公認プロジェクトになったというわけです。

権利的にグレーだからといって、プロジェクトとして失敗に終わるわけではありません。

Ubuntu日本語化プロジェクトでの良し悪し

すこし元の記事に話をもどします。冒頭にも書いた通り、Ubuntu日本語化プロジェクトに対してWeb翻訳の結果を突っ込むという行為は、批判されるべきだと思っています

まずは質の問題です。現在Google翻訳などは、UI翻訳に向いていません。UIほとんどは、意味合い文脈依存する単語や短文です。UI翻訳は、実際にその機能を動かしながら、動作にあった訳語を割り当てていくべきです。

Google翻訳などを使って一括で、訳語を割り当てても良いUI翻訳はできません。

UIにとっての良い訳については、元記事のいくやさんがとても良い話を書いています: https://github.com/ikunya/howtotranslatelibo/blob/master/howtotranslatelibo.md#ふさわしい翻訳の考え方 )

次に、白に近かろうがリスクのあるものを入れることになるということです。Ubuntu日本語化ローカライズであれば、すでに多くのユーザー使用しているでしょうし、そういうものについてリスクのあるものを後から入れることになります

そういったことを独断で黙ってやるというのは、歓迎されたものではありません。少なくとも、コミュニティに対して事前に方針を聞いたりすべきだったでしょう。

まりクオリティが低い上にリスクのあることを黙ってやったわけで、もちろん批判されるべきでしょう。

自分場合

はいえ、OSSには個々の事情があります。次は自分場合の話をしてみます

まずは質の話です。

自分プロジェクト場合Google翻訳を使ったのはドキュメントです。日本語で書いたドキュメントをあたらしいGoogle翻訳に入れてみたところ、そこそこのクオリティ翻訳が出力されており、自分ゼロから翻訳するよりも、原文を翻訳やす修正したり結果に対して修正を加えていったほうが質と速さの両面でよいと判断したので、Google翻訳使用しました。

次にリスクの話です。

OSS企業権利問題訴訟されるということはめったにありません。OSS公益性の高いものなので、むやみに訴えれば社会からの反感を買いますし、ほとんどの場合は訴えても大した金になりません。

訴えられるとすれば、そのOSSが十分に儲かっている場合です。もしOSS大金が儲かったらGoogleから訴えられてしまう!どうしよう!と考えるのは、宝くじに当たったら強盗におそわれてしまう!どうしよう!と考えるのに似ています

まず宝くじは当たらないですし、宝くじが当たったらそのお金対策を行えば良いだけの話です。

実際Linuxでは、特許周りの対策としてOpen Invention Network(OIN)を設立していますLinuxなどソフトウェアに対して特許を主張しないことに同意した企業から特許を買収して、そういった企業に対してロイヤルティー・フリーで許諾を行っている会社です。

これによって、Linux関連のソフトウェアに対して訴訟をしてきた、いわゆる「パテント・トロール」に対して訴訟をやり返すなどの対抗手段を得ているわけです。

別の視点でのリスク

それにOSSにまた別の角度のリスクがあります

権利問題訴訟されたことによって失敗に終わったOSSというのはほとんどありません。多くのOSSは、作者が飽きたり、面倒な作業うんざりしたり、誰にも使われなかったり、競合に勝てなかったりしたことで、フェードアウトしていきます

そういったこともまた、OSSリスクなわけです。

結局のところ、自分場合Google翻訳をつかったところで、Googleにも、自分にも、ユーザーにも、世間にも不利益はなく、むしろドキュメントの質は上がって、Google翻訳改善するためのデータを得られます

わずかなリスクを避けるために、時間を割いた上、質を落とすというのはくだらないですし、そんなことに時間を使うくらいならコードを書いていたいものです。

Web翻訳の結果をオープンソースソフトウェアで使うべきか、そうではないか

結局、Web翻訳の結果をオープンソースソフトウェアで使うべきか、そうではないか?というのは個別の話でしかなく、ひとまとめにWeb翻訳の結果をオープンソースソフトウェア翻訳にいれてはいけないとか、使うべきとかそう簡単には言えません。

質が悪いしリスクがあるのであれば単純に禁止で済む話ですが、機械翻訳が向上して、質が良いがリスクのある例が増えると話はさらにややこしくなります

OSS翻訳者コミュニティ機械翻訳の利用についてそのプロジェクトで使って良いか方針を定めてやっていくしかなく、後からコミュニティに入っていくような人が機械翻訳を使いたい場合コミュニティ方針確認した上でやっていくしかないんだろうなあと思うところです。

2016-11-25

言語ってなんだ、状態か?

まずは【お前自身機械翻訳駆逐されろ】"iwatani"の翻訳した記事が上がっていた。

GoogleAI翻訳ツール独自の内部的言語発明したようだ、そうとしか言えない不思議現象が>

http://jp.techcrunch.com/2016/11/23/20161122googles-ai-translation-tool-seems-to-have-invented-its-own-secret-internal-language/

http://b.hatena.ne.jp/entry/jp.techcrunch.com/2016/11/23/20161122googles-ai-translation-tool-seems-to-have-invented-its-own-secret-internal-language/

Zero-Shot Learningは分岐のない翻訳などではない。これは正しくOne-shot Learningの延長線上にあり、

ワンショット学習すらしないで(この場合対応ペアでの事前学習をおこなわず)、新規ペアでの処理を行うっていうことだ。

この語は翻訳に限った話でもない。だからほとんどの訳がおかしい。むしろ機械翻訳の方がマシ(背景を理解していない翻訳者より機械翻訳の方がマシという皮肉な状況)。

ワンショット学習っていうのは人間ができることでもある、極めて少ないサンプル(多くの場合サンプルでもいい)から学習する方法

(ちなみに実際に脳内でもOne-Shot Learningは繰り返し学習とは別パスなのではという示唆もある)

グーグル翻訳AIが「独自言語」を生み出したといえる根拠

http://wired.jp/2016/11/24/google-ai-language-create/

http://b.hatena.ne.jp/entry/wired.jp/2016/11/24/google-ai-language-create/

なんだ英語を介さな翻訳手法って。もうなんなの。

これらは古くから考えられてきた「基底となる」文法等を完備した「中間言語」などではない。

論文で触れられている「『Interlingua』な表現形式」は『semantic representations』とされていて、まさに多言語間で共通する「『意味表現』の表現空間」であり、

リー状に開かれてもいない。人が想像する構造化された言語などではない。

ただしその空間を共有していて、つまり共通意味表現を持っていることは論文(arXiv:1611.04558)で実験的に証拠提示されている。

今までも多対多の翻訳ネットワークを共有することでBLEUを向上できるという論文は出ていたが、今回のは、翻訳に関して言えば、十分普遍化した意味空間を内部的にもったネットワーク新規ペアをぶち込んでも能動的な転移学習すらせずにそれなりの結果が得られる、結果の向上だけでなく未知ペアを処理できるって事である

 そしてその効果汎用性↑↑、そして最大のメリットサンプルが少ない言語ペアもやりやすくなるぞ、マイナー言語にも早く適用できるかもって所だ。

One-shot Learning系(小サンプル)とDeep Learning系(巨大サンプル)によるネットワークについて、意味という(我々にも見えない)上位構造の下に配置された構造である言語」を扱う特別な例では、両方を一つで達成できる可能性が垣間見えた論文なのでもある。

2016-11-17

Google翻訳ってそんなにすごい?

はてぶでGoogle翻訳がすごいって話題をちらほらみて、購読してるポッドキャストでもこの話題がでて、会社ドキュメント人間をやとって翻訳させてるけどもう人間いらないとか言ってるのな。

そんなにすごいのならと、試しにギズモードとかワイアード記事を2,3翻訳させてみたけど、やっぱ機械翻訳って感じの訳だったわ。

あの程度なら人間訳者は安泰だと思った。

2016-10-23

ディラン選考委員話題元ネタニュアンスのある記事だったんだな

機械翻訳だとわかりにくい、うまく意味が取れない

挑発的な反論を感じる見出しで注目を集めるテク

直接的に褒めてはいないけど、肯定意図

こういうのをちゃんと訳すのは、まだまだ人間翻訳家仕事だなと思う

http://anond.hatelabo.jp/20161023023009#tb

2016-03-09

http://anond.hatelabo.jp/20160309141412

ホロン部も知らない癖に、ネトウヨ面すんなよ、オバサ

読んでて違和感を感じない程度の日本語力なら、こういう事に首突っ込むな

http://dic.nicovideo.jp/a/%E3%83%9B%E3%83%AD%E3%83%B3%E9%83%A8

ホロン部の特徴

満足に日本語が分からないくせに日本人のふりをする

助詞(てにをは)の使い方が変 (日本語朝鮮語助詞の使い方が違う)

句読点が無い(朝鮮語句読点がない)

時に、あからさまに機械翻訳

俺は正真正銘の日本人だけど(このタイプは総聯ホロンに多い)

右翼嫌韓嫌中などのふりをして珍奇な主張をする

ex.「俺はどちらかというとウヨだけど」「嫌韓の俺が言うのも何だけど」

誤字脱字がある

必死に話を逸らすが、内容が非常識

罵倒しかできない

日本語で書かれた簡単な計算ができない

ただし、ハングルで同じ問題を出せば普通に正解できる

でも、それを指摘されると何故か答えない

詭弁の特徴のガイドライン完全準拠詭弁披露する

お国自慢話題が一切無いのに突然地域分断工作に精を出す 

ex.「また犬阪か!」「また倒狂か!」「さいたまさいたま!」

わず「~は日本じゃないから」と言ってしま

ex.独島日本じゃねぇから」「梅田日本じゃねぇから

ついうっかり朝鮮語を使ってしま

日韓韓日と書いてしま

朝鮮半島韓半島と書いてしま

竹島独島と書いてしま

2016-02-11

あと2, 30年したらGoogle機械翻訳の性能が向上して

素人の精度の低い英語なんか太刀打ちできなくなる。

英語教育をうけていた小学生おっさんになっていて、いままで必死英語勉強したのはなんだったんだって思うようになる。

2015-12-31

台東区HP言語表記間違い探し

http://www.city.taito.lg.jp/index.html

http://www3.nhk.or.jp/news/html/20151229/k10010356241000.html

あくまで一部。探せばもっとたくさん間違いがあるはずで実際ここで指摘した以外にもおかしい文はあるので他の言語でもふるって指摘すべし。

やっぱ役所公式サイト機械翻訳使っちゃダメだよ。

2015-08-18

http://anond.hatelabo.jp/20150818000647

英語使えるのが常識になって機械翻訳わざわざ使わないと簡単な会話もできないとか池沼かよ。リアルでどうすんだ」って扱いになるから今の内に勉強しとけよ。

基礎の教育順序も理解してないアホが教えてるのは今のうちだけだぞ

小学生英語教育の必修化

あと30年もしたら機械翻訳の性能が上がって、まあまあ意思疎通ができる程度の中途半端英語力はぜんぜん価値がなくなって、今の小学生おっさんになるころには、あんなに時間を使って勉強したのは何だったんだってことになってる。

で、素で英語のできねえ奴はつかえねえとか言って若者老害あつかいされてるの。

英検三級にも合格できないおれの妄想

2015-08-15

[]よくある質問

今回は例え話関連。

真面目に答えず、出来る限り嘘と虚構を織り交ぜて答えていきたい。

Q.忍者いくら人気だからって、創作世界忍者で遊びすぎだと思います

最初のうちは皆マジメに忍者というジャンルに向き合っていたんだよ。

でも様々な要素を付け足したり、新たな視点から見てみることでジャンルは更に反映するのさ。

勇者魔王モノと同じだね。

私が知っている限りでは、若者ターゲットをあてて、登場する忍者を同じくらいの年齢にしているとか。

あとは、現代食べ物主食にさせたり、サーフィンとかやらせたりして親しみを持たせていた。

うそう、あくまフィクションというのを強調するために忍者人間じゃなくて、空想上の生き物というのもあったな。

Q.援助交際してそうなアニメキャラランキングというものがあるようですが、いくら架空キャラからといって、些か低俗下品ではないでしょうか。

学生時代クラスメイトとそういう下品な話をしたことはないかい

いわばその延長線上さ。

大人にもなってそういうことで盛り上がるのもどうかと思うかもしれないが、みんなどこかで「心の○○歳」を飼っているものさ。

もちろん私も心の小中高大それぞれ飼っている。

まあ、低俗であることは否定しないが。

Q.ローカライズって、ただの翻訳に感じるんですが、そんなに重要なのでしょうか。

重要だ。私は機械翻訳レベルからまり大層なことはいえないが。

ローカライズが酷いと、冗談抜きで作品のもの価値すら脅かすことになる。

ミュウツーの逆襲」が、米国では駄作扱いされているのが有名な例だな。

日本で好評価のものが他の国では低評価だったりするケースがあるが、これもローカライズの妙ということさ。

日本人に見る目がないという説もあるが、私としては認められるところではないね

2015-08-13

ロリポップ時代インターネット殺人事件URLをチェックしたら、いつのまにか「中性脂肪を下げるには何をすればよいの?」なるいかにも機械翻訳丸出しの業者サイトになっていた。

この業者は何を考えてこのドメインを選んだのか。中性脂肪がどうこうっていうのにインターネットキルは関係ないだろう。もっと普通ドメイン名でよさそうなものだ。

もしかしてドメイン売買評者に「ここは人気のドメインですよ」って騙されたのか。

いや嘘は言ってないけどさあ。

2015-08-01

かつてイタリア空港ジェット燃料の発注を忘れたことがある

1999年10月イタリアの空の玄関ローマ空港で、ジェット燃料の備蓄が0になると言う出来事があった。

当然、燃料補給する予定だった、航空機は、飛び立てず、ローマの空は大混乱で、

原因は、燃料の備蓄管理をする部門が無かったかららしい。

其れまでは、燃料の備蓄が、少なくなって来ていることに気が付いた部門が、

燃料を発注してきていたと言う話しで、その時は、気が付いた人はいても、

「まあ、誰かがちゃんとやっているだろう。」「誰かが、やっていたら、二重発注になるし・・・」で、

誰も発注していなかったらしい。

こんな事故を起こす、イタリア人が凄いのか、それとも、こんな体制1999年まで、

問題なく空港を維持できたイタリアは凄いと言うべきなのか・・・・・・

☆信じられないが、本当だ

http://www.sinzirarenai.com/

この話あまりにもすごすぎて半信半疑だったので調べてみた。

この事件はどこから発表されたのか

"carburante"、"esaurito"、"aeroporto"をキーワード検索したところ次のページが引っ掛かった。

話の出どころとしてはラ・レプッブリカ社のサイトのみたいだ。

機械翻訳だったからよくわかんないんだけど、本当に発注忘れてたみたい…。

Emergenza carburante a Fiumicino

http://www.repubblica.it/online/fatti/fiumi/benz/benz.html

イタリアのどこの空港でおこったのか

記事を信頼するとフィウミチーノ空港で起こったことらしい。

ちなみに"ローマ空港"という名前空港はないんだね。

ローマってつく空港複数あるみたいだ。

でも、イタリア語Wikipedia空港のページをみても1999年10月にそんなことがあったなんて記述がないんだよね。

もしくは書いてあるけど自分が読めてないだけか。。。

あと続報がないんだけど最終的にどうなったんだ…。

というかこれが事実さいことにも衝撃だ…。

どなたかご存知でしたら教えてください。

2015-05-01

人工知能出現はエライことになるのか否か?

http://tjo.hatenablog.com/entry/2015/04/30/190000

リンク先は「今世間では人工知能がとんでもなくもてはやされ(あるいは恐怖され)てるが、そうでもないよ」という話。

話の要旨は

けれども、世間の人々が期待しているのは「singularityに程なくして到達し得るほどのSF小説に出てくるような人工知能」であって、「莫大な種類のパラメータチューニングと果てしなく続く前処理の果てにようやくヒトが作業するよりも5%程度精度が高くなる機械学習分類器」ではないわけです*10。その見解のズレは、世間の人々が自ら機械学習とそのために必要数学や関連分野の学術を学ぶようにならない限りは、なくならないことでしょう。

ってな感じ。学者さんらしく「世間の人々の理解レベルが低いので幻想見てるんだよ」という結論です。

全体的に同意できる記事なのですが、結論というか着地点はずいぶん違うんじゃないかなあという印象。

というのも人工知能(ここでは機械学習)が「社会」に対して与えるインパクトは強烈だからです。例えば文章の多言語翻訳は、今後10年で常用可能なレベル機械翻訳が登場するでしょう。自動車の運転も(法的な規制さえ間に合えば)実現する可能性が高いです。画像認識による機械警備や、機器監視なんかも置き換わる可能性が高いです。記事先では「5%程度精度が高くなる機械学習分類器」なんてしょんぼり書かれていますが、一度実現してしまえば教育コスト無しで複製でき、大量生産コストダウンしていける、さらには24時間働かせても誰も訴え出ないこれらの機器は、該当分野の雇用状況を一変させるでしょう。

率直に言えば、社会を変革するにあたって「世間のみんなが夢想するような人間比肩するAI」なんてレベルのもの必要ないのです。

初期設定には人間の介添え(チューニング)を必要とし、狭い学習分野しか通用せず、人間より数%しか能力向上がなくても(あるいは能力が下でも!)、電力で動く機械であるというだけで、十分に社会を変革できるのです。そもそも失業率が1%上がった下がったで一喜一憂している先進国為替が1%上下しただけで冷や汗と笑顔が交差する企業において、「たかだか5%程度」なんてのは口が裂けても言えない数字です。

雇用に影響を与える」という一点において、人工知能の今後10年は、脳研究のそれとはまったく違った経過をたどるのではないでしょうか?

2015-04-14

その英文、「不細工」というレベルじゃないから迷惑から

http://anond.hatelabo.jp/20150414163947

スポンサー企業の中には外資系で、本社アメリカとかもありますね。

はい、そのときアメリカ本社メールします。

ただの迷惑だ。やめてくれ。

英語はできないので、機械翻訳ですが、こんな感じです。

It's mailed from Japan.

...

Japanese is being scolded.

Please scold Japan corporation from headquarters.

こんな英文メール、相手が意味を読み取ってくれるとでも思ってるのか?

このサイトの COMMENT ON THIS WEBSITE のところにアドレスがあります

かなり不細工英文ですが・・・

It's mailed from Japan.

Japan corporation of an American enterprise.

中学3年でも意味が取れないとわかるレベルであり、「不細工」とかいレベルじゃない。それすらわからないのなら、英語で何か書いて誰かに何かを伝えようなんて呼びかけるな。

スルーしようと思ったが、こういう「怪文書」は見たらつっこみを入れるようにしておかないと、どんどん広まるからな。

最初タイトルに入れたのが文字数が多すぎて変なところで切れてしまった。そのため、タイトル文字数を削減して書き直した。それゆえ、トラバ画面とここのタイトルに相違があるかもしれない。

2015-03-24

http://anond.hatelabo.jp/20150324124152

なにこのくっそ読みにくくて頭悪そうな文章

英語で書いたのを機械翻訳したの?

2015-03-06

http://anond.hatelabo.jp/20150306201751

よく纏まってて面白かったから、コピペ

ホロン部 by はてなキーワード

韓国朝鮮を嫌う一部界隈(嫌韓)に批判的なレスを付ける人たちに対するレッテル貼りネトウヨ用語

嫌韓への批判者が日本語で「日本は滅ぶ」と書こうとしたところ、 「日本ホロン部」とタイプミスをしたことに由来。ささいなミスを揚げ足どりに用い、これでもかと誹謗するネット右翼根性の悪さが現れた言葉といえる。

ホロン部 by ニコニコ大百科

概要

通信用語の基礎知識によると、一定時間帯に2ちゃんねるに対して一斉に、

そして時に自作自演までして擁韓・媚韓反日侮日レスを付ける在日工作員のことを指す。

誕生秘話

現在工作員活動時間が広がったが

以前は一斉に夕方ごろに現れていたため、半島系の学校部活動ではないかと噂されていた。

そんな折、在日朝鮮人コテハンハングル板にあるレスを投下する。

809 :閼伽 ◆V.bDFzs4FE :03/01/06 23:04 ID:gXzvMuTH

俺の良識意見馬鹿にしやがって もって核が降ってくるぞ!!!!!!

北海道は北のSWAT部隊占領!!!!!!!!!

日本条項に気球爆弾500万個 サリンVX破裂

核が首都に落ちる 地震が起こる 噴火

日本はめちゃめちゃにホロン部

この変換ミスにより、「ホロン部」は生まれたのである

ホロン部の特徴

満足に日本語が分からないくせに日本人のふりをする

助詞(てにをは)の使い方が変 (日本語朝鮮語助詞の使い方が違う)

句読点が無い(朝鮮語句読点がない)

時に、あからさまに機械翻訳

俺は正真正銘の日本人だけど(このタイプは総聯ホロンに多い)

右翼嫌韓嫌中などのふりをして珍奇な主張をする

ex.「俺はどちらかというとウヨだけど」「嫌韓の俺が言うのも何だけど」

誤字脱字がある

必死に話を逸らすが、内容が非常識

罵倒しかできない

日本語で書かれた簡単な計算ができない

ただし、ハングルで同じ問題を出せば普通に正解できる

でも、それを指摘されると何故か答えない

詭弁の特徴のガイドライン完全準拠詭弁を披露する

お国自慢話題が一切無いのに突然地域分断工作に精を出す 

ex.「また犬阪か!」「また倒狂か!」「さいたまさいたま!」

わず「~は日本じゃないから」と言ってしま

ex.独島日本じゃねぇから」「梅田日本じゃねぇから

ついうっかり朝鮮語を使ってしま

日韓韓日と書いてしま

朝鮮半島韓半島と書いてしま

竹島独島と書いてしま

ホロン部実像

実際にそういう組織はないが、未だホロン部情熱は衰えてない。

古株のネットウォッチャーにとっては既に古語の域ではあるが、彼らは消えた訳でもまったくなく、懲りずに活動している。上記の特徴に合致する書き込みを見たら、ホロン部活動を疑おう。

2015-02-09

小学生英語必修化

もう必修化してるんだっけ?

正直、機械翻訳の性能は20~30年もしたらすごい上がって、いまの小学生おっさんになるころは「あんな必死勉強したのはなんだったんだ」ってことになってそう。

算数国語、体育とかの教科は、人間としての基礎訓練とか教養意味があるから電卓ができたり機械化進んでも無意味とみなされないけど、英語って「グローバル化時代英語くらいできないと」みたいに変に実用的な側面が強調されるじゃん。

小中高と何年も英語をやってる平均的な日本人より機械翻訳のほうが性能があがったら本当に無意味とみなされそう。

2015-01-27

戦場ジャーナリストに軍歴はあるか

http://anond.hatelabo.jp/20150126171604

戦場ジャーナリスト定義がよくわからないが

シリア内戦で亡くなった欧米記者のうち経歴が見られる人の場合

http://en.wikipedia.org/wiki/List_of_journalists_killed_during_the_Syrian_Civil_War

メリー·コルビン 米 http://en.wikipedia.org/wiki/Marie_Colvin

リチャード·エンゲル 米  http://en.wikipedia.org/wiki/Richard_Engel

アンソニー·シャディッド 米 http://en.wikipedia.org/wiki/Anthony_Shadid

ジル・ジャキエ  仏 http://en.wikipedia.org/wiki/Gilles_Jacquier

ジェームズ·フォーリーhttp://en.wikipedia.org/wiki/James_Wright_Foley

http://jp.wsj.com/articles/SB10001424052970203403704580104791021448612

スティーブン·ソトロフ 米・イスラエル http://en.wikipedia.org/wiki/Steven_Joel_Sotloff

http://ja.wikipedia.org/wiki/%E3%82%B9%E3%83%86%E3%82%A3%E3%83%BC%E3%83%B4%E3%83%B3%E3%83%BB%E3%82%BD%E3%83%88%E3%83%AD%E3%83%95

レミ・オシュリク 仏 http://en.wikipedia.org/wiki/Remi_Ochlik

以上の7人には軍歴の記述は無い、徴兵制のある国の場合はわざわざ書いてない可能性もあるだろうが

軍歴があるのが

Yves_Debay  ベルギー・仏 (ベルギー軍)http://en.wikipedia.org/wiki/Yves_Debay

ポール·コンロイ 英 (英軍http://en.wikipedia.org/wiki/Paul_Conroy_%28journalist%29 この人は負傷

の2人 なので「戦場ジャーナリストって、外国では退役軍人なり徴兵経験者がやる仕事」ということはなさそう

ウィキペディア機械翻訳で眺めた程度なのであんまりあてにはならないけど

2014-08-03

現実世界でも「それソースどこなん?」と気軽に聞きたい

某巨大実名SNSで、友人がこのサイトリンクシェアしていた。はてブでも執筆時点で656のブクマが付いている。

「精神病を"会話"で診断するなんてもう古い!」 83,000個の脳をスキャンしてわかった、精神病の正体 | ログミー[o_O]

最初見出しは、”「トラウマ」で脳は実際に損傷する”となっている。

マジか、精神的なストレスで脳細胞死ぬのか。

確かに、凄く辛い時って頭も痛くなるしな。

と思いたくもなる。

しかしこれ、全くの嘘っぱちである

原文の"Traumatic Brain Injury"とは、専ら心理学的な意味で使われる日本語の「トラウマ」とは異なり、「物理的な脳の外傷」を指す。(Wikipedia参照)

英語ではボクシングなど「物理的な脳損傷」の話をしているのに、この訳は何故か「心理的なストレス」の話になってしまっているのである

以降も、原文を機械翻訳にかけたあと適当に意訳した所為か、全く異なる文脈となってしまったトンデモ訳のワゴンセールである

残念ながらこのクソ記事を公開した記者名前は記載されていないが、それよりもこんな記事を無批判に信用してしまう人が多いであろうことが気がかりである

外国の偉い人がこう言っていた」と日本語で書くだけで、それを信じる人が沢山出てくる。

かといって、こういう記事に全て査読を付けるわけにも行かないし、デマがある程度広がるのは容認というか仕方ないと思うべきなんだろうか。

せめて、自分の周りだけでも、誤解は解いておこうと思った。

けど、友人のシェアに直接コメントすることは友人の顔を潰すことにもなるので、今回はメッセージで「それトンデモ記事だよ」と伝えることにした。

数分後にその記事は友人のタイムラインから姿を消した。

間違っていることをドヤ顔で流布することほど恥ずかしいことは無いと思う。

2chでは、「それマジで言ったん?ソースあんならすぐ出せ マジなら2ちゃんねら総力を上げて潰すが」というコピペ代表されるように、ソース重要視される文化がある。

このソースを確認する意識は、非常に重要なことである2ちゃんねら一般人よりも科学的な物の見方をするように意識付けされている。

Wikipediaでは[要出典]のマークが過剰であるとしばしば揶揄されるが、出典のない記事などデマと同レベル情報価値しかないし、[要出典]とされたままで、情報出所が十分でないことがWikipediaソースとしての信頼度が低い理由ともなっている。

一般人に「それソースどこなん?」なんて聞こうものなら、「話の種なのに…」とかで空気読めない扱いをされかねない。

間違った知識を得てしまうことに抵抗を感じないのだろうか。などと考えてしまう。

からといって頑張って啓蒙しようとは考えず、「まーたこいつらソースも見ずに信じてるわw」とか心のなかで思いながら過ごしている。

ログイン ユーザー登録
ようこそ ゲスト さん