「機械翻訳」を含む日記 RSS

はてなキーワード: 機械翻訳とは

2024-04-13

ホロコースト否定論Amazonレビュー禁止増田

https://anond.hatelabo.jp/20240411140010

上記増田追記で、私(id:hazlitt)のブコメに反応されたようなのでお返事を書いておく。(記載されたはてなブログによると増田id:hotelsekininsya

追記

hazlitt 翻訳と称して他人記事転載してる note記事は元記事の著者・掲載メディアの許諾と訳文の権利者を明記してください。権利関係不明だと訳文の利用にもリスクがあるのでまともな人は参照しません

 

とありますが、もちろん著作権上の問題認識しております著作物勝手翻訳して公開することは著作権法に抵触するのは知ってます

が、翻訳公開しているもの無料で読めるネット上の不特定多数に向けて公開された情報限定しており、Google翻訳等の自動翻訳してくれるサービスとやってることは変わらないと考えています

もし仮に私の翻訳公開がダメというのであれば、Google翻訳等の自動翻訳サービスダメなのではないのでしょうか?

日本にはフェアユースを認める判例はありませんが、とある場所海外の方(著作者ではありません)に聞いたらフェアユースからいいのでは?と返されています

別に私の翻訳文を利用してほしいとも考えておらず、単なる情報提供に留まります。私の訳文を例えば研究論文などに利用する人がいるなどとは考え難いことでもあります

リンクは示しているのですから引用したいのであればそちらを利用して自分翻訳するのが当然だと思いますが。

 

要は。

日本語で情報公開しないと、日本の多くの人が理解しづらいだろうから、単にボランティアでやってるのです。

それでもダメだとなるのであれば、Amazonレビュー同様、私はネットから去ります。そうなったら、もはや絶望しかありません。



貴殿の考え方には賛同できかねます

→ 誰でもタダで読めることは勝手翻訳配信していい根拠にはなりませんよね。インターネット上にはたくさんの無料公開されているコンテンツがありますが、誰でも好き勝手翻訳公開してもいいんですか?

機械翻訳サービス提供することと翻訳したコンテンツ配信することは、コピー機を置くこととコピー本を配布することくらいの違いがあります貴殿の主張は「図書館に行けば誰でもタダで閲覧できる本を備えつけのコピー機で複製して配布することは問題ない」と言っているのと同じです。

→ たとえば米国におけるフェアユースでは通常「著作権のある著作物全体との関連における使用された部分の量および実質性」という要素が勘案されます貴殿掲載している「翻訳」は本当にフェアユースに該当しますか?

→ 「単なる情報提供」のために事細かな翻訳必要ですか? たとえば議論必要な部分の要約や抜粋ではダメですか?

当方曲解かもしれませんが、善意ボランティアから多少は他者権利侵害してもよい、という態度は危険だと思いませんか? それから、 誰がどう「利用」するかとは関係なく、翻訳提供することにはそれ自体価値があります。その価値提供する対価は、通常であれば翻訳に関する契約などを介して原著者や翻訳者に還元されるものです。貴殿ボランティア無料翻訳を公開することは、本当にその還元されるべき対価を損なっていない(将来もその可能性がない)といえますか?

→ 許諾を得てないなら、たとえば全文そのままの転載ではなく要約にすればいいだけです。その方がよほど日本語読者には有益なのではないでしょうか。

当方が思いつく解決(?)の方法


蛇足ですが、世の中の研究者や記者やその他の文筆家は言論プラットフォーム毀損しないためにいろいろルールを守りながらやっています匿名だろうがボランティアだろうが、ネット上に何かを書くことは立派な言論活動ですので、「勝手翻訳ダメならネットから去って絶望する」などという認識ちょっと安易に過ぎる気がしなくもないです。(なお「ネットから去る」場合権利侵害の疑いのあるコンテンツをきちんと削除してからにしてください。そうでないと未来永劫、有害コンテンツとして残ってしまますので)

2024-04-10

今回の塗り絵騒動に関して思うところ

炎上自体の是非は「基本的には作者がNOと叩きつけたものはなんであれNOである」で一貫していいと思うけど、それはそれとしてフランス人が怒る気持ち何となくわかるんだよなあ。

今回のファンアートは、日本著作権で言えば「同一性保持権」と「翻案権」の二つを、それぞれ侵害している。

この法律尊重権という名称フランスにもちゃんとあって、なんであれば範囲日本より広く厳しい。

にも関わらず今回の多くのフランス人が怒ったのは、作者の言葉が、著作権問題などではなく「筆者本人の芸術的問題だとしている」と受け取られたからだろう。

基本的に今回の作者の主張は全く間違っていない。同一性保持権はその作者が望む表現保護する機能を持つので、「自分が納得するクオリティ(と受け取った)があれば、看過する」というのは何も著作権行使として問題はない。

ただ原作者が叩きつけたNOの文章は、平たく言えば「あなた技術では、ファンアートと認めることはできない」と解釈されてしまう。

著作権において作者と二次創作者の権利には当然力関係がある。

けれども創作者としてのプライドは、どんな建前があるにせよ平等存在していた。

著作者自分意図しない表現自分作品で行われたことで自尊心を傷つけられたように、自分なりに愛情を示し技術を注ぎ込んだものに、その作品創作者直々から「創意工夫もなく~」と断じられ傷つけられたのだろう。

なんとなくそんな風に考えたのは、フランス人側のリプライのやり取りを見たことがきっかけだ。機械翻訳掲載する。

リプライ者「正直なところ、削除すべきだと思う。作者本人に頼まれたのであれば、プライドエゴを捨ててやるべき。迷惑だけど、それが現実。(恐らくファンアートのこと)いいことだとは思うけど、そのせいで、今、マンガ家サイバーハラスメントを受けている。削除すれば全て元通りだったのに。このような無意味憎悪の波を見るのは残念だ。」

ファンアート作者「私は侮辱されていませんでしたか?」

リプライ者「きちんと翻訳をすれば、マンガ家あなた侮辱しているわけではなく、自分が考えていたキャラクターとは色も意味もまったく違うと言っているとわかる。攻撃性はない。また、仮に「工夫もセンスもない」が事実であったとしても、自問自答し、この言葉進歩し、自分欠点を消していったはずだ。消したくないというあなたエゴが、このような事態ととサイバーハラスメントを生み出したのだ。あなた謙虚さが火を消し、プロフェッショナリズムを示すことができたかもしれないのに。」

今回の件で日本フランス、双方が国辱し合う謎の光景が繰り広げられたが

正に「無意味憎悪の波」だと感じる。

anond:20240410031930

お前ここに書かれてる英語が何を意味してるのか全く理解せずにただコピペしてるな?

ここに記述されている分類は日本語で言う自律神経失調症とはまったく別の病気だぞ

自分機械翻訳にかけることすらしてないだろ

そんなに「俺は手帳持ちADHD境界知能です」と大声で宣言してなんの得になるんだ?

しかしてないぞ?

2024-03-25

anond:20240325164033

いまどきGoogle翻訳みたいな程度の低い機械翻訳使ってる企業のほうが問題だろ

2024-03-22

才能の民主化って言ってる人が叩かれまくってるらしいけど、何らかの技術には努力量による差が認められるべきだと思ってる人が多いんだなって思う。

ええやん。努力せずに憧れが手に入るなら最高やん。我慢ってそれそのものには意味ないし。

努力過程を楽しめないならその程度のものだったんだ。好きと憧れは違う。

とかそういうありきたりな説教が覆ったら面白いじゃん。

努力なくして技術を手に入れてはいけないのなら翻訳アプリも使ってはいけませんねぇ。

まあ機械翻訳じゃまだ雑な部分もあるし、正確なニュアンスを伝えるのも難しいだろうけど。それなりに知識がなきゃ翻訳結果が間違ってるのか正しいのかも分からんし。

絵も音楽も然りだろうし、(こっちには正解も正確もありませんが……)そういう事なら変な叩き方せずにそう言えばいいだけええやん。別にわざわざ言う必要ないけど。

民主化というよりは均質化とかの方が近い気はする。

人の絵を勝手学習させるってのが著作権違反っていうのも微妙じゃねって思う。

特定の一人の作風パクるならともかく複数から学んでいくのもダメなら、それはもう他人作風の影響を受けてはいけないって話になるし。

人が手を頭を動かしながらやるのは良くて機械がやるのはダメとか言ったら、もう公立中学校の謎風習みたいな感じになる気がする。ヌクモリティがないのでダメです。

じゃあ社会ルールが常に公立中学校の謎風習とは違ってきわめて筋の通った合理的ものかと言ったら別にそうでもない気もするけど。

2024-03-21

今後「AI確定申告」とかが出来たとして

イラストレーターのみなさんはもちろんそんなものは使わず自分確定申告するんだよね。反AIだもんね。大変だね。僕はAIがやってくれるならやってもらうよ。

「才能の民主化」って言い方は適切じゃないけどそういうことだよね。

「取得に時間のかかるスキルがないと出来ないことが万人にできるようになる」んだからこれは間違いなく素晴らしいことなんだよね。

これに対して「努力したことのないやつがズルしようとしてるだけ」みたいな論調が多くてビックリする。

 

そりゃまあイラストレーター拒否反応を示すことはわからんでもないけど、じゃあ機械翻訳はどうなのさ

 

あんなズルをせずに必死語学勉強しろ!だれでも勉強すれば外国語はできるようになる」とか言うわけ?そもそもその時間はなくせるならない方がいいよねって話なんだけど

ももちろんイラストレーターのみなさんは頑張って自分辞書引くんだよね。それが翻訳家に敬意を払うってことだもんね。

[] プロプライエタリAPI無料でも使うな

無料APIサービスとして公開しているとして、それに依存するコードを書いたとする

しか企業の都合であとから有料になることが考えられる

例えば翻訳API無料で公開していたとして、あとから有料になるということだ

有料になってコストがかかると、そのAPIへの依存度が高ければ高いほど、ビジネスとしての損失につながる

その損失がAPIを使う利益を上回るのである

プロプライエタリAPI依存しそうになったときは、それを自前で実装できないかまず考えろ

例えば事前訓練済みモデルであればhuggingfaceが使える場合があるだろう

損益利益を大幅に上回る場合に、huggingfaceでモデルが見つからなかったり、代替策がない場合は、関係各位に相談し「機械翻訳を使うことをやめる」ことを検討したほうが良い

 

追記: jparacrawlは商用利用が不可らしい

2024-03-18

仕事英語使ってる

英語が専門の役割ではないが、翻訳担当を置くほどリッチではないため

それぞれが社内用の翻訳サイトを使って翻訳してはドキュメント作ったりしてる

その英語がたまになんというか微妙

英語ドキュメントを読むのはどちらも非ネイティブであり

翻訳かけて読んで意味が伝われば、それで及第点なのかもしれないが

読んでてモヤモヤする

This report compares とかある

翻訳かけると日本語ではなんとなく伝わる

日本人が一切英語を読まずに翻訳かけて読むなら伝わるんだとは思う

向こうの担当者に伝わるかは知らん

機械翻訳の読みづらいサイトなどいくらでもあるのだし、中学高校文法とか要らないのかもしれない

でもモヤモヤする

2024-03-11

結局、機械翻訳スラングに敵わないのであった

未だにbadassもhypeもうまく訳せてねえし、

sickest shitなんて機械翻訳がどれほど進化すれば正しい意味で訳してくれるんだ?

まあsickest shitにおける正しい意味とは?問題もあるが

2024-03-06

どうやら「Unicorn Overlord」はすでにローカライズ問題があるようです

日本ゲームが奇妙に編集されたローカライズを受け取ったさらに別のケースでは、Unicorn Overlord が影響を受ける最新のものであるようです。

ユニコーン オーバーロード』のリリースが目前に迫っており、ファンヴァニラウェアの最新かつ最高のゲーム大作の完全版をプレイしたいと切望しています

優れたデモについてはすでに紹介しましたが、ゲームの高度に編集されたローカリゼーションに一部のファンが憤慨しているのは当然のことのようです。

この状況の完全な内訳は一読の価値がありますが、次の Twitter/X スレッド (下に表示) にも多くの役立つ詳細が記載されています

https://twitter.com/zakogdo/status/1761625443810385991

簡単に言うと、ローカライズによってさまざまなキャラクター意図が大きく変わり、その結果ゲームストーリーも変わるようです。これは本当に残念なことですが、ゲームでこのようなことが起こったのは決して初めての例ではありません。

何らかの理由で、日本ゲーム特に過度に侵略的なローカライザーの影響を受けており、存在すべきではない場所創造的な痕跡を残そうとします。

ローカライゼーションは、どんなに良い場合でも複雑で困難なプロセスであり、人々が自分役割を誤解し、翻訳独自創造的な解釈を加えようとすると、その権限はるかに超えて、彼らが取り組んでいるゲームに悪影響を及ぼします。

その点で、ローカライゼーション重要ではありますが、ゲーム開発とはまったく別の分野であり、ローカライザーが本当にゲームを作りたいのであれば、代わりに実際のゲーム開発の仕事に応募するべきです。

その間、おそらくヴァニラウェアの最高のゲームの 1 つが、ゲームを適切に翻訳するだけだったはずの人々から妨害にすでに悩まされているようです。

https://www.forbes.com/sites/olliebarder/2024/03/04/apparently-unicorn-overlord-already-has-issues-with-its-localization/?sh=76a9e3403fed

Google機械翻訳

2024-03-02

バカ機械翻訳進歩たから、もう英語とか勉強しなくていい(キリッ」

でもお前ら、インドカレーを作るのに印度カリー子のレシピを見て、

東坡肉を作るのに味の素パークのレシピを見るんだろ?

google.co.inで検索すれば、まさにインド人が作っているインドカレーレシピを見れるのにさ。

そういうとこだよ。

2024-03-01

anond:20240229235029

言ってくれたらわかるとこなら教えるで

RESTライブラリSMTPテストコード載ってたっしょ

そのままで動くで

英語からないなら機械翻訳かければいい

2024-02-29

anond:20240229090419

それなのにそこそこ綺麗だからAIイラスト評価し、AI絵師フォローするのはあまりにも不義理ではないのか。

オタクというのは目を肥やし、クリエイターに敬意を払うものだと思っていたが、もうそんな時代じゃないのだろうか。

お前は翻訳家忖度して機械翻訳を利用しなかったのか。

絵の具屋さんのためにフォトショップクリスタ排斥したのか。

郵便局飛脚存在に対してネットを使わなかったのか。

手縫い職人のためにミシンをぶっ壊したのか。

していないなら、それが答えだ。

お前の夢想する時代なんて、もとからなかったんだよ。

anond:20240229000618

戦前海軍士官学校とかでさえ三千時間かければできるようになってるからなあ

まあ機械翻訳で十分というのも選択肢としてアリといえばアリだけど

それで行けるとするなら日本人みんなバリバリ今できてなきゃおかしいけどできてないから怪しいんだよな

2024-02-27

日本の住所長すぎ問題

マイクロソフト本社

One Microsoft Way REDMOND, WA 98052-6399 USA

 

これで郵便物が届く

日本法人だと

〒108-0075 東京都港区港南 2-16-3 品川グランドセントラルタワー

英語表記すると

JAP,108-0075 TOKYO,MINATOKU,KOUNAN,2-16-3 Shinagawa Grand Central Tower

 

関西支店だと

〒530-0001大阪府大阪市北区梅田2丁目4−9 ブリーゼタワー29階

JAP,530-0001,OSAKA Pref. Osaka-SHI kitaku,Umeda,2choume,4-9 breeze-tower 29F

 

なげーよ

住所録データベースバッファオーバーフロー狙ってんのか?

 

日本一長い住所、

京都府京都市上京区智恵光院通り芦山寺上る西入る西社町(この後ろにまだ番地が続く)

Kyoto Prefecture, Kyoto City, Kamigyo Ward, Chiekoin Street, Ashizanji Temple, west entrance, Nishishacho(機械翻訳

 

からなげぇっつの

バカなの?

日本人バカなの?

日本世帯数は5000万世帯、法人やらただの建物などすべてをコードアドレッシングしたとしても数字なら12桁もあれば十分で

漢字数字を組み合わせるなら6桁もあれば十分だろう

 

「住所どこ?」

「京上西ZI8」(Kei,Ue,Sei,ZI8)

くらい短縮できる

やれよ

 

さっき郵便局から「国際郵便届いてるけど住所が切れててわからんから電話した」つーのがあったので

2024-02-26

anond:20240226084446

でもさー、言語化するトレーニング毎日60分も費やして、こんな機械翻訳みたいな珍妙日本語しか書けないのってヤバくねぇかなぁ

常に現れる効能

それを眺めてみれば分かるでしょう。

自分の物申したいことが、いきなり他人にぶつけられないような物であるということに。

2024-02-20

NOMORE無断生成AI

っていうタグを見かけた。


生成AI現在普及してる「普通の」AI って何が違うんだろうね?


今の生成AI生理的にキツいのはわかる。


じゃあ違いはなにかって考えると結構難しくて、使われてるアルゴリズムだけに注目すると、言語モデルのTransformerは機械翻訳も使ってるし、Google検索をするときにも使われてる(BERT)。画像とかのDiffusion モデルは知らない。(今どうなったか知らないけど、Transformer の画像生成モデル計算量少なくて結構いかもみたいなのは聞いた。)


これらは少なくとも使い続けてきたし、生理的なキツさはなかった(翻訳家であったりはあったと思う。あと、自分は、物心ついたときからそこにあったかイマイチわからんってのもある)。


からそこの違いってのは量的なものだと思うんだよね。量的な変化が質的な変化を生む(more is different )。


自分が、このエントリだけを学習させたとしても、その精度の低いモデルは生成AIとは言わないだろうし。


まあ、それがわかったら研究の苦労はしないか。笑


計算量だけを取ってきたりしても、モデル蒸留させるとか、そもそも計算効率の上昇とかで変わってきちゃうし。


どれが生成でどれが生成じゃないんだろうか?

2024-02-14

最近ものが読めなくなった、と感じてた

会社奨励されてる資格試験勉強のために、公式サイトオンライン教材で学習を進めるも、まるで頭に入らない

文字を追いかけているのに頭に入ってこない、何言ってるのか分からない

決して難しい話をしているわけではなく、特定サービス名前概要を覚えるだけのような試験

製品のものは使ったことがなくても、概念的には知っているはずのもので、でも読んでも読んだ気がしない

紙の参考書は目次とパラパラめくってそれ以上読む気がなくなって、

さっさと問題をこなして要点を頭に入れようとするも

問題にいきなり当たってみると、これまた何を言ってるのかさっぱりわからず、モヤモヤとした霧のなかを手がかりもなく選択肢から選び続ける

やっと1回分終えて復習と説明を読むも、解答はアです 以降の説明がやっぱり頭に入ってこない

ジャンル違いだとここまで理解が難しいのか、はたまた歳のせいか、ごく初歩的な試験にもかなりの労力が必要そうだ、と思っていた

今日用事が終わってちょっと時間が空いたので、紙の参考書を読むと…何が書いてあるかわかる

ちゃん日本語で、素直に文章が頭に入ってくるのだ

驚き、嬉しく感じた

これまであんなに分からなかったのに、何故だろうと理由を考える

問題を3回分曲がりなりに解いたことで、単語レベルが頭に入って、その効果で文としてようやく読めるようになった

機械翻訳っぽい公式サイト学習サイト説明より、紙の本の日本語が適切だった

メンタル面で余裕があった、いつもは昼休み業務後にイヤイヤながらやるも飽きてやめる、という感じ 今日勉強けがメインの時間が取れたので落ち着いて取り組めた

などなどが思いつくところ

まあ理由はどうあれ、本が読めるようになって嬉しい

この後もあまり時間も取れないし、今日はなるべく多く参考書を読み進めておきたいところ

2024-01-27

AI回避して生きるのはかなり無理そう

知り合いが反AIって感じで過激になってきた。

思想はいろいろあるしいーんだけど

自分も、全てオッケーだとは思ってなくて、学習する元データに怪しいポルノがあるのは良くないと思うし、

声優さんコピーとか、絵師さんの絵柄狙い撃ちで学習してエロ画像作るのはだめだと思う。

(↑みたいな場合現行法規制できるという説もあるね)

ただこの世の中で完全にAIを使わないのは無理だよなあ。

プログラマーの書くコードものにもよると思うけどもうガンガンAIはいってるはず。

まえも、なんかソースコードを推測してくれるインテリジェンスみたいな機能入ってたけど、

今はChatGPTが強くて、じぶんも結構全部じゃないにしろ使うんだけども、だいたいのプログラマーは使うんじゃないだろうか(ジャンルによるのかもだけど)。

そもそも、元にしろWebで調べ物して→コードをまねするって感じだったと思うんだよなあ。

たまーにまんまのコメントとか残ってるよね。ファイル選択ダイアログとかな…。

もちろん考えてかけたらいいんだけど、どっかのブログコードのまるまんまコピペよりはずっとずっと気にしなくてよくて楽だよ。

「もうAI機能が入ってるのは使わない!」っていうのは、かなり無理で、極端で、まじめにやるなら、ヴィ―ガンと同じくらいの強烈な選り好みと努力が要りそう。

機械翻訳しろ、無断学習にはよっているはずなんだよなー。創作コードは別物で、コードはいいけど絵はNGとかそういう細かいこともありそうだけどね。

すごい強い言葉使うと、揚げ足とられてたいへんそうだから、強い言葉で「絶対使いません」って言うとあぶねぇな~と思う。

WordとかパワポにCopilotとかも出てきてCopilot製はNGとか言ってられなくなると思うな。

表に機能出てなくても、そのアプリには、そのサービスには、AIがっつり入ってるねん…。

2024-01-23

anond:20240123020458

だって普通に機械翻訳使ってるやつばっかりだし

DeepLなんてWeb上で公開されてる学習元の対訳法文がそのまま出てきたってことあったから絵の生成と同じ問題あるのにな

2024-01-08

生成AIは反対って言ってる人たちの大半は機械翻訳とか自分フィールド関係ないアウトプット問題ない派なのが何とも言えない

生成AI = クリエイティブ限定って感じなのかな

2024-01-02

今後AI進化してあらゆる文章を正確かつ高速に翻訳できるようになったとしても、翻訳のもの限界は依然として残り続ける

例えばその言語に固有の「ノリ」だったり「笑い」までは訳すことができない

趣味翻訳する上でよく痛感するのが「英語で読んでるとき面白かったのに、日本語に訳した途端全く面白くなくなる」という現象

英語ジョークが大好きな言語であり、英語で書かれた文章にはたいていさりげないジョークが散りばめられている

しかし、それを日本語に訳すと意味不明になるか、ただの嫌味にしか聞こえないことが多い

日本語英語では「笑い」に対する考え方が違いすぎて、どれだけ工夫してもとにかく伝わらないのである

もちろん、法律文書事務書類といった真面目な文章翻訳ならこうした問題は起きないだろうし、機械翻訳で十分になるだろう

でも、外国語のノリや笑いを理解して、自分も同じように笑いたいと思うなら、仮にシンギュラリティが起きてAI人間の100倍の知能を持つようになっても、外国語を学ぶ価値はきっと残り続けるはずだ

2023-12-27

anond:20231227035739

「読めてない」は全然ありうると思うぞ

俺とか日本語母語者なのに真山なんちゃらのホワイトアウトの冒頭の描写読んでも書いてあることさっぱり分からなかったし

 

あと日独翻訳で食ってるプロ翻訳家のドイツ人が某深夜アニメの脚色、改悪に嘆き悲しんでるツイート日本語がめちゃくちゃだった

Amazon中国人機械翻訳レビューレベル日本語だった。ほんとに

ログイン ユーザー登録
ようこそ ゲスト さん