「音声認識」を含む日記 RSS

はてなキーワード: 音声認識とは

2024-11-07

ChatGPTは法律にも詳しい

GPTの性能が著しく向上している。最近では希望する類似裁判判例検索させると、瞬時に何件も調べあげて、どこが類似しているかを瞬時に提示してくる。結果をまとめて、反論資料作成しろと命じればそれも瞬時に作成する。誤字脱字もない、校正自分でやってしまう。もしかして、これに音声認識リアルタイム反論を出来るようにすればAI弁護士爆誕するんじゃないか

2024-11-05

AIは凄く進歩しているのにOCRの精度が悪いのどうして?

いつも便利に使っている中で不満に思うことが一つ。

OCRの精度が悪い事。

描かれた絵や写真認識は向上したし音声認識も向上しているのに、事務処理に重要文字情報認識が悪いままで困ってる。

スキャンして作られたpdfを読ませると全然ダメ

直に出力した画像認識はマシなので恐らくだけど解像度が影響しているように思う。

とはいえ解像度が低い画像補正して認識するのに、小学生でも読めるような文章ですら読み取れないのは不思議すぎる。

何か特別理由があるんだろうか。

2024-11-04

にじボイス(旧DMMボイス)はエロゲー学習している

注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はありますあくまで推測です。

追記24/11/20

DMMボイスという名前からにじボイス」という名称に変更された。主な変更点は以下。

それ以外は本記事の内容はすべて当てはまるので、以下「DMMボイス」となっている箇所は適宜「にじボイス」へ読み替えて呼んでほしい。

DMMボイス(現にじボイス)

最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス

https://nijivoice.com/

それの学習元に、エロゲーテキスト音声データが使われているのではないかという話。

まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。)

追記

何故か音声合成できない文字列

現時点では何のフィルターもなく、どのような卑語卑猥セリフも発話させられる。

ただ、ある特定雰囲気パターンのみなぜか音声合成させると吐息のようなものになり、入力文章からかけ離れてしまう。

それは「ちゅぱちゅぱれろれろ」だ。

他にも、例えば「んじゅぷんくっちゅぱ……じゅ……れちゅはぁ……」「ちゅぷぷっ、んちゅぅ……ちゅくくっ、むちゅぅ……ぢゅるっ、ちゅちゅぅっ」等を試してみてほしい。

ひらがなですべて書かれているので、発音は明確にはっきりしているはずだが、それでもなぜか発音できず吐息のようなものとなる。

一方で、並びはそのままのまま「ふゅととっ、んびゅぅ……こゅねねっ、むびゅぅ……ぞゅけっ、たゅたゅぅっ」「にゅべべっ、おにゅぅ……にゅけけっ、めにゅぅ……づゅれっ、にゅにゅぅっ。」等は、きちんと文字通り発音される。

さらに、単純に全てカタカナにして、「チュパチュパレロレロ」にしてもきちんと発音される。またちょっと並び替えて「ぱちゅぱちゅろれろれ」発音される。その他、適当意味をなさな「ちゅかちゅほぱれもふい」等のランダム文字列にしても発音される。

他にも、私が試してみた限りでは、上述の謎の雰囲気テキスト群以外の文章はほぼ正確に文字通りに発音される。

以上のことから学習データには「ちゅぱちゅぱれろれろ」やその他の上記例のような特定雰囲気セリフに対して、「その文字の通常の発音通りでないような音声」対応しているようなデータが使われていることが推測される。

念の為に書いておくと、音声合成学習にあたっては、音声その音声が何を喋っているかというテキストペアを、大量に学習させる。)

余談

技術的なことなので読み飛ばしてください。

余談であるが、カタカナの「チュパチュパレロレロ」は発音できるがひらがなの「ちゅぱちゅぱれろれろ」は発音できないという事実からは、古くから音声合成での「日本語文章→音素列(簡単に言えば読みのカナ列)→音声」という流れの単純な音声合成だけでなく、元の日本語から情報音声合成入力していること推測できる。

元の日本語テキストに対して、その音素列に加えて、大規模言語モデルエンコーダーモデル、いわゆるテキスト埋め込みも音声合成テキストエンコーダ部分へ注入するというのは、近年の感情豊かな音声合成界隈での一つのトレンドである

音声合成にあたりAIが「発音の仕方」だけじゃなくて「セリフ意味」も理解する、というわけである

例えば「ちゅぱちゅぱれろれろ」も、単独では正常な発話ができないが、はてなは、匿名性を活かした自由表現可能となる場として、ちゅぱちゅぱれろれろ、はてな匿名ダイアリーをご利用いただきたいと考えております。」等に文中に紛れ込ませると正常に発話ができること、また文章全体の示す感情によって途中の声音テンション等が変わること等も、これらの帰結である

エロゲーのチュパ音

さて、我々は「れろれろれろ……ちゅぱっ、ちゅぶっ……んちゅ、れろっ……ぺろ、ぺろっ……んちゅぅ」のようなテキスト文字通りの発音対応しない、そのような状況を知っているはずである。そう、エロゲーだ。

エロゲーにはチュパ音という文化がある。これはヒロイン主人公フェラチオをするシーンで、ヒロイン声優がそのおしゃぶりシーンを汁音たっぷりに演技をするものである

そこでは、「あぁむ、じゅぶ……じゅぽじゅぽ……ちゅるっ、ちゅ、ちゅっ、ちゅぅぅぅぅ……んっ、んっ、んんっーー!」のようなテキストに対して、そのテキストの通常の文字通りの発音からはかけ離れた、しゃぶりまくり音出しまくり啜りまくりの演技が音声として与えられる。

よって上記挙動からDMMボイスの学習元の少なくとも一部には、エロゲーから抽出したデータが使われているのではないかと推測することができる。

学習元としてのノベルゲーム

界隈では有名な事実だが、エロゲー(R18に限らずノベルゲー一般からは、1本だいたい(ものによるが)20時間程度の音声とテキストの両方を(多少の知識があれば)大量に抽出することができ、音声合成音声認識等の音声に関するAI研究においては非常に貴重なデータとなっている。

よって、大量の「テキストと音声のペア」が必要音声合成では、特に表に出ないアングラなところで、ひっそりと学習に使われることが多々ある。また特定声優の声を出そうという意図はなくても、いわゆる音声AIの事前学習モデルとして、すなわち日本語発音の仕方をAIが学ぶとき必要な大量の音声データとして、そのようなデータを使うことは、一般的とまでは言わないにしても、あることである

ましてやDMMであるエロゲープレイヤーならば、近年の衰退しつつあるノベルゲー文化はかなりの部分をFANZA依存していることをすでに知っているだろう(いつもお世話になっております)。

聞き覚えのある声

以上のような理由から私はエロゲーが少なくとも学習データに含まれているのではないかと推測したが、そもそもきっかけは、それより前に、単純にいろんなキャラ音声合成させて遊んでいたら、

少なくとも私の耳には「あれこの人あの声優じゃん?」というキャラが何人かいたかである

久世凛さん(くん?)の人はたぶん声優として有名なあの人だし、ノエラちゃんとか多分一般でも最近いろいろ有名なんじゃなかろうか?(元エロゲー声優出身それから表に出てきて大成功していることで有名)

月城 美蘭ちゃんキャラは某シリーズの某キャラめっちゃ好きです。

他にも声優に詳しい方だったら、誰の声か分かるキャラが数人はいるのではなかろうか。

なぜか最初「ん」発音されない「おちんちん

さら実験を重ねていると、エロゲー学習使用されていると推測されるもう一つの事象発見した。

それは「おちんちんという単語を含んだセリフ音声合成させると、不自然に「おちちん」の1番目の「ん」がきれて「おちっちん」のように音声合成されるという現象である

(実際は「おちっちん」ほど極端ではないが、明確に2番目の「ん」の音が通常の発音よりもかなり弱く、不自然に途切れた印象の発音になっている。「おちんつん」等にして比較するとより違いが明確になる。)

このことから、「おちんちん」という単語がそのまま発話されないデータ学習元に多いのではないかと推測できる。

エロゲープレイヤーならば知っているだろうが、大半の商業エロゲーでは規制から「おちんちん」という文字は「おち○ちん」と伏せ字になり音声ではピー音が入る。

このような音声の内部の音声データは、伏せ字部分が抜けて発音されていることが多い(ピー音がそのまま入っているものもある)。

このことも、エロゲーの音声データDMMボイスの学習元として使われているという推測を支持している。

膣(チツ=ナツ=ナカ)

追記ブコメ等で、「」がなぜか「ナカ」と発音されるという現象の報告が多くあった。また試すと「ナツ」と発話されることも多い。これについて、私よりも音声学に詳しいであろう増田の観察があったのでリンクを貼っておく: anond:20241105060042

端的に言うと、データセットに「膣内に出して……!」等のセリフで「ナカに出して!」と発音されていることが多いことから本来の読みである「チツ」と「ナカ」との混乱がテキストエンコーダ部分で起きた結果の現象だと推測される。

引用になるが「膣はあけぼの。膣は夜。膣は夕暮れ。膣はつとめて。」音声合成させてみるのを試してみるとよいだろう。

DMMボイス側の公式文章

DMMボイスに対して学習元等の問い合わせをしている人たちが数人はいるようで、開発者サイドのそれに対するリプライ文章から抜粋する。

https://x.com/1230yuji/status/1852914053326483685

音声学データは音声データ大量購入機械合成、収録で取得しています。具体的な情報企業秘密にあたるため開示できません。」

ここで「音声データ大量購入」という箇所がひっかかる。そう、界隈にいれば知っている人が多いだろうが、音声とテキストペアデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。

さらにまた、DMMボイスはアニメ調のキャラクター音声合成が売りである。そのようなデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。

まり、ここでの大量購入エロゲー大量購入を指しているのではないかと推測することができる。(もしくは、少し前に触れた、すでに公開されているそのような音声データセットから流用したか)。

利用規約

追記となるが、DMMボイスの利用規約自体が少しおかしいのではという議論を提起している動画があったので紹介しておく: https://www.youtube.com/watch?v=tkBGBVjOIZk

(以前ここで第8条1(1)について書いたいたが、この文言自体利用規約一般的なもののようだ、申し訳ない)

法的な議論

音声AIについて昨年5月あたりから品質が大いに向上したことで、AIカバー声優音声の無断学習等の文脈で、様々な議論が発生している。最近では有名な声優たちがNOMORE無断生成AIというスローガンで大々的に活動している。

https://x.com/NOMORE__MUDAN

これは、声優たちが、自分たちの声が無断でAI学習使用され、その上で収益化をされていることに対して反対して展開している運動だ。

(この運動に対する是非等の意見は私は持たない、最初に述べた通り私はどちらかというとAI推進過激派である。)

また、このような運動がおこる背景として、(イラストでかなりバトルが発生しているが、)AI学習における「声の権利」との法的な取り扱いが現状の法律だと不明瞭な点から法律とくに著作権に訴えることでは現状の使われ方に対して法的措置を取りにくいところにある。

このようなAIと音声の権利については最近の柿沼弁護士記事が参考になるので詳しくはそちらを読んでほしい。

https://storialaw.jp/blog/11344

私自身は法律専門家でもなんでもないので法的なあれこれについて述べることはできないが、理解している範囲で述べる(間違ってたらすみません)。

音声AIの法的議論ではパブリシティ権という概念重要になる。これはざっくり言うと、有名女優肖像勝手商品宣伝に使ったりすると、その女優が得られたであろう広告収入が奪われたことになるのでダメ、という感じのものである

このパブリシティ権現在日本法律の文面では明文化されておらず、どこまでがパブリシティ権にあたるのかということについて、特に音声については、未だ判例がなくはっきり分からない。

しか有名人の氏名についてはパブリシティ権は認められているので、もしDMMボイスが、「あの人気声優○○さんの声で音声合成できる!」としてこのサービス提供していたら、正式契約を結んでいた場合に得られたであろう声優利益のことを考慮すると、声優の許諾がない場合ほぼ確実にダメだと思われる(判例待ちなので断言はたぶんできない)。

だがDMMボイスは、学習元の20人分の声優が誰かや、またその声優からの許諾を得て20人分の声優を使っているかを、うまい具合に言及を避けている。

声優好きな人は声のみからその声優が誰であるかを判定することができる人も多いので、そのような場合に、声優名を伏せていたとしてもパブリシティ権侵害にあたるかは、おそらくかなりグレーで判例待ち事案である

そのような意味で、このDMMボイスは(もし裁判等や運動が起これば)音声AIと声の権利に対する法的な解像度を上げ議論を起こすのに貢献する事例になるであろうことは間違いない。

意見

何度か述べている通り、私はAI推進過激派寄りの人間であり、NOMORE無断生成AI等の、最近声優たちやアンチ生成AI人達による運動に対しては、事態注視しているだけの中立的(むしろ逆にガンガン生成AI使っていこうぜという)立場である

また今回のDMMボイスの公開や今後のサービス展開に対しても、ことさらそれが悪いことだとか、そのようなものは避けるべきだとか、については思っておらず、むしろ「いつか来るだろうなあと思っていたものを大きい企業がようやく出してきたかあ、これで法律や声の権利についての議論判例が進むかもな」といった程度の感想である

(そしてDMMボイスのような技術可能なこと、また実際にそれを学習させてみて個人で楽しむことは、私自一年前くらいからずっとしており、そこから音声AI界隈をウォッチしていた。)

しかし、最近声優サイドの運動や時流を見ると、せめて生成できる20人分の声優の許諾を取っているかについて言及しないままでは、アンチ生成AIサイドの批判の格好の的になるだけなのではないかと感じている。

技術的なことになるが、最近の音声AIでは、実在する声優の声から学習させて、しか音声合成する際には非実在人物による声音音声合成可能である(例えば声優二人の中間の声等)。

それが権利的や法的や倫理的にどうか等は置いておいて、DMMボイスは少なくともそのような措置を取るのがよかったのではないか個人的には感じている。

(ただ、私の耳が悪いだけで、ホントは「この人の声だ!」と思ったキャラクターは実は全然そうじゃなかった可能性もある。しかしこの「「誰が喋っているかが明確に100%には断言できない」ところが音声AIと声の権利議論の難しいところである。)

他のありえる可能

公平のため、最後に「ちゅぱちゅぱれろれろ」が発音できない現象について、エロゲーDMMボイスの学習に直接使われたという以外に他のありうる可能性をいくつか書いておく。

また端的にありえるのは、他の「ちゅぱちゅぱれろれろ」が発音できないような音声AIをそのまま流用している可能である。一つ「ちゅぱちゅぱれろれろ」が正常に発話できない音声合成AIライブラリを知っているが、それはデモ動画に私の好きなエロゲーセリフが堂々と出ていたこから、それの学習元にエロゲーが入っていることはほぼ確実である

また他に、DMMボイス自体を開発する際にはエロゲーデータは使っておらず許諾を得た声優のみから学習させるが、その学習元となった事前学習モデルにはエロゲーデータが入っていた、という可能である。前に少し触れた通り、現在の生成AIには学習に大量のデータ必要であり、まず音声AI発音の仕方を学ぶために、無から正常に発話できるようになるまでには大量のデータ必要である。そのような学習は非常にお金時間がかかるため、生成AIでは「まず大規模なデータ学習させて事前学習モデルを作る」「次に、その事前学習モデルに対して、話させたい話者データで少量追加学習する」というアプローチが取られる場合ほとんどである。このPermalink | 記事への反応(18) | 07:53

2024-09-17

anond:20240917005322

ドリームキャスト画期的だったよなぁ、

据え置き機と携帯機セットだったもんなぁ、今思えば。

音声認識ゲームもやっぱりあったし。

2024-07-23

anond:20240723105543

俺はあと200年無理だと思うね。

ソフトはもうちょっといけるかな。視覚認識系と音声認識系ね。

でもそれが、意味とか概念認識系にまで行くかは怪しい。

 

というのもそこにたどり着くには、たぶん身体性が必要から

 

で、AIが使うであろうロボの身体というのが、ちょっと安くなる未来が見えないよな。

ボストンダイナミクスみたいなロボを、スマホルンバぐらい一般家庭に配る未来が来る? 

ちょっとすぐはきつい。資源問題とかもあるし。

2024-07-19

anond:20240719095517

女性金玉は、通常「卵巣」と呼ばれてるからね。しょうがいねw

ちなみに、google音声認識機能英語モードで、キンタマって聞かせると、Can you tell mom?って認識されるそうだ。10年ぐらい前の話題だがww

2024-07-18

anond:20240718161132

頑張れば作れそうな気がする

AI部分だと

オブジェクト検出+距離測定

認識+感情分析

音声認識+感情分析

言語モデル+音声読み上げ

こんな感じになるのかな

2024-06-24

anond:20240624143525

既にかなりできるよ。

コルセンなどでAI音声認識しつつ分析してて、人間に回答案を示すなんてのは製品が既にある。

チャットサポート人間相手している事になってるけど、ほとんどAI対応・回答案を提示してて、人間がそこから選んで送るだけになってる

早晩AIだけになると思うよ。

2024-06-21

DQN名と呼ぶな。IT互換名と呼べ

子供に罪はないんだからと、素っ頓狂なネーミングを素っ頓狂だと言えなくなって久しい。

すでにかな漢字変換と非互換名前で世の中は溢れかえっているんだけど、これからはその手の名前音声認識との非互換性にぶち当たる。

2024-06-13

ふとした時に出てきたアイデアアレクサでメモしている

ただ音声認識のブレがあるので後から見たときに何も意味わからんことが結構あって

飛行機を入れる」という謎のメモが見つかって困っている

2024-05-21

anond:20240521144753

呪文唱えたら格好良く魔法現象再現される科学技術ととらえれば音声認識AI3D組み合わせれば実現できるだろ

あとはやる気だけだぞ

2024-05-19

音楽検索

昔は音声認識なんてなくてさ、有線でかかった曲がなんて曲なのか知りたくても方法がなかったりしたよね

歌詞のある曲なら聞き取って検索できるけど、インストゥルメンタルだったら諦めるしかなかったり

それが流れてる曲から曲名特定してくれるアプリが出現し、今じゃスマホによっては標準機能になってるんだからすごいわよね

今日友成空ってアーティストを知ったので今から聴いてみる

2024-03-09

anond:20240309074756

社会がなんでも似非AIに置き換えられたら

音声認識的に聴き取りづらいどもりとか絶対採用したらあかんやん

そういえば、AI面接やらせサービスで、聞き取りづらい人は減点って営業の人が言ってたけど、

吃音とかどうすんだよ、と思ったんだよなぁ

というか、そもそも、それほんとにAIなの?って出来に思えたんだけどさ…

あと、あー、とか、えーと、みたいなのも聞き取りづらくなるから減点って言ってたな

聞き取りづらいって、音声認識的に?だとしたら、アホすぎないか?と…

そのうち、社会がなんでも似非AIに置き換えられたりしてな…

やってられんわ…

2024-03-08

ドラゴンボール探しの旅に出て5年が経った

残るはイーシンチュウただ一つ。

鳥山明先生が亡くなったニュースは、あっという間に世界を駆け巡った。

世界はその偉大な業績を称え、そして悲しんだ。

しかし人々には希望があった。

誰しもが彼の代表作、ドラゴンボールを思い浮かべていた。

「7つのボールを集めることができれば、我々の願いは叶えることができる。」

ドラゴンボールは本当に存在するのか。誰もが当然に考える疑問だ。

ところが彼が亡くなった数日後、とある出来事をきかっけに事態は急転する。

誰一人立ち入ることが許されなかった鳥山明の自室から、星が描かれた3つのドラゴンボール漫画に登場したものと全く同じ形のレーダーを彼の長男が見つけたのだ。

そこには漫画で書かれた鳥山明から手紙が添えられていた。

父らしいと思いながら読んでみると、そこに書かれていたのは誰にとっても驚きの内容だった。

なぜなら、そこに書かれていたのは、彼が漫画家として成功できた本当の理由だったからだ。

鳥山明ドラゴンボール出会いは彼の小学生時代に遡る。

いつものように学校からの帰りを急いでいると、道端にぐったりと座り込んでいる一人の老人がいた。

彼は、今にも息絶えそうな様子で鳥山明に語りかけた。

少年老い先短い老人の最後の頼みを聞いてくれ。

ここに探知機が一つある。とある最新製品の試作品なので見慣れないのは仕方ない。

この探知機に従って山に入っていくと一つの水晶玉が転がっているはずだ。

それをワシのもとまで届けにきてほしい。お礼は弾む。」

鳥山少年は一切疑うことのないような澄んだ瞳で言う事を聞いた。

そして老人には険しくとも、少年にしてみれば何でもないような山道サクサクと登り、岩肌の隙間に挟まっている水晶玉を見つけた。

どこかから強く投げ込まれたようにめり込んでいたが、少年が手を伸ばすとまるでそれに返事をするようにゆっくりと光って地面に落ちた。

少年水晶玉を手にすると、大急ぎで山を下っていった。

少年の手に握られている水晶玉を見て、老人は表情を激変させた。

先程までの息絶えそうな呼吸は激しくなり、目玉が飛び出しそうなくらいに開かれていた。

お礼を期待する鳥山少年から何も言わず水晶玉を奪い取ると、彼は懐からさらに6つの水晶玉を出して眼の前に並べ始めた。

お礼を貰えなかったことに不貞腐れていたものの、少年好奇心はすぐに老人の異様な姿に奪われた。

老人は興奮した様子で水晶玉を並べなが、「ついにやったぞ」「いよいよだ」といった言葉を繰り返している。

「いでよシェンロン!」

老人が突然叫ぶと、辺りは一瞬で昼のように明るくなった。

少年は急いで目を塞ぐ。

相変わらず眩しい世界の中で、静寂だけが続いていた。

老人の声が聞こえないことが気になり、やっとの思いで薄く目を開いてみると、大きく口を開けて目をかっぴらいたままの老人が見えた。

あうあうと、声にならないような音が喉から漏れている。

老人の目線の先を追うと、そこに見えたのはこちらを見下ろすように中に浮かぶ大きな龍だった。

それに驚き老人を再び目を向けるが、老人は一点を見つめたまま動こうともしなかった。

気がつくと、周囲は夜よりも暗い闇と静寂に包まれていた。

老人が何も言えないでいると、目の前の龍は頭に直接語りかけてくるような声で「さあ願いを言え」と一言だけ言った。

その声が聞こえたと同時に老人の呼吸が荒くなり、何かを喋ろうにも喉が詰まって喋れないような、そんな様子で悶え始めた。

そうかと思っていると、老人は急に立ち上がり、大きく一つ息を吸ったかと思うと吐き出すことなくそのまま倒れ込んでしまった。

目は大きく見開かれたまま、ピクリとも動く様子はない。

突然のいろいろな出来事におどろいて動けないままでいる少年の頭に、さらに声が鳴り響いた。

「そちらの人間は願いが言えなくなってしまった。お前で良い。さあ願いを言え。」

少年事態が飲み込めないまま、まるで夢でも見ているような気持ちでそこに立っていた。

そうだ。どうせ夢なのだから。そう思って少年は答えた。

世界一の漫画家になりたい。」

亡くなった鳥山明の部屋からつのドラゴンボールレーダーが見つかった半年後には捜索チームが組まれていた。

添えられた手紙には、彼がドラゴンボール出会った経緯についての漫画と、そうしてレーダーを利用して秘密裏ドラゴンボールを再度集め始めていたことに関する内容だった。

漫画が終わると、その後には自分がいつ死んでもいいように、その時はこれらのドラゴンボール長男に託すと手書き文字が書かれていた。いわば遺言状である

彼が再び何を願いたいのかまでは書かれていなかったが、「これを見つけたということは俺はもうこの世にはいないということだ。それは残念なことだが大丈夫。俺はお前を信じている。」とだけ書かれていた。

捜索チームのリーダー鳥山明氏の長男が担った。

長男秘密を守りながらも信頼できる人間を集めた。

生前に返しきれないほどの恩を受けたであろう彼の信頼できる弟子や、同じ時代にしのぎを削りあった漫画家や編集者たち5人が集まった。もちろんトリシマもいる。

はじめのうちはレーダーが一つしかないために捜索の効率はとても悪く、誰にも悟られないように慎重に進めていることもあって全く見つけることができなかった。

レーダー範囲より外の反応はレーダーの端に表示されるだけなので、水平方向に移動した時に見られるわずかな収差をヒントに距離予測して地点を絞り込んでいった。

飛行場が近くにないような場所ヘリコプターを使ったりもしたが、そうした交通手段が揃っている場所であることのほうが稀で、迂闊に他人を巻き込めないという状況も手伝っていたずらに時間ばかりが過ぎていった。

それでも地道に場所を絞り込み、一つは5,000m級の山の上、一つは1,500mの海底、一つはアマゾン奥地の原住民族に神と崇められている祭壇から、3つのドラゴンボールを集めることができた。

残りの一つは、日本とは国交のない、しかも今現在戦時下真っ只中の高い壁に分断された自治区範囲に絞られた。

鳥山家長男は、難民支援目的とした多額の資金を手に、そのために作った慈善団体代表として同行することでやっとの思いで入国を許されることができた。

そのために使った金額は、実に鳥山氏が生涯稼いだ財産の半分以上に至り、彼の行動の一つ一つが世界中で報道されてしまうことで、余計な注目を集めることになった。

どこにいてもマスコミの目から逃れられない状況は足かせでしかなかったが、支援活動の間を縫ってはレーダー確認し、やっとのことで場所を絞り込むことができた。

今、目の前には爆弾で崩れ去った瓦礫の山がある。

マスコミの目を盗み、現地のコーディネーターの反対をのらりくらりとかわしながら瓦礫の山を登る。

ドラゴンボール位置を示すレーダーの点が中心に移動し、今まさに自分の足元に埋まっていることを指し示す。

しかし、どうやって掘り起こせば良いのか、途方に暮れながらひとまず座り込むことにした。

いたずらに瓦礫をめくってみると、それはまるで当たり前にそこにあるかのように淡く光を湛えて転がっていた。

それこそが紛れもないイーシンチュウだった。

とうとう最後の一つ、イーシンチュウを手に入れた彼は、支援活動も放り投げて早々に日本行きの便に飛び乗った。

残りのドラゴンボールを持ち歩くことで万が一のことがあってはいけないし、過酷環境下で願いを叶えること自体危険だと考えていた。

他のメンバーにしてみれば、彼が日本への帰国を急ぐこと自体がイーシンチュウ発見の合図である

彼が日本に着く頃には、全てのメンバー鳥山邸に集合していた。

すぐにでも願いを叶えたい気持ちを抑えて、皆で願いを叶えるための準備を進める。

ここまで一緒に戦い抜いてきた仲間である。誰の言葉で願いが叶っても良いのだ。

焦って願いが失敗してしまうことのないように、この日メンバー全員で何度も願いの言葉練習した。

翌朝、目が覚めると外が騒がしかった。

家の中庭に他のメンバーが何かを囲うかのように集まっている。

その中心に横たわっていたのは、一部が焼け焦げてはいるがトリシマだと分かった。傍に黒く焦げたアタッシュケースが転がっていた。

メンバーたちは動揺を隠せないでいるが、リーダーである長男だけは落ち着いていた。

彼は最後までメンバーを信じていたわけではなかった。

誰かが裏切り皆を出し抜こうとしたときだけに発動する罠が仕掛けられていたのだ。

それがシェンロンをよびだす呪文である

鳥山明氏の遺言状とも言える漫画の一部、シェンロンを呼び出すシーンに手が加えられていたのだ。

正しい呪文は「いでよシェンロン!」であるが、漫画には「ででこいシェンロン!」に書き換えてあった。

そしてその呪文に連動するように、ドラゴンボールを格納しているアタッシュケースには細工がしてあった。

それが音声認識による爆弾起爆だった。

メンバーには直前に正しい呪文を教えるつもりだった。つまり、誰かが出し抜こうとして間違った呪文を唱えれば途端にアタッシュケースが爆発し、たとえそれでシェンロンが現れてしまったとしても、爆発によって願いを叶えることはできなくなるという仕掛けだった。

もちろん、位置情報によってこの建物を離れようとしてもアタッシュケースは爆発するようになっていた。

そのことは他のメンバーには伝えていなかった。

ざわつくメンバーを尻目に、リーダーである長男レーダーを元にそこら辺に飛び散ったドラゴンボールを拾い集める。

流石のドラゴンボールだ。傷ひとつどころか、汚れさえも全くついていなかった。

動揺するメンバー事情説明して、この事故自業自得であることを理解してもらう。

メンバー達は安心したような、それでいて何かに怯えるような表情をしている。怒りの表情を浮かべるものもいるがもう知ったことではない。

そんな状況を仕切り直すように「さあはじめようか」と、長男一言だけ言った。皆は無言で頷く以外になかった。

いよいよだ。

「いでよシェンロン!」

途端に視界が光に奪われる。まだ朝だというのに、真夜中に突然目の前でナイター照明を焚かれたかのような明るさだった。

少しずつ目を開けて見上げてみると、まさに生前に父が漫画で描いたかのようなシェンロンがこちらを見下ろしていた。

父の圧倒的な画力に改めてため息が漏れた。

「さあ願いを言え」

これも父が漫画に描いたシーンのように、直接頭に響くような声だった。

漫画で見ていた分、少しは冷静でいられたために周りを見回す余裕もあった。

周囲はすでに夜よりも暗い闇に包まれている。

どうやらこの周辺以外の時間が止まっているらしく、ここにいるメンバーたち以外に何かが動いているような様子や音は感じられなかった。

それならば騒ぎになることはない。焦る必要はないのだ。

メンバー達と目配りをする。

失敗しないように何度も練習をしたセリフだ。

「どうした。さあ早く願いを言え。」

その声が皆の頭に響いたのを合図に、メンバー達は同時に願い叫んだ。

ここまできて裏切りがあったのであれば、それはもう仕方ない。

また探せばいいのだ。残ったメンバーの数だけ、探し続ければいいだけのことなのだ。

そんなことを考えながら願い事を言い切ると、「たやすいことだ」という一言が頭に響いた。

周囲が光に包まれると同時に目を閉じる。

そして眩しさが去ると、辺りに喧騒が蘇ってきた。

恐る恐る目を開けてみる。メンバー全員が不思議そうに顔をみあわせる。

それぞれの表情を見比べると同時に、自分たちの願いが叶ったことを理解した。

そう。皆の頭には、今まさに脱ぎたてのようなほかほかな暖かさに包まれた小さなリボン付きの純白なパンティーが、それぞれかぶらせられていた。

偉大なる巨匠であり我が父よ。あなたの願いはこれで間違いないだろうか。

皆で何度も相談した結果、どう考えてもこの結論しか至らなかった。

今まで人類に大きな夢と希望ありがとう。どうかこれで安らかに眠ってほしい。

そんな達成感と安堵に満たされながら、リーダードラゴンボールレーダーを踏み潰して壊した。

2024-02-28

情報理論を知らん奴がプログラマーになってる問題

例えば「画像は3色で保存されてるけど、それぞれ何色か知ってる?」と聞いたら

情報理論関係無くRGBを答える人は多いと思う(たまにこれすら答えられないプログラマーがいるが・・・

ところが「JPEGって各画素に対して8bitなんだけどどうやって3色を割り振ってる?」って聞くと分からないプログラマーが多い

普段プログラミングJPEGを貼り付けるだけならこんなこと知らなくても問題無いんだが

ちょっと複雑なことをするときはこの手の知識必要になってくる

同様に「人間の可聴周波数は?」とか「それをどうやってデジタルに保存してる?」とかも知らない人が多い

こういう知識を持ち合わせずに「音声認識結果が悪いのでハイレゾにしてみました」とか言ってきたりして頭が痛くなる

他にも情報量概念を知らずに圧縮しようとしたり公開鍵のことを知らずにセキュリティに関する実装をしたりIPパケットを知らずにネットワーキングしようとしたり

基本的知識を知らずにプログラマーになってる人間が多すぎて問題になってる

幹部なんかは「基本情報を持ってたらいいんだな!」「応用情報を取らせよう!」みたいな対策をやりがちなんだが

この手の資格免許と違って一度取ってしまえば終わりなので

一夜漬けで終わらせる人がかなり多くて前述の質問に答えられない人もIPA資格は持ってたりする

普通に情報系の大学を出ていれば授業で単位を取得しているはずなんだが

大学もっとザルで簡単単位を取れてしまうので全くアテにならない

一番問題なのは知識を知らなくてもプログラミングできてしまうので

下手に経験を積むと情報理論なんかの基礎を知らないまま「優秀プログラマー」として認知されてしま

更に本人もその自覚を持ってしまってリーダー的な立ち位置になってしま

こうなると外部からの指摘を受けてもなかなか訂正しないし酷い状態プロジェクトが荒れ地になる

どうにかこの手の基本的知識評価したいんだがどうにかならないものかな

2024-01-19

「お尻洗って」と、ウォシュレットに話しかける時代が来た

https://b.hatena.ne.jp/entry/s/www.gizmodo.jp/2024/01/281368.html

なんと音声認識アシスタントとなる、AmazonAlexaまたはGoogle Assistantを搭載。

これで洗浄から乾燥まで、すべて声だけで操作できるそうです。

ウォシュレットと音声ガイドの相性は、これまでもタッチしているボタン操作内容を読みあげるみたいな機能がありました。

ですが、温水洗浄をスタートさせる「お尻洗って」や、その強弱から「お尻乾かして」まで、

自然な呼びかけでコントロールできてしま製品は、ありそうでなかったのかも。

あとスマホに専用アプリを入れて、それでウォシュレット操作するなんて使い方も可能になりそうです。

この便器絶対しゃべるよね。

肛門臭がどうとか絶対言うよね...

2024-01-05

anond:20240105030107

今日ナイス増田

そういやword音声認識なんてあったな。

論文構成と着地点さえ組めれば1週間で楽勝やん。

anond:20240105025045

2万字なら、2時間話すくらいの分量だから余裕でいける。

2週間で1年分の学費(=100万以上するでしょ)を稼ぐと思ったらやる気出ない?

・まずは5日でその本を読む。文字認識しないと言うことだけど、Google翻訳アプリダメ無料OCRツールは試した?原書読むより入力するほうが早いなら、最悪手打ち入力して翻訳にかけたら?

・1日で論文構成を考える。ここはChatGPTと相談しながらできるでしょ。

・その翌日、Word音声認識を使ってガーっとしゃべっていく。とにかくしゃべる。

・できた文を直し、切り張り切りはりして、整える。ここに2日かける。

時間が余ったら先行研究とかざっとネットで見る。それをちょいちょい引用・追加していく。(ちゃんとそれを残す=アピールポイント

やれたら自信になると思うよ。そして社会人になると、2万字くらいのレポートは1週間ももらえないんだよね。

2023-11-12

anond:20231112210420

音声認識動作認識モーションキャプチャ)でお願いしたい。

解錠するとき呪文「我が施し静謐なる我が領域を護り安寧を維持する封印よ、我の求めに応じその戒めを解き放て。我は汝の生き様を定めし管理者である。Release rock your sealed!」

施錠するとき呪文「我は我が領域を隔てる汝に命ずる。安寧を維持し静謐を保ち、再び我が求めるまで汝は封印となれ。我は汝の生き様を定めし管理者であるRock your sealed!」

これを、定められた動作(九字を切ったり腕を振ったり、小型のワンドを振ったりするのも良い)をしながら唱えるくらいしないとセキュリティ的に危ない。

玄関前でがっつり大きな声で、毎朝施錠し、帰宅するとき解錠するのかっこよくない?

2023-09-17

anond:20230917223026

これから音声認識時代だ、と思ってフュートレックの株を買ったけど、5年間で半値以下になったんだが、いつ値上がりすんの?

2023-09-06

anond:20230906110627

マイクは基本高けりゃ高いほど良いけど、それより音声認識ソフトの精度の方が大事

ログイン ユーザー登録
ようこそ ゲスト さん