はてなキーワード: ナレーションとは
海外:https://www.youtube.com/watch?v=GPWxcTOJfR0&ab_channel=Thoughty2
日本:https://www.youtube.com/watch?v=5iTmMvGAOU0
クオリティの差は言うまでもない
海外は動画やアニメーションをふんだんに使用して理解しやすく没入しやすい配慮がなされている。ナレーションも上手いし堂々としていて聞きやすい
一方日本は静止画中心で、何のために動画メディアを使っているのかわからないような編集
霊夢と魔理沙のいい加減うんざりするようなクッソくだらない茶番劇をいつまでも擦り続け、化石レベルの音声合成技術を使用しているゆっくりボイスは壊滅的に聞き取りにくい
こんな低レベルな動画フォーマットが氾濫してしまったせいで日本のYoutubeは未だに石器時代レベルの動画を量産し続けている
簡単な、切り貼り、BGMナレーション追加、テロップ挿入をWindows10付属のフォトでやっていて
テロップの挿入位置が自由にできないのでなんか他にない?と問い合わせ。
有料でもいいらしいが、あまり知見が無い。AviUtilとかで止まっている。Premierは恐れ多い。触れる身分にない。
自分ならDavinciを使ってなんとかできそうなんだが、UIがばかちょんじゃなさそうに見える。どうなんだろう。
MS純正というか買収してきたClipChampを見つけたので試すが、重すぎる。CPUが起動しただけで100%になった。
5分程度のHD動画を編集してみようと試すが、読み込みの時点で固まる。Davinciならすぐ編集できるのだが。
美術館の絵わからない、感想で「すげー」とか言えばバカにされるから言わない、ってやつバズってたけど、最近の美術館普通に作品の横に解説貼ってあるし、解説音声サービスあるし、なんなら芸能人がナレーション吹き込んでたりしてそれ自体もエンタメ化していたり。作品の制作意図や時代背景わかったらホホーンってなるよね。それをブコメの「情報を食っている」と言われたらそうかもしれないけど、相手(作品や作者)の人となりを知ることって単純に嬉しいじゃないですか。
背景何も知らずに作品単品だけで楽しめるものは素晴らしいけど(例えばクラシックも含め大衆音楽だとその傾向は高いと思う)、作品ってその背景や制作意図までコミコミのものじゃないですか?あるいは、背景知らなくても楽しめて、背景知るともっと楽しめませんか。
(作家やミュージシャンのインタビュー記事、読みますよね。あれと同じ)
なので美術館行ったら作品の解説は読むなり聞くなりした方が面白さが上がるし、現代音楽なんかは特に作曲者の解説読むと面白さが桁違いに上がるので是非読んで聞いてほしい。
何も情報入れず、生まれ持ったセンスのみで第一印象で"わかって"しまう人がすごいとか、わからない自分は駄目だとか、そういうのは無しで。
『ジョジョの奇妙な冒険』に登場する究極生命体カーズは、火山の噴火により宇宙空間に吹き飛ばされて「宇宙空間をさまよう」とされている。
このカーズの「さまよい」について読者の認識は2つに分かれることがわかった。
地球の周囲を漂っていると考える人は、カーズが火山の噴火で真上に打ち上げられたという設定から、地球の重力圏内に留まっていると推測している。
また、カーズが考えるのをやめたというナレーションから、彼は自発的に活動することはできないが、いつか外的要因により地球に戻ると考えている。
地球から離れていっていると考える人は、カーズが宇宙空間に吹き飛ばされたという表現から、地球の重力圏を脱出したと推測している。
ほらよ https://www.eirin.jp/img/classification.pdf
映倫は次の方針で作品を個別に審査し、年齢層別に設定した「区分」のいずれかに分類するに際しては、以下の要領で行なう。
② 各場面でどのような題材が用いられ、それが映像の流れの中でどの程度まで刺激的、又は抑制的に描かれているか。
③ 作品の全体像が観客にもたらし得るメッセージ及び心理的な効果などを総合的に判断する。
(1) 表現の度合い
① 描写の仕方 直接描写による明示、又は間接描写による暗示、もしくは言語による言及。
② リアリズムの度合い 迫真感・臨場感の程度。リアルな描写、又はコメディ、ミュージカル、ファンタジー、アニメーションなどの様式的・人工的な描き方。
③ 印象度 描写の詳細さ、長短、場面における頻度と全体の回数。大写し、長廻し、又はフラッシュ・カット、ロング・ショット、ソフト・フォーカスなどの使い方。
(2) 文脈
審査にあたっては各場面における映像、言語、音声の視聴覚的な流れの中で、ストーリー展開上の必要性、必然性などを考慮する。文脈の判断には以下を含む。
それこそ「タイヤも嫌いじゃない」とかさ、声優の子だと「わりとナレーションとか司会とか嫌じゃなかったな」とかいうのがあると思う。「名前出せないけどエロゲの仕事とか悪くないじゃん」とか。
最初は好きで始めたわけではなくても、やってみると案外嫌じゃないのがあるんだよね。それを集めると「好き」とか「強み」になると思う。
Webエンジニアでも天才的な発想力があるとか、最新の技術をキャッチアップしてかっこいい実装ができるとか言うところの競争は激しいけど、案外「地味なバグフィックス嫌いじゃない」「ドキュメント作り苦にならない」「チーム内の揉め事で凹まないメンタルの持ち主」みたいな人が結局強いように思う。
ゲームカタログのクラシックスコレクション使ってストリーミングでps5でプレイした
でもリトライがボス直前からとかで割と親切だったから耐えられた
ストーリーモードも1本道で各ステージでキャラ固定だからまったく自由度ない
ステージは21個しかないのに同じマップ使いまわしてるのが結構目立った
あんま金かけてねーなって感じがした
まあ舞台同じだしってのもあるし、海外製ってことでいろいろ前知識すっとばした芝居がかった話がずっと続く
日本語で話してるのにまったく内容が頭に入ってこない
ほとんどナレーションとエジプトの壁画みたいなので進むからつまらんのも悪いと思う
よーわからんけどトロイ戦争っつーことはイリアスオデュッセイアからつまみぐいした感じなんかなー
ザコもクソ強い
実質無料、もしくは今の中古価格300円くらいなら許せるかなって感じ
なんも考えずに連打して四角と三角の押す回数くらいしか意識したくないのに、光るタイミングでコンボするとか盾くずすとかめんどすぎ
戦国無双5の盾思い出したわ
変なビームとかはでないけど結局ゴッドオブウォーみたいに神様やら精神世界っぽいのやら出てくるからリアリティラインが中途半端
社会に丸投げする前にそれぞれのご家庭でセックスについて話し合おう
(自宅で寛ぐ母親の元にポルノ女優と男優が訪ねて来る。困惑する母親)
女優「あなたの息子さんが色々なデバイスでわたし達のことを観てるの」
女優「わたし達のビデオは大人向けなんだけど、あなたの息子さんはまだ子どもでしょ?」
女優「わたしたち(ポルノの中では)性同意の話とかしないものね。いきなり始めちゃうから」
女優「そう!」
ガシャン!
突然のポルノ俳優の来訪に気づいた少年は驚きのあまり皿を床に落とす
女優「はーい!マット」
母親「(落ち着いて、サンドラ) (どうしたらいいかわかっているでしょ)」
母親「(固まっている少年に向き直って)じゃあマットそろそろ話をしましょうか」
母親「ネットで見るものと現実のお付き合いがどう違うか。良いとか悪いとかではなくて (“No Judgement”) 」
ナレーション:ニュージーランドでは多くの若者がポルノでセックスを学んでいます。
ナレーション:“リアルが大事” 相談は政府のこちらのサイトまで
Keep It Real Online - Pornography
https://www.youtube.com/watch?v=6c3Edm8NdGs
https://www.keepitrealonline.govt.nz/
論旨
無断で数千人の声優を学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセントも不安定で「演技泥棒」には程遠いです。
最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。
音声合成の学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います。
演技というものは台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います。
文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。
文章で想定している(文章を構文解析することによって得られる)読み方と、音声における実際の発音が異なる場合があります。
音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパスの文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります。
加えて、現在の音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。
上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体がデータに適さない場合もあるため、それらの選別も必要です。
音声合成用に収録された音声コーパスであれば、読み方やアクセント、ノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。
このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります。
AIイラストの成功には、イラストへの人力でのタグ付けが寄与していることはよく知られていますが、果たしてAI音声という分野において人力による音声コーパスの整備が進むでしょうか?
AI音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています。
また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています。
AIイラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合、データの提供者たる声優と相互理解のある関係を保ちつつ発展してきたことを強調しておきます。
もともとナレーションの分野においては、既に十分な品質の音声合成ソフトが存在します。
AIイラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています。
そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAIイラストほどの脚光を浴びるとは考えづらいです。
しのけんっていう、登録者70万人のグルメ/大食い系Youtuberがいる。
俺はこいつが嫌いだ。理由は3つある。
物撮りというのは、テレビの料理とかグルメ番組だと絶対にある「料理を真ん中に置いた構図の静止画」のことだ。もちろん料理が作られてる工程とか、タレントが食べてるシーンも大事だけど、これが一番大事だと思う。タレントがそれを見て「おいしそ~」とか、ナレで「これでお値段なんと…」とか言うのがエンタメには必要だ。演出としても効果が高いだろう。
しのけんはこれをやらない。開幕から、料理をテーブルの上に置いて、テーブルをはさんでしのけん本人が正面から映って、料理を食べる構図でずっと映り続ける。たまにしのけんが皿を持ってカメラの前に寄せて見せてくることはあるが全く美味しそうに見えない。バカか?
しのけんは食べている映像から音を全部カットして、後付けしたBGMとナレーションだけで動画の音を構成している。
料理動画において、ライブ感というか、肉が鉄板や網の上で音を立てて焼ける様というのは重要な要素だと思うのだが、しのけんにはこれが全くない。
先述した物撮りがないことと合わさって、料理が本当においしくなさそうに見える。
先述したが、しのけんの音声はすべて後付けで、味の感想も後付けでナレーションされるだけだ。それに加えて、語彙も美味しい!とか柔らかい!以外になくて、視聴者の興味を失わさせる。
ある動画で「(ステーキの焦げ目だけで)ご飯3杯いける」とか言い出した時は本当にバカかと思った。しのけんのご飯3杯は普通の人の大さじ1杯と同レベルだ。
以上の3つの理由で俺はしのけんが嫌いだ。じゃあ見なければいいじゃんというのは本当にその通りだが、この飽食の時代で、ここまで味に興味がなさそうにただ料理が皿から胃に移動させられるだけの動画に70万人も登録者が居るとちょっと文句を言いたくなる。
しのけんっていう、登録者70万人のグルメ/大食い系Youtuberがいる。
俺はこいつが嫌いだ。理由は3つある。
1.物撮りがない。
物撮りというのは、テレビの料理とかグルメ番組だと絶対にある「料理を真ん中に置いた構図の静止画」のことだ。もちろん料理が作られてる工程とか、タレントが食べてるシーンも大事だけど、これが一番大事だと思う。タレントがそれを見て「おいしそ~」とか、ナレで「これでお値段なんと…」とか言うのがエンタメには必要だ。演出としても効果が高いだろう。
しのけんはこれをやらない。開幕から、料理をテーブルの上に置いて、テーブルをはさんでしのけん本人が正面から映って、料理を食べる構図でずっと映り続ける。たまにしのけんが皿を持ってカメラの前に寄せて見せてくることはあるが全く美味しそうに見えない。バカか?
2.ライブ音声が全くない。
しのけんは食べている映像から音を全部カットして、後付けしたBGMとナレーションだけで動画の音を構成している。
料理動画において、ライブ感というか、肉が鉄板や網の上で音を立てて焼ける様というのは重要な要素だと思うのだが、しのけんにはこれが全くない。
先述した物撮りがないことと合わさって、料理が本当においしくなさそうに見える。
先述したが、しのけんの音声はすべて後付けで、味の感想も後付けでナレーションされるだけだ。それに加えて、語彙も美味しい!とか柔らかい!以外になくて、視聴者の興味を失わさせる。
ある動画で「(ステーキの焦げ目だけで)ご飯3杯いける」とか言い出した時は本当にバカかと思った。しのけんのご飯3杯は普通の人の大さじ1杯と同レベルだ。
以上の3つの理由で俺はしのけんが嫌いだ。じゃあ見なければいいじゃんというのは本当にその通りだが、この飽食の時代で、ここまで味に興味がなさそうにただ料理が皿から胃に移動させられるだけの動画に70万人も登録者が居るとちょっと文句を言いたくなる。