「音声認識」を含む日記 RSS

はてなキーワード: 音声認識とは

2020-05-22

中国半導体政策くらい、日本政策取ってくれればな

経済産業省にある中国半導体についてのレポートを読んでいたんだけどさ。

そりゃ強いよな、アメリカも本気になるよなと思う。


個々の文言日本でも見たことあるけど、投資額が違う・・・

音声認識のiFLYTEKとか、そりゃ凄い企業出てくるわ。


日本政府もこれくらい産業政策が強けりゃな。

2020-05-21

そのうちプログラム法人契約音声認識でほぼ自動で書いてくれそう

そんな気がしてならない

2020-03-05

anond:20200305110503

音声合成でしゃべるゴースト最初からいくつかあった

音声認識もできるしオッケーグーグル的なことも可能かもしれない(本体設定:音声認識/合成参照)

どっちにしろ早すぎたんだ感はある

2020-02-10

レクサス2種類に試乗させてもらったので感想を書く

・型おちといってもいいくらい古いものなのに本皮シートがくさい そのせいか酔いと眠気がものすごくひどい 

スポーツタイプ助手席ダンボールみかん箱でお風呂遊びしている気分になった(目的のわからない板と取っ手が両サイドにある)

エスティマよりベースが縦横とも広いので山あい温泉地の駐車場ギリギリ。服で外装を掃除させられるはめに。

・かならずついてる昭和NHKの正午みたいな銀色の丸い時計盤面はなんのためにあるの?松本零士メーターへのオマージュなの?ナビのGPSのほうがコンマ単位で正確だよ

テスラがOSいじって怒られてるけどそれは最新だからだ。レクサスのはOS古臭い地名音声認識siriにもグーグルマップにもまけてるし、かといって五十音入力カーソル移動が不便(新しいのは静電パネルがついてるからそうでもない、さっと地名入力できる)

振動や音やオートクルーズコントロールもっとスゴいやつ?についてはよい

・後部座席人権がない。後部座席がシートを1°も倒せないばかりか、運転者がシートを倒すときに避けようもなく足が挟まったり。後頭部がずっとリアガラスについてたり。それでいて横にもなりにくいしなー

・車ってこんなに便利になってもあいかわらず不便なんだなとおもった、ていうかきっちり座ってる姿勢人間を運ぶために特化させすぎてるんだと思う。靴下いであぐらかきたいとかおねえさんずわりとか体育座りとか正座とかが許されないのが息苦しい。尻が痛くなりそう。 空いてる電車で定刻通り姿勢をかえたり窓によりかかって寝ながら行きたいとおもった

結論普通ファミリーカー+iPhoneバンザイ あっギア連動サイドブレーキとかサイドミラーの車いるよ警告表示、あと渋滞らくちんのホールドブレーキファミリーカーにもつけてくれればそれでいいや

2020-02-04

anond:20200204232411

人間簡単にやってることほど、機械には難しい。簡単にできるってことは、進化過程最適化が、めちゃ進んでいるので。

二足歩行音声認識写像認識が最たるもので、何十年も頑張って最近マシになったけどまだ精度悪く見える。

2020-01-09

人格資源時代

なんか世の中に振り落とされないぞ!しっかり技術キャッチアップして生き残っていくぞ〜って人見かけた。そうやって肩肘張って血気盛んに吠えてるときほど視野狭窄に陥ってるのかなって思います

なんでIT技術が安定して伸びていくと思ってんだろう。まあおれも十中八九大丈夫だろうとは思うけど、伸びしろ限定的になるとみている。

中途プレーヤーならこのまま業界に居座っててもポジションあるからなんとかなるけど。

おっとIT業界の今後とかいうどうでもいい話ではなかった。

人格資源時代が来ようとしていますよ。

皆さんはYoutuberとか見てないかもしれんけど、10年前のニコニコがチンカスに思えるほど、大量のyoutuberが大量の視聴者を獲得しています

なんでこのビッグウェーブについて触れている人が少ないのかちょっとわかりません。みんなブログとかニュースサイトしか見ていないってわけでもないだろうし。

そんな水や電気みたいにみなさんの生活に溶け込んでいるものこそもっとも重視したほうが良いとお思います

なんで人格重要視されるかって言うと、要はいままでTVが独占していたタレント市場が(Youtube一強とはいえ)オープンに開かれたわけです。

こんなこと聞くと、もう何年も昔から動画サイトなんて掃いて捨てるほど合ったじゃーんって言うかもしれんけど、アホ。その「どうがさいと」に乗ってたのって結局は海賊版TV番組だろが!youtubeにはTVにない一般人投稿している人気コンテンツが上がってるんだよ。

なんでTVよりYoutube面白いのかってのは、youtube技術的に優れている!とかっていうことだけじゃなく、既存芸能業界が死にかけているというか、youtubeという新たな怪物がその市場を本格的に食い始めているわけで、TVYoutubeに対する社会一般の人々の捉え方とか見方偏見とかが変わり始めることで実現しているっていう背景があります。あるよな。私はあると見ている。

なので今まで捉えていたいわゆる「動画サイトからすでに変容しつつある。

雑に例えると、ニフティサーブLINEくらいの違いで、使われ方や求められる性質全然違っています。結局文字情報でやり取りしてるだけだから同じだろー。とはならない。

同じ技術でも使われ方によって社会的効能は変わってきます

Youtube社会に受け入れられる体制が整ったのです。

ぶっちゃけ自分ヒカキンかいう顔芸激寒野郎が人気出てきた段階で、もうyoutube終わったな。ニコニコクソとはいえyoutube文化も耐えられん糞だしそのうちユーザー投稿動画サイト死ぬ。って確信したんだけど、ご覧の有様だね。

私は考えを改めたよ。これから動画時代だよ。それも超高速の5Gによる低遅延のインタラクティブなやつな。

今もライブ配信できるけど、視聴者も雑に発話コメントしたら音声認識チャットされたりとか、変声アプリとかで殴り合う世界がすぐ目の前に迫っています

iPhoneAndroidGAFAが無くなっても、個人人格に紐付いたブランディングはずっと残るんだよ。

そこに食い込むには今からでも自分アカウントを育てておいて、市場に定着させるのが最適解でしょう。

まだyoutube動画あげてないけどな。

このへんやってる人の見解を聞きたい。(増田での質問って解答もらえないよね)

2019-09-10

anond:20190910111120

増田ml-agentsをどこまで理解たか分からんけど、

基本は「あらゆるデータハッシュ化」した後に「現実よりもはやい速度で学習させる」のがメインだからどうしても物理演算系のサンプルがメインとなってはいるが、

使い方次第で例えば音声認識だったり物体認識、またその逆も作れる

(というか機械学習系のサンプルは全部実行可能)だからml-agentsを熟すで一先ず正解や思うぞ。

寧ろ変な方向に進まずml-agentsから始めてくれ。

ml-agentsならsuccerくらいからやると発想が広がっていいんじゃないか。

2019-09-04

英会話2.0

自分場合仕事英語を使うことが日常的にある。

とはいえメールのやり取りや、書類通読、自社製品規制情報収集がせいぜいのところで、外人リアルタイム意見を交換するようなことはない。

なので、いざ外人との会話になるとサッパリだし、会議に入ると貝になり、セミナーでもちょっと込み入った話になると理解が追いつかなくなる。

そこに、Google様がリリースした(リリース自体は2月だが)Live Transcribeである

https://www.buzzfeed.com/jp/yuikashima/live-transcribe

巷間言われているように、精度がかなり良い。試しにWebinerでモニタの前に置いてみたところ、なるほどここはこう言っていたのか・・・と気付かされることが多数ある。

これなら外人がグワーっとしゃべっても、次々と表示される文字列をチラ見し、とりあえずキーワードだけを拾っておけば、置いてけぼりになることもなさそうだ。

自分は以前からキーワードだけを聞き取って、必死で会話についてくタイプTOEICもこの方法で何とかしのいでいる次第)だったので、もともとキーワードだけは聞き取れていたことが多いのだが、それにしてもAIが正確に文字起こししてくれたもの視覚情報として入ってくるのは、想像以上に大きい。

ただ、問題点はこの文字列をどこで見るかだ。手元に泥タブやPixel3を置くのももちろん良いのだが、できればチンアップした状態で聞きたい。となると、目の前に仮想現実を写すスマートグラスの出番だ。

幸いにもエプソンが出しているMoverioはAndoroidの画面を投射できるらしい。

https://epson.com/moverio-augmented-reality

こいつにPixel3を繋げば、外人と会話しながら、常に英文字幕確認できることになる。

もっと言えば、仮にMoverioに2窓を映せるとしたら、自分日本語での受け答えを音声認識させ、そいつGoogle翻訳自動翻訳させた英文を表示させることも可能かもしれない。あとはそれを口に出して読み上げればいいだけなのだから、まさにほんやくコンニャクだ。いずれ読み上げるところも自動音声が代替するようになるだろう。

そんな時代がすぐそこまで来ていることに安心し、俺は英語勉強するのを一切止めることにした。今後はTOEICの点数を競う時代ではなく、上記のようなガジェットをどれだけ使いこなせるかの勝負になるのではないだろうか。

余談:最近英文書類も「みらい翻訳」で一度翻訳してから読むようにしている。理解スピードが上がるし、英文読解で何より怖い「先入観」によるミスリードを防止できる。最近英文メールも面倒くさくなって、一度日本文をみらい翻訳英文翻訳させてからアレンジして送るようにしている。

https://miraitranslate.com/trial/

2019-08-19

音声認識型の魔法戦闘VRゲームだってSUGEEEEEEEEEEEE!!!



音声は聞いてなくて、映像しか見てないけどすげぇ。

ピカチュウ元気でちゅう 最新版

できないかな。売れると思うんだ。

Google音声認識レベルは上がってきているし

音声認識テキスト化できるのであれば、それを元にどういう動作をさせるか決めるだけだし。

とても楽しいと思うんだ。ピカチュウ元気でちゅう。

ポケGOと同じように、結構ハマる人も出るんじゃ無いかな。

自分だけのピカチュウを育てるの。良くない?

2019-07-18

イーロン・マスクがやろうとしていることが今ひとつはっきり見えてこない

AIというバズワードを交えて攻殻機動隊ハッカーみたいなことができそうに語っているが、

実際のところ脳インターフェースから入力が広帯域データだったとして、それを受け取って活用できるソフトウェア

現実には存在しないし、それをどうやって作ればいいかのとっかかりも無い。

単純に念力マウスや内話音声認識ができるだけでも便利だとは思うが……。

2019-05-16

anond:20190516162837

から、俺はアクセルペダルを2段階認証方式にして、

アクセルペダルを踏みながら、「アクセルアクセル」と連呼している間だけ、

音声認識によりアクセル機能動作する方式が良いのではと提案している。

2019-05-04

なあ、前から思ってるんだけど

Googleって実は大した技術力ないんじゃないか

2019年になってもナビは変な道案内するし翻訳音声認識もいつまで経っても進化しない

何より本業検索が「彼氏は?」「いかがでしたか?」みたいなのにずっとやられっ放しやん

ちょっと前もやれ入社しただの退職しましただの一部で盛り上がってたけど要はそんなんで嬉しがる雑魚が出入りしてるって事だろ、でかくなりすぎてもう駄目になった企業典型

あえて言おう、Googleカスであると!

2019-04-19

anond:20190419093947

知らんけどそれはソフトウェアの作り次第だろ。

siri音声認識レイテンシは1秒以内だったと思うし、認識したのを即変換エンジンに流したり変換エンジンがお休みしてる時は「え~」とか「う~」とか適当なボイスを入れておくだけで大分違うと思うぜ。

2019-04-08

これをやられたらAIに必ず追い抜かされるやつ

音声認識自然に聞き直す行為

確認ですが、○○さま?カ行の○ですね?」

これ一つで核ボタン任せられるぐらい信用度が向上する。

2019-03-19

バーチャルアバターを使った投稿システム

例えば映画感想とかライブ感想とか

文字でも良いんだけどどうにも熱量が伝わらないことがある気がする

かと言って顔出しで感想言って動画に上げるとか無理

 

その折衷案で、動画投稿したら自動的バーチャルアバターになるとかどうだろうと思った

まあ流行らんだろうが、一機能としてはありじゃないか

 

あと発言内容は音声認識させる、そしてその上で要約をかける

2019-01-23

anond:20190123092241

音声認識10年前の時点で十分実用化されてたと思うが…

知ってるか? 10年前って2009年なんだぜ?

anond:20190123092119

エシュロン音声認識自動翻訳10年前は妄想扱いだったね 

民間実用的な性能の機会がないか軍用でもできないと決めつけていた

2019-01-21

魔法現実になった世界

約700年前に書かれた玉水物語

その内容は、美しい姫君を目にして心奪われた狐が、そばにいたいと願うあまりきれいな娘に化け女中として仕えるというもの

室町御伽草子、異類恋物語に分類される中世小説である

Twitterトレンドにも乗ったように、この物語百合判断する人は多くいて、市民権を得はじめた百合という概念によかったねと微笑ましい思いがする。

男女の間では成立し得ない、女の子どうしだから成り立つ特別関係を求めるのに、時代関係ないのだということを、どっかの大学教授センター試験に取り上げることで、すっかり忘れていた日本人に思い出させてくれたのだ。

ところで狐の性別は明示されてないが、姫に一目惚れしてまず男性に化けようとするあたり、おそらく男なのだろう。このことについての会話を探すと、この玉水(狐が化けた女の子)はTS娘だ、いやそうではなく男の娘だ、という二つの派閥に大きく分かれているように見える。

だが我々はもはや一昨年までの我々ではなく、我々の手元にはもう一つの概念があってしかるべきはずだ。

玉水物語とは、美少女受肉物語ではないのか。

かわいい美少女といちゃいちゃしたい。その思いが彼(狐)を美少女へと変えた。たしかに、性別も年齢も違う少女になれるなんてことは現実にありはしないと思うだろう。むろん室町においてさえも、物語の中で、しかも狐が妖術を使うという手段をもってしか想定し得なかった。

可能なんだ。

技術進歩は、数百年前のSFとすら捉えられていなかった魔法現実のものとなした。我々は、美少女受肉することができる。

この狐のように。バーチャルだけど。

機械学習の爆進による画像認識音声認識の高速、安定、低価格化。からのfacerigやリップシンク一般化。またMMD界隈を中心に連綿と蓄積されてきた、高品質モデル制作ノウハウMMOSNSで受け継がれてきたアバター文化。もはや当たり前のように感じるマシンの処理速度の継続的な向上。そして、全てを飲み込み軋轢を生みつつ成長する中心にあるVRChat。セカンドライフの頃とは時代が一つ違う。なんと素晴らしい世界ではないか

まだ、インターネットを見渡してもバ美肉について触れている人は多くはない。そもそもバ美肉呼称すること自体が最善かも分からない。しかし確実に技術進歩していて、ちょっといいマシンが手元にあるならば、美少女になるのに必要環境はすでに整っていると言えてしまう。モデリングアシストソフトも充実してきて、極め付けでVRMというデータ形式も作られた。処理能力限界により今はセルルックが主だけれど、そのうちSaya並みのモデルにさえリアルタイムで反映できると信じている。

誰でも受肉できる時は近づいた。

バーチャルYouTuberは確実に認知度を上げてきていて、リアルタイムで動く3Dモデル世間は慣れてきている。そして既存の生身ユーチューバーパイを奪い合いながら、その一部は広義のアイドルとして活動していくのだろう。アイドルがいれば、人が集まる。近づくために受肉する人もきっと多く出てくる。

どうせそのうちみんな受肉するのですよ。そう、みんな美少女になればいい。いんや、なってください、なりましょう。私はそんな世界が見たい。さあさあなたもいざ受肉

700年を経てやっと現実のものとなった、美少女になれる世界の前途を祝って。

2019-01-20

[]サバの水煮パスタ

はいどーも。寒い日が続きますが体調は大丈夫ですか?ちょっと元気がないときにぴったりなイタリアンレシピのご紹介です。それでは、いってみよう!

まずは材料説明からです。

材料

パスタ250g

玉ねぎ1/2個

しめじ1パック

・さば2匹

にんにく 1かけら

とうがらし 2個 輪切りにする

オリーブオイル

サラダ油

昆布つゆ

・塩

コショウ

さばは新鮮なものだととてもおいしいです。

用意する機材

圧力なべ

・寸胴

フライパン27cmくらいの大きいもの

siriが使える端末

作り方

1 さばをお湯で洗います。お湯で洗うと生臭さが取れます

2 さばを圧力なべに入れ、さばつかるくらいまで水を入れますネギの切れ端とかあったら、入れるとさらによいです。

3 塩を小さじ2入れます

4 圧力なべを使い煮ます圧力がかかり、安全から減圧が始まったら、火を弱火にします。50分から60分煮ます。骨まで食べれるようになります温度が下がるのを待ってからふたを開けます

5 寸胴に水を入れ沸騰させます。塩は大さじ1ほど入れておきます

6 水が沸騰するまでにたまねぎを薄切りにスライスにんにくは根と芽を取り、繊維を切るようにスライスします。

7 水が沸騰する少し前にフライパンをあたためはじめ、サラダ油を大さじ1入れます

8 フライパンを弱火にして、にんにく唐辛子を半分入れ、風味を油に移します。

9 寸胴の水が沸騰したら、パスタを入れ、siriに向かって「タイマー9分」というと9分をカウントダウンしてくれます。「hey!siri」と無理に外国人っぽく語り掛ける必要はありません。淡々目的を伝えましょう。はるか太平洋を越えてカリフォルニアにあるサーバーまで無駄通信して(諸説あります要出典)、音声認識認識した結果に基づいて時計アプリを起動、さらカウントダウンで9分に設定される命令が出されるという仕組みに思いをはせておきましょう。まれsiriの機嫌がいいと「私もカウントダウンするのが好きです」と言ってくるときがあります

10 フライパンの火力を上げ、たまねぎしめじ、残りのとうがらしを入れてふたをして蒸し焼きにします。

11 少ししんなりしたところで、さばを入れます

12 さばは箸でほぐして食べやすサイズします。

13 さばの水煮のゆで汁をお玉で3杯入れ、9分のタイマーが発動するまで待ちます

14 9分経過したら、火を止めて、パスタフライパンへ移します。

15 パスタのゆで汁をお玉で1杯入れます

16 昆布つゆを大さじ1入れますコショウを適量入れます

17 火を弱火にします。

18 オリーブオイルを大さじ4入れます

19 フライパン前後を動かしながら、オリーブオイルスープを箸で混ぜて乳化させますミルキーな白い状態になるまで混ぜます

20 盛り付けて完成です。

ということで、さばの水煮パスタの完成です。料理が苦手なあなたもこのレシピパスタ名人です。Apple社siriナイスサポートでしたね。お時間がない人は値上がりしたさばの水煮の缶詰を使うことで90分以上の時間短縮をすることができます。それでは、よいパスタライフをお送りすることをお祈り申し上げます

ではではー。

2019-01-10

オーケーグーグル、さっきかけたアルバム最初から再生

ハイ、B'zノ『もう一度キスしたかった』デスネ」

違います

アクティティ見ると音声認識自体は「さっきかけたアルバム最初から再生」になってて合ってるんだけどな

GoogleHomeのとこがへちょいのか

ログイン ユーザー登録
ようこそ ゲスト さん