「音声認識」を含む日記 RSS

はてなキーワード: 音声認識とは

2018-04-25

飛行石って

あのちっさい本体の中に

・空中浮遊機能

・方位磁針

レーザーポインター

・生態認証機能

・声紋認証機能

音声認識による呪文解読機能

ラピュタ都市との通信機能

・それらを駆動するためのバッテリー

が入ってるんだぜ?

やばい技術力だよな

2018-03-08

回転しない回転寿司未来

未来、というか現在進行形存在しているのかもしれないけれど)

回転寿司効率化を突き詰めた結果、寿司を回転させるのをやめる。

一貫単位で注文可能リアルタイムオンデマンド生産され、客席まで自動提供される。

注文は電子端末での選択式に加え、音声認識可能となる。また、注文の傾向や時期、ペース、量などを加味して商品レコメンドがなされる。

注文情報管理されており、店員が皿を数えるというような精算準備行動は不要。客は着席したまま決済ができる。

使用済みの皿や器などは、客が返却レーンに乗せるとバックヤード搬送されて全自動的に洗浄される。

客席スペースは天井高を低くすることで多階層化、高密度化を実現する。

いらっしゃいませ、ありがとうございました、などの商習慣の定型句スタンプ化・絵文字化する。

店舗清掃は機械化を進めた低価格の専門業者アウトソーシングされる。

2018-03-03

電卓珠算係の仕事を奪った時、私は声を上げなかった

ワープロソフト写植技師仕事を奪った時、私は声を上げなかった

音声認識速記官の仕事を奪った時、私は声を上げなかった

AIデータサイエンティスト仕事を奪った時、私は声を上げなかった

俺は常々言っている

働かざるもの食うべからずという価値観の転換が必要だと

この詩の最後の句は

皆働かずに暮らせるようになった

で〆ようではないか

2018-02-15

anond:20180215181934

お昼間はいいけれど、深夜はどうするのですか?音声認識できるほどの声って大きくないですか?

2018-02-04

[]お好み焼きキャベツ1/4作戦

はいどーも。

みなさん、野菜350g毎日食べていますか。忙しいと野菜350g食事に組み込むのは難しいですよね。そこで、野菜350g簡単摂取するメニューを考えてみました。名付けてお好み焼きキャベツ1/4作戦!。キャベツ1玉当たりの重さは1200g。1/4で300g。350gには少し足りませんが、一日に必要野菜摂取量の85%を一気に摂取できる画期的メニューお好み焼き野菜不足から脱出です。あとは睡眠運動瞑想さえしっかりすれば、人間に戻れるはず。ということで、お好み焼きキャベツ1/4作戦!いってみよう。

材料

キャベツ 1/4個

ちくわ 2本

・きりいか 1つまみ

・削り節(出しようの粗削りのもの) 1つまみ

たまご 2個

豚肉 100gくらい バラでも小間切れでもお好みで

小麦粉 大さじ2

作り方

0.大き目のフライパンサラダ油を入れ、温め始めます

1.キャベツを千切りにします。食感が悪くならないように、芯に近い部分や固いところはしっかりとスライスし、全体的に均一な状態します。

2.ちくわを縦に唐竹割に切り、さら小口切りにします。

3.千切りにしたキャベツカットしたちくわボールに入れ、適度にまぜますさらにきりいかと削り節を入れます

4.小麦粉たまご1個を入れ、小麦粉を全体にいきわたらせます。水は入れません。たまごキャベツの水分だけでいきます

5.適度にフライパンが温まってきているので、ボールの中のタネをフライパンに入れ焼き始めます。真ん中は少しへこませて、もう一個のたまごを落とします。豚肉をタネの上に一枚ずつ配置していきます。ここからは火加減は弱火です。弱火で裏表12分かけてゆっくりと火を通し、キャベツの甘みを引き出します。

6.キッチンタイマーで6分。計測します。「OKグーグル」とか「ヘイ、siri!」と言って、「タイマー6分」と音声認識させたほうが今風ですよね。6分あるので、お皿を洗ったり、翌朝のごはんをセットしたりと家事に使える時間が生まれます

7.6分後、直径26㎝、厚さ3㎝のお好み焼きの片面が焼き上がっておりますフライ返し2本を両手に持ち、お好み焼きフライパンの間に差し込み、手首のスナップを利かせて手前に返します。今回のお好み焼きキャベツ1/4作戦!で、一番難しいのがこのひっくり返すアクションです。初回は失敗する可能性が高いです。ますのすしの空き容器を使ってイメージトレーニングをしておくことをおすすめします。

8.肉の面が下になりました。さらに6分。計測します。まな板包丁材料を混ぜたボールフライ返しを洗ってしまいましょう。

9.6分後、直径26㎝、厚さ3㎝のお好み焼きを皿に移します。ここまできて、形を崩すのはもったいないので、大皿お好み焼きの上にかぶせて、お皿を押さえながらフライパンをひっくり返してお皿に乗せましょう。これは、7.のひっくり返すアクションに比べると難易度は低いです。豚バラを使ったときは、油が出ていることがあるので、油を床にこぼさないようにシンクの上でやると安心です。

10.最後ソースマヨネーズで味付けして完成でーす。

ということで、お好み焼きキャベツ1/4作戦!で、野菜を300g摂取を目指すの回でした。あとは、残り50gの野菜睡眠運動瞑想に気を付けて、人間になることを目指してくださいね

まったねー。

2018-01-24

anond:20180123225043

インタビューみたいに、ピンマイクに直接話してもらえば出来るのくらいわかる。

ところが、市販音声認識のは、会議のような不特定多数話者で、話者の近くにマイクがない場合は、認識できないソフトばっかりなのだ

2018-01-13

バーチャルYouTuber私感

あくま個人の感想です

本当は自分とこのブログに書きたかったけど、面倒だったのでこっちに。

 

 

バーチャルのじゃロリ狐耳YouTuberおじさん

バーチャルYouTuberの名を広めた偉大な人と言う印象

(この人現れるまで、バーチャルYouTuberと言うものを知らなかったのでこういう印象になる)

可愛いモデルにオタ声という、変なインパクトの有る人。起爆力は確かにある。

それだけじゃなくて動画内でやってることも割りとゲテモノじみてて面白かったので、バーチャルYouTuberという存在に興味を持つきっかけにはなった。

初手のつかみは良いんだけど、他のバーチャルYouTuber知ってしまうとあまり面白みを感じなくなるので、初心者用の入門といったところ。

 

輝夜

バーチャルYouTuber面白いって印象を植え付けたYouTuber

のじゃロリおじさんだけだったら色物で一発ネタで終わってたけど、続いてタイミングよくこいつが出てきたおかげで「バーチャルYouTuberって面白いやん」って印象を植え付けることが出来た

面白いのは面白いんだけど、動画数が少ない上に、中の人っぽい人の動画面白くてそっちを見るようになってしまい、結局、黎明期英雄みたいな感じになってしまった

 

首絞めハム太郎って言葉のお陰で注目が集まった感は確かにある。

 

電脳少女シロ

ヤンデレ系に見えない見た目のギャップ面白い

初見ダサい服着てんなモデルセンスないなって感じであまり注目はしなかったが、猟奇系のゲームが好きとかいう妙な性癖のせいで注目度は集まった。

ただ、見た目が。うまく説明できないがなんとなく野暮ったい。

ノースリーブ縦縞背中あきシャツとか言う妙ちくりんな格好してるせいかもしれない。

ゲームが上手いだけのオタサーの姫みたいなのかとも思ったが、声芸はちゃんとで来てるし、変な性癖持ってたりと他にない特徴がある。「順番に殴るね」

中の人クオリティモデルが追いついていない感じはする。動きや可愛さをましたほうが良いと思う

 

キズナアイ

初見だと特に特徴がない感じだが、ジワジワと面白さが分かる感じ。

初見だと「声優ラジオみたいでクソつまら動画やのォ」としか感じなかったが、各ゲーム実況リアクション見てると割と面白い

指摘されてるようにモデルクオリティが高いのも良点。ちゃんと表情作れてるんだよねこれ。

 

ミライアカリ

ノリがエロゲすぎて無理

ある意味一番存在感がない。マイクロソフト台湾Silverlightイメージキャラみたいなあまりコテコテ萌えに全振りすぎなモデルに、やってることがエロゲ公式四コマみたいな当たり障りのないキャラじみてて特徴がない。

エロゲ特有の糞つまらないギャグまで真似しなくていいと思うのだが。

萌えに振ってるけどなんか可愛いとか面白いかいう印象はしないキャラ

 

のらきゃっと

VOICEROIDでバーチャルYouTuberやると言うことは誤認識との戦いだということを教えてくれるYouTuber

モデルデザインがとてもいい。猫耳白髪ゴスロリと言うあらゆる人に性癖ド直球なモデル

まあ、モデルは良いんだけど、モーションがすごい単調。基本的前後に揺れるか左右に半回転するかだけなので。

もうちょいアクションを増やしたほうが良いかもしれない。

音声認識ソフト文字変換→VOICEROIDという過程を経て音声出力してるので誤認識がひどい。まあそれもネタにできてるので良しとしましょう

 

富士

お役所仕事感がパない

NHK枠と言われてるけど、NHKだったら流石にここまでクオリティ低いモデルは使わないだろという気がする。

しろ官庁系じゃないのかな、こんなの作るの。意思決定者が老人だから萌えにも理解がなくてこんなキャラになってしまいましたと。なんとなく地方村おこしに使われそうな印象ある。少なくとも経産省系ではないな。

歌はうまいのかどうか分からんすね。他のバーチャルYouTuberの歌聞いたこと無いんで。

 

ばぁちゃる

なんか反応に困ります普通に

頭が馬って時点で某氏思い出して無理だし

まあ、やりたいんなら勝手にやっててくれって感じ

 

ありしあ

のじゃおじ系統バーチャルYouTuber(モデル女性で、声は男)

のじゃおじでバーチャルYouTuber知った自分にとっては極めて正当に見えるバーチャルYouTuber

ただ声がキモくないので微妙ではある

なんかリアルYouTuberニコニコ生放送主とか、そういう「自分の声に商品価値がある」と思ってそうな人種のような感じがする

モデルべらぼうに可愛いんだけどね……それもニコニ立体ちゃんというライセンスのゆるいMMDの改造モデルだけど。

 

みゅみゅ

ネカマ歴32年の始祖バーチャルYouTuber(始祖鳥的な用法)

ボイチェン使用勢。モデルニコニ立体ちゃん。

他のバーチャルYouTuberには無いコメントリアルタイムバーチャル空間に表示して手に持ったり、twitterハッシュタグのついたツイートウィンドウとして表示して手に持ったり

技術的に他より一歩秀でてる感じがする

これを2017年1月段階でやってたと言うんだから驚き。でもバーチャルYouTuberではないらしい。

かなり高いボイスチェンジャー使ってるらしいが、それでも妙な感じがする(ねむよりはマシかも知れないが)。ねこますがボイスチェンジャー使わないのはこのひとのせいかもしれない(ねこますとみゅみゅは交流あるらしい)

 

YUA

服装とか初回のシチュエーションがもうエロ漫画エロゲ導入シーンみたいで無理。

巨乳は良いとして、乳揺らすのってなんかイラッとする。お前らこういうのが好きなんだろ~?シコっていいのよ?って言われてる気がして。

ちょいとしたエロ要素なら喜ばれるだろうけどここまであからさまなのは引くわ。

 

ときのそら

ギャルゲーの幼馴染枠。

特徴のないのが特徴。エヘ顔ダブルピースすると余計島村卯月っぽくなる

あいにく年下の女の子お姉ちゃんとかママとか呼んだりする趣味はないので……

 

 

余談

自分バーチャルYouTuber知った経緯は

仙狐さんの「世知辛いのじゃー」をTwitterで見る→「バーチャルのじゃロリ狐娘YouTuberおじさん」とか言うパワーワードじみた言葉を知る→けもみみVRちゃんねるへ→バーチャルYouTuberよくばりセットを見る

となっているので恐らくそれより前にバーチャルYouTuber知ってた人とは感じ方違うだろうとは思うな

クソコメ返追記

ブクマ禁止って追記したかったんだけど既にブクマされてたのでもういいや

なんか返せそうなのだけね

あおいそらちゃんのことも教えて!

え、誰

 

のじゃおじが偉大な人…?

しろのじゃおじが偉大じゃなかったら誰が偉大なんだ?

 

「おっわかってんな!」と思ったのだがのらきゃっとの「MMDモデルがとてもいい」で読むのをやめた……

意見が食い違うって悲しいことね

 

シロはあの見た目と声で物騒なゲームばっかやって物騒な発言してるのが好き

ニコニコとの相性も良く公式動画上げてくれてるからありがたい

ニコニココメントあって面白くなるコンテンツだよねたしか

 

なぜリンクを貼らないのか

え、いる?

コロプラがVRの特許ゴロだという噂が本当か検証する

コロプラ任天堂特許侵害たことに気が付かずにバーチャルジョイスティックブランド化してカプコンなどゲーム会社相手にライセンス商売しようとしていたところで任天堂訴訟されてネットを大いににぎわせているが、ここでもう一つ「コロプラがVRの特許ゴロ行為をしている」という噂が流れてきた。

増田ツイッターツイートから5chのスレにたどり着き、情報を集めると「コロプラがVRの特許をすでに120件申請している」というのが噂の原因のようだ。どうやら「en-courage」という求人サイト(自称キャリア支援団体)のコロプラのページに掲載されている情報らしい。

https://en-courage.com/2019/company/ae7765fe247a897d948bd60118461f5bcff729c207f021ddd556de17cf249b65

--

2013年:VR向けソフト開発開始

2015年:VR専門TV局「株式会社360channel」設立

2016年世界最大級(1億USドル)のVR専門ファンド設立

2016年Oculus Riftローンチタイトル世界最多リリース

2017年:「TITAN SLAYER」VRゲーム売上世界一

※なおこれまでに取得したVR関連特許数は120を超える

--

以上の年表がコロプラの実績らしいが、VR業界有数のVRハードウェアOculus Rift」の発売日時点でリリースしたタイトル数がコロプラ世界最多といっても2本同時という意味だし、TITAN SLATERがVRゲーム売り上げ世界一といってもPCゲーム売り上げ統計サイト「Steamspy」を参照してもせいぜい3700本(Steamspyは1万本以下の売り上げのタイトルの正確さは保証外)でOculus StoreやViveportなど他プラットフォームを考慮しても5000本だし、この時点でいろいろと盛り過ぎである。ちなみにHTC社のファンドも1億ドル(を複数回)の規模なので、コロプラ結構お金に余裕あるんですね。

http://colopl.co.jp/products/vr/コロプラのVRタイトル

http://www.moguravr.com/colopl-oculus-touch-vr/Oculus Riftロンチ時点のコロプラリリースタイトル

http://steamspy.com/app/528260(TITAN SLAYERの売り上げ)

コロプラはVRで既に120件の特許申請したとのことだが、はてブホットエントリにもランクインした記事任天堂に訴えられたコロプラが妙に強気な「真意」を分析してみた(パテントマスター・宮寺達也ブログhttps://tmiyadera.com/blog/1326.html)」によると「実はコロプラベンチャー企業としては異例な程に特許に熱心な会社である2013年佐竹さんという弁理士の方が入社されており、非常に特許出願を推進している。特許の数は2013年・0件、2014年・3件、2015年・6件であったが、2016年・78件、2017年・124件とここ2年で飛躍的に伸ばしている。任天堂2017年特許件数が137件なので匹敵する勢いである。」とのことであり、120件という数の特許申請はかなり多いことがわかる。

また、自称:イノベーション企業フィラメント掲載されている前述のコロプラ佐竹氏へのインタビュー記事『「特許」と「オープンイノベーション」のオイシイ関係!? コロプラ弁理士解説http://thefilament.jp/dialog/1129/)』によると

狙い目!? 課題が新しければ特許は誰も取ってないより

佐竹 ここ数年、どんどん特許を取っています。中でも、VRの分野での取得が多いですね。VRはここ数年、一気に盛り上がってきた感じがしますね。でも技術自体は何十年も前からあるんですよ。ここへきてやっと盛り上がってきたのは、グラフィックの描画レートが上がったために、ようやく見るに耐えるものになった。昔はマシンパワーが足りなくて、VRゲームなんてものは作れなかった。工場危険な設備点検シミュレーションをするためなどに実用化されていましたが、ゲームとなると、描画速度が必要だったし、操作の要素も必要になってくる。

そういうところが特許の狙い目なんです。「ちょっと前まで技術開発がされていなかった理由」が分かれば、チャンスです。ゲームでいう描画速度みたいな音声コントロールも、ここ数年のことです。Siriなんかは先行してあったけれど、簡単なことしかできなかった。あれがようやく進化してきたということは、色々特許を伴った新技術があるはずなんですよ。音声認識があることを前提にしたサービスってまだあまりありません。そこに可能性があるわけですね。

とのことなので、コロプラ佐竹氏は「VRの特許をたくさん取得している」ことを自覚していて、引用外のインタビュー内の記述によると「宝の山」だと認識しているので、「VRの特許積極的に取得しているんだなあ」ということがわかる。

前置きが長くなってしまったが、それではコロプラのVR特許をいくつかピックアップしてざっくりと見てみよう。

ちなみに増田はVR開発者気取りのワナビーですが人並み以上のVRの知識は有しているという自己認識です。間違っている箇所があればはてブトラバで指摘お願いします

前提条件として:VR知識がなくともある程度コンピュータゲームへの理解経験があれば言いたいことがわかる内容だと思うし、経験がなくともわかるように努力ます。解決手段は読まなくともよいです。特許は番号が違っても内容が複数かぶるものがありますね。特許って分割できることを今回初めて知った。

【公開番号】特開2018-7227(P2018-7227A)、特開2018-7175(P2018-7175A)

【公開日】平成30年1月11日(2018.1.11)

【要約】 (修正有)

課題仮想空間へのユーザの没入感を損なわずに、仮想空間に没入するユーザに不意打ちを与える状況を防ぐことが可能情報処理方法を提供する。

【解決手段情報処理方法は、仮想カメラ300と、集音オブジェクト400と、音源オブジェクト500とを含む仮想空間規定する仮想空間データを生成するステップと、集音オブジェクト400と音源オブジェクト500との間の相対位置関係に基づいて、音声データを加工するステップと、加工された音声データに基づいて、ヘッドフォンに音声を出力させるステップと、仮想カメラ300がヘッドマウントディスプレイの動きに連動せずに移動したかどうかを判定するステップと、仮想カメラ300と集音オブジェクト400との間の距離Dを特定するステップと、移動した仮想カメラ300と集音オブジェクト400との間の距離Dを徐々に縮めるように、集音オブジェクト400を移動させるステップと、を含む。

・例えるならホラーゲームなどでプレイヤー怪物距離や視界の向きに応じて警戒音の大きさを調整する特許でしょうかね?怪物プレイヤー距離が縮まるほど緊張感のある曲の音量が大きくなってプレイヤーの緊張感を駆り立てるとか。

【公開番号】特開2018-5610(P2018-5610A)、特開2018-5609(P2018-5609A)

【公開番号】特開2018-987(P2018-987A)

【公開日】平成30年1月11日(2018.1.11)

【要約】 (修正有)

課題直感的に視点を切り替えることができる表示制御方法を提供する。

【解決手段ヘッドマウントディスプレイ(HMD)を備えたシステムにおける表示制御方法であって、当該方法は、左眼用仮想カメラ300Lと右眼用仮想カメラ300Rとを含む仮想カメラを含んだ仮想空間定義する仮想空間データを生成するステップと、仮想カメラの視野および仮想空間データに基づいてHMDに視野画像を表示させるステップと、所定の条件を満たす場合に、左眼用仮想カメラ300Lと右眼用仮想カメラ300Rとの間の距離を変動させることで仮想カメラによって描画される仮想空間範囲Rを変化させるステップと、左眼用仮想カメラ300Lによって取得される左眼用視野画像と、右眼用仮想カメラ300Rによって取得される右眼用視野画像とをHMDに出力するステップと、を含む。

プレイヤー椅子に座った状態の頭の高さを基準として、プレイヤーが立つと視界のスケールが広くなって物体が小さく見えるようになり、プレイヤーがしゃがむと視界のスケールが狭くなって物体が大きく見えるようになる。また、移動距離スケールも比例する。子供は視野が狭い(目と目の距離が狭い)から物体が大きく見えて、大人は視野が広い(目と目の距離が広い)から物体が小さく見えるというアレですかね。後者大人子供の歩幅の違いかな。視野のスケールプレイヤーの頭の高さで変更させるVRの仕様は初めて見た。

【公開番号】特開2017-228322(P2017-228322A)

【公開日】平成29年12月28日(2017.12.28)

【要約】

課題仮想空間における操作性をより高める。

【解決手段】回転モードにおいて、制御回路部は、ユーザ操作に基づき少なくとも回転方向を特定すると共に、ユーザ操作が検出され続ける間、仮想カメラ(1)または仮想空間(2)を回転させ続けながら、HMD110に視界画像26を更新させる。

・頭の左右旋回もしくはコントローラ入力カメラもしくは空間を回転させる以上の内容には見えないんだけど、だれか詳しい人いたら教えてください。

【公開番号】特開2017-220224(P2017-220224A)、特開2017-220162(P2017-220162A)

【公開日】平成29年12月14日(2017.12.14)

【要約】

課題仮想現実の提供の際に映像酔い(VR酔い)が低減される技術を提供する。

【解決手段仮想現実を提供するコンピュータプロセッサが実行する処理は、メモリにおいて仮想空間定義するステップ(S1010)と、HMD装置を装着したユーザが傾いている方向を検出するステップ(S1020)と、ユーザの傾いている方向に基づいて、仮想空間における仮想ユーザの移動方向を決定するステップ(S1030)と、仮想空間における仮想ユーザの視界が移動方向に移動するように、HMD装置に視界画像を表示させるための視界画像データを生成し、生成した視界画像データに基づいて視界画像モニタに表示させるステップ(S1040)とを含む。

・底が丸い(鍋のような)板のコントローラの上に座るまたは足を乗せることでユーザーの傾きを検出し、仮想空間内でのプレイヤーの移動方法を決定する仕様のようですが、イメージ画像の図11と図12がどう見てもフランスの3DRudder社が開発した3DRudderそのものしか見えません。日本国内への輸入はアスクが担当しています。(https://www.ask-corp.jp/products/3drudder/controller/3drudder.htmlコロプラくんは一体何のつもりで特許申請したのでしょうか。ASKに代わって自分が3DRudderを代理販売する予定なのか、はたまた自分でハードウェアを作る予定なのか、それとも…?

【公開番号】特開2017-220219(P2017-220219A)、特開2017-220164(P2017-220164A)

【公開日】平成29年12月14日(2017.12.14)

【要約】

課題仮想現実の提供の際に映像酔い(VR酔い)が低減される技術を提供する。

【解決手段仮想現実を提供するコンピュータプロセッサが実行する処理は、メモリにおいて仮想空間定義するステップ(S1010)と、HMD装置を装着したユーザの動作を検出するステップ(S1020)と、ユーザの動作に基づいて、仮想空間を飛翔する物体の飛翔方向を決定するステップ(S1030)と、仮想空間におけるユーザの視界が飛翔方向に移動するように、HMD装置に視界画像を表示させるための視界画像データを生成し、生成した視界画像データに基づいて視界画像モニタに表示させるステップ(1040)と、物体仮想空間対象物に到達した場合に(ステップS1050にてYES)、仮想ユーザ位置対象物まで高速に移動させるステップ(S1060)とを含む。

プレイヤーの頭の向きやモーションコントローラWiiリモコンやPSMoveのようなもの)でプレイヤーワープ位置を決める特許です。VRでは酔い対策のために今だに決め手となる移動方法確率されておらず、現在最も効果的だとされている移動方法の一つがワープ移動です。プレイヤーコントローラワープ移動したい位置を指定して、ポインティングした箇所に一瞬でワープ移動するというもので、米Epic Games社が米VRハードウェアメーカーOculusの支援のもとで2015年に公開したVRデモ「Bullet Train」が最も有名な例とされていますほとんどのVRがあまり動き回らない前提のものワープ移動かの2択という状況で、コロプラワープ移動を特許申請したということは…?

【公開番号】特開2017-211912(P2017-211912A)

【公開日】平成29年11月30日(2017.11.30)

【要約】

課題仮想空間における非制作領域の視認を制限可能な表示制御方法を提供する。

【解決手段ヘッドマウントディスプレイ(HMD)を備えたシステムにおける表示制御方法であって、当該方法は、仮想カメラ300と非制作領域NRを有する少なくとも一つの対象物Wとを含む仮想空間を示す仮想空間データを生成するステップと、仮想カメラ300の視野および仮想空間データに基づいて、HMDに視野画像を表示させるステップと、HMDの移動量に応じて仮想カメラ300を移動させるステップと、HMDの移動量に基づいて仮想カメラ300と対象物Wとの間の距離特定するステップと、当該距離が所定の閾値L1以下であると判定された場合には、当該距離が所定の下限値L2を下回らないように、仮想カメラ300の位置制御するステップと、を含む。

プレイヤーの視界を目標地点にまで等速直線運動で移動させる特許のようです。目標地点まである程度の距離に達すると移動速度が下がり、目標地点に到着すると止まります。VRはプレイヤー視点となるカメラアプリ側で動かすことはご法度とされていて、どうしても動かす場合加速度運動は絶対に避けて等速直線運動のみで移動するのが一般的です。これはそれを特許として申請したもののようですね。

【公開番号】特開2017-208809(P2017-208809A)

【公開日】平成29年11月24日(2017.11.24)

【要約】

課題ヘッドマウントディスプレイにて動画コンテンツを再生する際に広告等の他のコンテンツを表示しても、ユーザの没入感に与える影響が少ない方法を提供する。

【解決手段仮想空間に適合させて再生するための動画コンテンツの初期方向を特定するステップと、初期方向の水平方向における向きとHMDのロール方向の水平方向における向きとが一致するように仮想空間に前記動画コンテンツを適合させて再生するステップと、初期方向の後方側に、第1のサブコンテンツを表示するステップと、HMDの向きおよび傾きのうち少なくとも一方に応じて視野を更新するステップと、を含む。

・VR空間内でユーザー違和感のないように広告動画を出す特許のようです。ユーザー視線広告にどれだけの時間向いていたかを計測するそうです。VR内の広告GoogleFacebookなんかが研究してそうな感じですが日本国内ではVR広告の話はあまり聞きませんね。

(追記)トラバの罵り合いは増田とは全く関係ない第三者同士の罵り合いです。

【公開番号】特開2017-208676(P2017-208676A)、特開2017-208808(P2017-208808A)

【公開日】平成29年11月24日(2017.11.24)

発明名称仮想空間を提供する方法プログラム及び記録媒体

課題ヘッドマウントディスプレイにて動画コンテンツを再生する際に、広告等の他のコンテンツを表示する方法を提供する。

【解決手段仮想空間定義するステップと、仮想空間において再生される動画コンテンツと、動画コンテンツの表示域の一部に表示されるサブコンテンツとを合成して合成コンテンツを生成するステップと、合成コンテンツ仮想空間に適合させるステップと、ユーザ視線特定するステップと、視線に基づいて、視界領域特定するステップと、合成コンテンツのうち、視界領域に相当する視界画像を生成し、HMDに出力するステップと、を含む。

・図11より、VR空間内の動画広告を合成する技術特許かつユーザー視線統計を取得する特許

【公開番号】特開2017-207898(P2017-207898A)

【公開日】平成29年11月24日(2017.11.24)

発明名称】視野情報収集方法および当該視野情報収集方法コンピュータに実

2018-01-09

anond:20180109174746

先日、80才の父親むけにスマホを設定した。

意外と音声認識やってもらうと親和性高そうでしたよ。アイコンを押して、話しかけて検索

2018-01-08

のらきゃと、ご認識マナー

そろそろ「誤認識のやべーやつ」って言われそう

バーチャルYouTuberの「のらきゃと」はGoogle音声認識で喋った文章認識させて、ボイスロイド東北ずん子に喋らせているようだが

認識面白くて色々とねたになっている

 

【18/01/04】のらきゃっと 生放送アーカイブ 【年明け初放送 for 堀田さん】

https://www.youtube.com/watch?v=Dr35JxPAx20

の誤認識面白かったので書き出した。あとで何かに使われるだろう

 

何を言っているのかは解読班に任せる

 

 

2018-01-05

anond:20180105123031

言葉永遠の不完全、だから生きている、進化する。

それを肌感覚で感じるには、古文漢文をやるしかないんだ。

古文漢文がなくなったら、30年くらいで極端な日本語右翼左翼がウザくなってくると思うんだよね。

別に100%読解できなくたっていい。現代文全然違うけど、何となく現代文と似ている、そう実感するだけで十分教育価値はある。

多分、コレ読んでいる人が無意識にやってるし、普通人間ならできると思っている当たり前のことの土台に古文漢文がある。

それがなくなる。

テラワロスwが公用語になったら嫌だろ?それは会社公共機関でそういうの使っている奴を叩いていればいいってもんじゃないんだ。


理系で起きたこういうことが、文系でも起きるようになるぞ

https://togetter.com/li/1107013  「現代科学の敗北リスト」が笑えるようで笑えないレベル みなさんも気をつけて


教育が無策だと保守主義が幅を利かせる

昨日と今日が同じなら正しいというのは安直だけどリスクが少ない。

日本語にはコレという型がありそこから絶対に逸脱してはならないという教条主義

近年でいうら抜き言葉否定派。

ら抜きことばは「可能」「敬意」を区別する合理的進化だと認められない人々。

これから先、

外国語学習者の増加による、主語明確化や時制輸入

AI生成文書

音声認識適応日本語

もっと極端な話をすれば顎の骨格の変化が及ぼす音への影響

そういった様々な要因で我々が使う口語まで変化して、それが合理的だと見なされて標準化するかもしれない。

そういうとき「これでいいんだ!」と日本人が受け入れる器の大きさ、それは古文漢文教育にかかっている。

奔放過ぎる言語左翼 ブームは非合理で予測不能

「みんなバラバラでいい、何なら日本語から正式文法正書法なんて概念廃止してしまえ。一人ひとりの言葉は違っても全て公文書的に認める」

なんて主張がまかり通り

とき権力者おかし日本語用法、口癖、なまり

もしくは、絶大な人気を獲得した芸能人のそれや、インターネットスラング

そういうものがなし崩しに認められてしまう。

社会が「過去から現代への日本語進化には、これこれこういう理由があって、この用法あくまで乱れた日本語の域を出ない」と線を引く力。

これも画一的古文漢文教育を行わなければ失われるだろう。

国会答弁では、「昔言ったアレにそういうニュアンスは含まれていない」が繰り返されている

これ以上文法が乱れたら、言った言わない・どういうつもりで言った論争が終わらなくなる。

しまいには(国際進出と縁がないのに)組織意思決定会議外国語を用いた会社が成長する、なんて未来もあり得るぞ。

日本語ポンコツ過ぎて。

2017-12-19

1日遅れの郵便物今日も来なかったら2日遅れだが

うおおおおおおおせえええよおおおおおくそがああ

書いたら来たわ

音声認識かな?

2017-12-10

俺も音声アシスタンス作りたい

音声認識OSSってどんなもんなんだろ

Googleが出してるかどうか次第か

 

音声は琴葉茜ちゃんでやりたい

2017-11-19

壊れかけのレディオ

状況:何も聞こえなくて何も聞かせてくれない

原因:僕の体が大人になったか



これって、音声認識コントロールしていたんだけど、声変わりで反応しなくなったってことじゃない?

個人認証かけて、自分しか命令できないようにしてたけど、パスワードとか忘れて(あるいは、そもそも声紋認証してるから、声が変わったらどうしようもない)


メーカーに問い合わせたら仕様ですって

2017-11-15

anond:20171115165714

音声認識文章化はオーバーテクノロジーです

OK,Googleみたいに認識候補検索エンジンにぶち込むことで妥当性を検証できるならいいのですが全く他人の会話をゼロから推察は無理ゲーです)

宇宙人の着陸とか未来人の来訪とかをお待ちください

2017-09-05

アイドル応援する勇者

良くあるパターンとしては、「プレイヤー勇者となって世界を救う」ゲームがある

古典的伝統的なゲーム観だ

ドラクエ11もよく売れているらしいし、まだ行ける感じなのかな

 

対して、増田話題になっているのはアイドルスマホである

この場合プレイヤーは何なのだろうか?P(プロデューサ)か、なるほど

いや、言いたいのはこの場合主人公は誰か?画面の中のアイドルなのではないのか

 

なんか変な話だ、いや変ではないのか

上記二者に対して、その中間に当たるのがFGOあたりか、アイドル的なヒーロー達を揃えて攻略するイメージ

(昔はその位置ファイナルファンタジーがいたのかな)

 

ただ、増田をたまに見ると「基本的に人は自分の話を聞いてもらいたい(だけ)なんだな」と思う

この場合、「現実世界で見てくれる人がいない」「現実世界勇者として無理ゲー(人によってはヌルゲー)を戦っている」あたりなのかも知れない

 

よって、「自分応援してくれるアプリ」「相談出来るアプリ」みたいなのが需要としてあるのかも知れないな、と

未来的には、AIマイクロソフト音声認識音声認識を応用した発音機能あたりで実現か

さらにそれが恋愛コンテンツと結びつくと、リアル恋人がいらなくなる人もでるかも知れないな(w

出来れば、「共依存」ではなく、「自立を促す」ようなアプリを期待したい物だ

本来、自立した個人同士なら結婚生活もそこまで破綻しないしね

これでニート問題解決の目処は立った(w

2017-08-29

音声認識AI的なやつの唯一の致命点

お前を呼び出す言葉カスタマイズがしたいのにできない

「オッケーグーグル

「シリ」

コルタナ

「クローバ」

そこを変えたいんだよ!!!!!!!!!頼むよ…

2017-08-02

Gateboxに期待しているが、むしろあれの未来は +VR にあるんじゃないか

http://gatebox.ai/

Gateboxは未来のあるデバイスでいいなと思っている。「初音ミク暮らしたい」まではいもの日本技術オタク御用達という感じだったけど、LINEに買収されたところでいっき現実世界に受け入れやすデバイスへの道が拓けてきたんじゃないかな。初音ミク逢妻ヒカリ拒否感を示す人はたぶん多いだろうけど、コニーブラウン投影すれば日本人の大多数には拒否感なくとらえられるだろう(LINEとしては最近宣伝してるAIプラットフォーム Clova とやらを載せることを考えていても全く不思議ではない)。

が、あれをただの音声認識対応ホームロボット(あるいは音声コマンド端末)にしちゃうことは非常にもったいない気がしている。

あとちょっとデバイス追加で全く違う世界が見える。VR用コミュニケーション端末としての世界だ。端的に言うと、360度カメラを付けて全周動画ライブストリーミング可能にする + それをVRゴーグルをかぶった誰かに届けることで通信端末にする。ただの360度カメラと異なるのは、アバターを映し出す機能があることだ。これでVR空間経由で接続した人のリアクションリアルタイムに映し出すことができる。デバイス周囲の人に(VRゴーグルなしに)直接見える現実世界アバターだ。新世代のテレイグジスタンスとも言える。

いまや道具として360度カメラはだいぶ普及してきたし、それをライブストリーミングとしてVRゴーグルに映し出すことも技術的にはほぼ障害はない。これをリモート会議などに応用しようというのはおそらく星の数ほどの人が考えるだろうが、いくつか問題点がある。

360度カメラ+VRゴーグル経由での「その空間」への人間ダイブユーザにその空間に参加している感覚をもたらすが、その一方で、カメラ周囲の人に「誰がそのカメラダイブしてきているのか」を認識させてくれない。カメラ周囲の人もVR/ARゴーグルかぶることでカメラ自体アバターを重ねる手もあるが、そうすると今度はカメラ経由の人の視界はゴーグルをかぶっている人で埋まることになる(VR/ARゴーグルの上にその装着者の顔あるいはアバターを重ねる手もあるが、これは現状あまりうまくいかないと思う)。

しかしGateboxのアバター表示ディスプレイがあれば、少なくともダイブしてきている人の簡易アバターを表示することはできる。ブラウンでも逢妻ヒカリでも他の何でもいいけど表示させることにより、ダイブ中の人が「どの方向を向いているか」を明確に示すことができる。これができるだけでその場の人と会話をしている感覚は大きく改善するだろう。

加えてダイブと併用するコントローラか何かで簡単リアクションコマンドを送ることにより、アバターに頷かせたり、質問時の挙手をさせたり、疑問を持ったとき首をかしげさせたりできればいい。この程度のジェスチャーあるいはリアクションでも大きく会話に影響することはMMORPGなどをやっている人なら実感できるはずだと思う。

簡単に言うと、MMORPGにおける他ユーザアバター現実世界召喚し、現実世界映像と音声をその人に見せる、ということだ。その上、多対1のボイスチャットもできる。

これは様々な応用が期待できる。ごく簡単に思い付くだけでも以下のようなものがある。

なによりこれは、実際の技術的にはほぼ実現可能なところに来ているというのがよい。360度カメラもその映像VRゴーグルで受け取ることも実現しているし、今となってはそう高価でもない。アバターを映し出すディスプレイ(およびその小型化)はGateboxの独自技術だ。自宅外での運用については通信量が気になるところだが、LINE MOBILE に専用のプランでも用意すればよい。

先にも書いたが、おそらくこれはテレイグジスタンスという名前研究されている分野の応用だと思う。ただし遠隔ユーザ身体性がなく、そのかわりにディスプレイ投影アバターを用いるところが少し異なる。(わかる人には、SAOマザーズ・ロザリオ紺野ユウキアスナ肩に乗ったときのアレ、というと近いかもしれない。ただし肩に乗ることはできず、そのかわりにアバター投影が得られる。)

思い付く範囲問題点というと、それでもひとセットの値段がまだそこそこする((Gateboxの360度カメラ付きバージョンで8〜12万くらい? もっと? とVRゴーグル、およびアプリケーション通信費))、というところか。しかし、たとえば入院患者向けみたいな用途についてはリース会社を挟むとかすれば、だいぶ扱いやす価格になるだろうと思う。

技術的な問題点については、たとえば現Gateboxの上に360度カメラを載せるとして、VR経由でダイブしている人の視座はそのカメラ位置になるだろうけど周囲の人はカメラ下にあるアバターを見るだろうから視線が合わない、ということかな。これはカメラ映像補正で、ダイブしている側の(仮想的な)視座をアバターに合わせてやる、とかできそうな気がする((素人なので本当にできるかどうかは知らん))。

Gatebox、すばらしい技術アイデアだと思うんだけど、Clovaとかで素晴らしいAIを載せる方向で頑張るより、こっちのほうが未来があると思うんだよなあ。

今のと別バージョンでこんなのの開発、どうでしょう

2017-07-07

人工知能活用

だいぶ個人的主観特定企業について言ってるわけではない

自動車人や車を検出しそれらの動きを予測したりする。自動運転の前に自動安全技術が開発途上
金融なんちゃって人工知能ニュースとか集合知から動向予測しようとしてるけど、色んな指標とか専門家の英知の方が確実じゃねって思う
ゲーム正直これからゲームAIが一番熱くなっていくんじゃないか戦略直観ゲームウイイレとかLOLAI電脳戦とかできたら面白そう。
CG,アニメーションたぶん使おうと思えば使えるけど、費用対効果が小さすぎて盛り上がらなそう
ロボット会話したり経路推定したり人検出したりする。感情を付けるとか研究されてるっぽい
ECサイトディープラーニング使ってるか知らんけど、使う必要もなさそう。レコメンドシステム人工知能と言い張れば人工知能
セキュリティ人検出、行動予測音声認識NGワード卑猥画像検出、たぶんめちゃくちゃ熱い
医療医療画像から病気の診断したり行動ログから異常検知したりする、(エキスパートシステム)、命に係わる分野だけにあくまで補助的な使い方になるだろう
受付ペッパー使おうとしてるけど、無理に使う必要なくね
家電スマート家電人工知能というよりIoT対話ジェスチャー操作とか開発途上

2017-06-29

働きたくないんだけどこれ儲かるかな

死んだらネットで知れる(SNS)サイト「しぬしぃ



マイページ作成して喪主と繋がろう!

宗教対応したいいねボタン実装(アーメン、南無阿弥陀/南無妙法蓮華アッラーアクバル等)

電子香典電子花輪対応(花輪で故人のマイページを飾れます)

2018/4/1 ver.0.1 リリース

2018/4/2 ver.0.2 リリース(アッラーアクバルボタンアイコンを削除し音声認識対応しました)

2017-03-08

3/8の人工知能(AI)関連プレスリリーステクノロジー視点解説

日々流れる人工知能(AI)関連のプレスリリースAI研究者視点から軽く解説します。

ウェブ面接プラットフォームHireVue株式会社バンダイにおける導入利用のお知らせ

https://prtimes.jp/main/html/rd/p/000000019.000016792.html

人工知能技術ウェブ面接プラットフォーム上に溜まった会社情報候補者情報からマッチング

難易度】低

宿泊施設の料金設定の悩みを解消 MagicPrice(株式会社空)とホテルシステムのDynalution(ダイテック株式会社)が業務提携

https://prtimes.jp/main/html/rd/p/000000006.000019984.html

人工知能技術】MagicPriceはホテル宿泊施設データを用い、最適な料金設定をAIで行っている

【何が変わったかデータの定期的なアップロード作業必要だったが、宿泊施設データ管理システムDynalutionとの連携により不要に。利用者からはより簡単に利用でき、分析をするMagicPrice側からデータフォーマットのブレがなくなり分析やすくなった。

ユーザーがChatbotでリアルタイム試合情報を取得、AI×人の相互コミュニケーションによる新しい観戦スタイル

https://prtimes.jp/main/html/rd/p/000000027.000017379.html

サービス名】Live Sports Chatbot

概要日本チーム選手情報や、リアルタイムでの試合の実況情報などユーザーリクエストに対し、チャットボット自動応答。また特定選手についての質問や、過去の成績についても応答が可能

技術データスタジアムの「一球速報プラットフォーム」のデータベースから質問に対してチャットボットが応答。

本文引用一般的対話システムには、想定質問とそれに対する応答のQ&Aデータが予めインプットされており、ユーザーリクエストに対しそのデータベースから適する応答を返すというものが主流ですが、本サービスでは試合中、常に変化する実況情報リアルタイムユーザー配信します。』

この「リアルタイム」は「データベースリアルタイム更新されているだけ」であり、応答のセリフなどの部分については従来通りだと思われる。

【開発】Nextremer

英語学習AIロボットMusio(ミュージオ)、髙島屋と共に親子で英語に親しむ新しい体験提供

https://prtimes.jp/main/html/rd/p/000000012.000017199.html

サービス名】英語学習AIロボット「Musio」

技術音声認識(英語)、自然言語処理(英語)、対話モデル

英語対話データをもとに受け答えを行う。

本文引用会話内容だんだん覚えていく』

これはりんねプレミア(https://twitter.com/premieresao)と同じく、相手発言内容を記録していっている。

【開発】AKA

2017-02-22

国会中継のヤジを音声認識で、発言者認識自動的テキスト起こししてログが残せたら、ひどいヤジが減りそう。

スターも付けれたら、良いヤジも増えたりして

2017-01-31

自動運転

なんかさー、高齢者自動車事故が増えていて、自動運転必要性は高まってると思うんだけど、

問題になってるのは車がないと生活しにくい田舎の状況だと思うんだよね。

都会は公共交通機関が発達しているか自動車生活必需品じゃないし、人も車も多いか自動運転実験しようにも危険が多いし。

から自動運転タクシー特区人口密度の低い(若者も少ない)過疎農村地帯あたりに策定して、

そのエリアだけ走行するように設定した自動運転タクシー無料もしくは安価で(実験から)投入。

各家庭の玄関ボタン一つで自動運転タクシーが呼べるパネルでも設置して高齢者でも簡単に呼べるようにする(時間予約もできると尚便利かも)。

乗ったら音声認識で「◯◯に行って」の一言で移動。「ここを右に曲がって…」みたいなのにも応えられるようにはしておく。

着いたら降りるだけ。料金はパスカード式にしておいて移動のデータも残しておいて、次回は同じ場所ならすぐ行けるようにする。

作業用に自動運転軽トラタクシーとして使えるようにするとか。

エリア外に行きたい時はその地点から有人タクシー路線バスに乗り換えるとかできるようにして。

最初は「自分の車を自分運転したい」という人も多いかもしれないけど、自家用車と同じぐらい便利でコストも安いと実感すれば利用者は増えるだろうし

生活のためしかたなく運転している人多いし(特に高齢女性)、比較安全に(道が単純だし人が少ないから)データも取れるし

過疎地域からちょっとずつ人口密度の高い地域サービスを広げていけばいいんじゃない

ログイン ユーザー登録
ようこそ ゲスト さん