「音声認識」を含む日記 RSS

はてなキーワード: 音声認識とは

2020-09-30

今のプログラム恩恵って一般人だと直接感じられない

職業プログラマーではないが、やれること増えないかなと思ってプログラムを触っている。

Python流行りだからやっておくと、ある程度やったが、あまり恩恵を直接感じられない。

サーバー通して間接的には受け取っているだろうが)


Pandas覚えても使って価値のあるデータベースないし。

機械学習も少し触っているが、そもそも分類したいデータがない。

GAN関係も、画像が出てきて凄いと思ったけど、普段使ってるPhotoshopがより便利になるわけでもない。


動画作ると、テロップ入れるのが面倒だったりするわけだけど、

動画編集ソフトに音声と同じタイミングテロップを入れてくれるわけじゃないから、全部タイミング調整しないといけない。

テキスト入力10分以上になると大変だ。

音声認識テキストに起こすのはあるがご認識がまだある。

どちらかというと誤字をプログラムがチェックして欲しいのだけど、やってくれない。


コンピュータビジョン学会で1300件以上論文アクセプトされたとか言われて見に行くと、世の中凄い技術進歩してるなと思うと同時に、

直接役に立ちそうなのがないなとも思ってしまう。

2020-08-16

音声認識技術により会話の中から危ないシーンを端末が自動で察知し、還付金詐欺可能性のある振込リスク抑制する機能

高齢者通話を聞いて還付金詐欺だと思ったらボタンを押すだけの簡単バイトです

2020-06-27

anond:20200524233706

この時書いたブコメに准じて、都知事選候補者公約確認中。

確認方法は、「都知事選 公約」などで出て来た候補者公式ページ公約から、「障」「発達」などのキーワード検索

いずれも、6/27(土)19:00現在

なお、探して見つかった物だけなので、見落としがある可能性はある。

公約内での比率が大きいのは山本太郎氏、公約が(少なくともホームページ上では)詳細なのは宇都宮健児氏かな・・・

ここで挙げてない候補者についてはまだ調べてないが、公約発信の媒体としてホームページに力を入れてない候補者もいるようなので、一律ホームページ判断するのはフェアじゃないかもしれない。

小池百合子

公約のページが全て箇条書きであり、項目数が多いため、どの程度具体性や力点を置いてるかが良く分からない。個人的には、成人障がい者障がい者スポーツの面からしか公約に掲げてない気がするのが気になる所。

とはいえ、「児童発達支援」と「重度心身障がい児への支援」の2項目で触れている以上、障がい児の子育てについて課題と考えてはいると思われる。

https://www.yuriko.or.jp/policy

※該当すると思われる項目のみ抜粋

障がい者を含めたeスポーツ振興

障がい者スポーツ支援強化・メジャー

児童発達支援センターの整備推進

・重度心身障がい児への支援強化

・「感染症バリアフリー」の検討マスクや消毒液等の優先提供体制・透明マスク接触必須障がい者への感染防止策・多様な申請手法情報発信最適化(手話字幕の追加、音声認識アプリ活用)など

デフリンピックなど障がい者スポーツ国際大会東京開催を推進

山本太郎

8つの公約の中の1つに挙げ、1ページ丸々使って以下の通り公約している。今回調べた候補者の中では一番「公約の中での割合」が大きく目標に具体性もある一方、個人的には、掲げる政策目標が具体的過ぎて範囲が狭い印象も受ける。

https://taro-yamamoto.tokyo/policy/7-2/

↓↓↓↓ ここから ↓↓↓↓

障がい者のことは障がい者で決める東京

都の障がい者政策部局責任者に障がい当事者を立て、審議会等の政策決定の場には必ず障がい当事者を半数以上とし、個々のニーズや障がいにあった十分な介護保障する東京に。フルインクルーシブ教育の実現。

かつて米国教育特殊教育リハビリテーションサービス局次長クリントン政権)を経験し、オバマ政権では世界銀行顧問にもなったジュディ・ヒューマンさんは「当事者政策決定過程重要位置を占めることが重要です」(『季刊福祉労働』81 1998年12月25日号)との言葉を残しています

障がい者は、日頃の生活差別を受けたとしてもどこに相談したらいいのかもわからず、いつも困っています。都にも障がいを理由とした差別に対する相談の窓口はありますが、障がい者の多くは、そのような窓口があることすら知らず、また体制的にも内容的にも十分なものではありません。障がい者差別をなくすためこのような窓口の充実を行います

また、現在の多くの障がい者政策は、障がい者のことをわかっている風の有識者障がい者を「お世話」する施設運営者などが決めてきたとの批判もあります。このことにより障がい者が本当に求めていることに対応してきたとはいえないとも言われています

このような問題を解消するためにも障がい者関係する部署には必ず障がい者責任者として配置します。また、障がい者としても障がいの種類によって必要なことや、思いも違ったりするので、あらゆる障がい者政策決定の場に参加していただき、その数は必ず半数以上とします。

障がい児が普通学校に通うだけで、インクルーシブ教育を実現している!ということに表向きはなっていますが、実際には、普通学校の中で、特別支援学級普通学級に分けられているのが現状です。これはまだまだ本当の「インクルーシブ」ではありません。心のバリアフリーを実現するために、最終的には、障がい者と健常者が分けられることなく一緒に学べるフルインクルーシブ教育を目指します。

また、障がい者の住んでいる地域や年齢による格差や断絶をなくして、どこでも、生涯にわたって安心して暮せる地域生活支援を行います。加えて個々のニーズや障がいにあった十分な介護保障するために重度訪問介護の充実を国や自治体連携してはかります

↑↑↑↑ ここまで ↑↑↑↑

宇都宮 健児

※7つの重要政策の1番目、「重要政策01 だれもが働きやすく、くらしやす希望のまち東京をつくります」の中で、以下の通り公約している。

※ただし、障害者福祉はそのページ内でさら12個立てた項目の6番目であり、どの程度力を入れるのかはやや不透明な気もする(とはいえ公約は詳細に書かれており、やっつけな感じは受けない)

※なお、7つの重要政策の5番目、「重要政策05 教育現場への押しつけをなくし、すべての子どもたちが生き生きと学べる学校をつくります。」の中にも、「障がいのある子どもたちの教育を受ける権利」について触れた項目が立っている。

http://utsunomiyakenji.com/policy/important01

↓↓↓↓ ここから ↓↓↓↓

障がいのある子どもを抱える学童保育室の人員体制民間学童保育も含めて強化します。

知的障がいや精神疾患など様々な困難を抱えた路上生活者地域生活できるようにサポート体制を作ります

障がいのある人もない人も、ともに生きる東京しま

障がいのある人の権利を確保する東京をつくります

日本政府批准をした国連障害者権利条約を実質的ものとするため、平成30年に施行された「東京障害者への理解促進及び差別解消の推進に関する条例」をより一層充実させ障がいのある人とない人が共生できる東京をつくります

東京都の障がいのある人にかかわる政策策定する会議等には、障がいのある当事者が必ず参加するようにルールします。

住宅相談介護支援医療システムの整備を行い、家族に頼らなくても障がいのある人が安心して暮らせる東京のまちをつくります

市区町村に対して財政補助を行います。重度障がい者地域での自立生活社会参加や見守りなど必要に応じたサービスが受けられるよう市区町村財政援助を行います

障がいのある人と家族が、安心して暮らせる東京しま

出前福祉制度を導入する~江東区兄弟餓死事件のような悲惨事件をなくし、福祉の行きとどかない死角地帯をなくす。

老老介護」も大きな課題ですが、高齢の親が障がいのある人を介護し続ける「老障介護」が、「老老介護」とならんでいま大きな問題になっています高齢家族に頼らなくても、障がいのある人が安心して暮らせるように在宅支援を拡充します。

障がいのある人が住むことができるバリアフリー都営住宅建設検討します。

視覚障がい者の転落防止のためのホームドアの設置、障がいのある人への差別のないバリアフリーまちづくりをすすめます

身近な地域相談できる場と、その人にあった療育教育保障しま

ADHDLD自閉症などの発達障がいなどの早期発見につとめながら、適切な支援が得られるように、身近な地域相談できる専門機関を増やします。

障がいのある子どもたちが地域普通に学べるような環境を充実させます。誰もが合理的配慮を受けて学べるよう教育の場を充実させます

障がいのある人の医療無償化を実現します。

憲法25条の暮らしを実現するために、障がいのある人に、都独自所得保障を拡充しま

多くの障がいのある人たちは、きわめて低い所得水準を強いられ、生活保護や障害年金基準引き下げによって、さら貧困なくらしや家族への依存が強められています生活保護基準の引き下げに反対し、障害年金の抜本的な改革を国に強く求めていきます

東京独自所得保障施策検討実施します。

障がいがあっても働ける仕事の確保に努めます障害者就労支援施設への「優先発注」の促進策を具体化します。

災害を想定し障がい者安心して避難生活を送れるような体制をつくります

避難所をバリアフリー化し、障がい者が参加した避難訓練を実施します。

医療介護保障視覚障がい者聴覚障がい者のための情報コミュニケーション保障を行います

制度の谷間のない障がい者施策実施しま

東京都は独自に、病名や障害種別障害者手帳の有無で福祉サービス対象判断せず、「その他の心身の機能障害」(長引く病気など)が認められる者も、支給決定過程におけるアセスメントが受けられる仕組みを検討します。

↑↑↑↑ ここまで ↑↑↑↑

http://utsunomiyakenji.com/policy/important04

↓↓↓↓ ここから ↓↓↓↓

障がいのある子どもたちの教育を受ける権利保障します。

障がいのある子もない子も共に学べるフルインクルーシブ教育の推進・整備をすすめます

学びの場における障がいを持つ子どもの、ハード面、ソフト面での支援体制の整備・充実をはかります

↑↑↑↑ ここまで ↑↑↑↑

小野 泰輔

4つ立てた主要項目?の4番目「4.誰もが安心安全で心やすかに暮らせる東京へ」の中で、16項目中の以下3項目で関連する公約を掲げている。うち育児に関わる2件は、無難にまとめすぎていてどこまで力を入れるのか読み取りにくいものの、2項目あるので「取り敢えず書いただけ」という印象は受けない。

https://ono-taisuke.info/policy/

手話言語条例を制定し、聴覚障害者の方とともに歩む東京都を実現します。また、障害者雇用の向上のため、分身ロボット等のテクノロジーを使った就労、超短時間労働制度などを公共事業から導入します。

●まだ多くの保育所対応が困難な病児・病後児保育を拡充するため、対応施設を設置する民間事業者基礎自治体さらなる財政支援を行います

医療ケア必要とする障害児に対して、縦割りになっている保育・療育の垣根を超えて対応できる施設事業者を増やし、そのための専門人材育成に努めます

2020-06-12

anond:20200610213142

無人レジに対して袋はいりませんって最初に言っても音声認識してくれなくて困った

2020-06-07

中国技術情報日本メディア報道されないのなぜなんだ

中国は目まぐるしく変わっているのと、GDP世界第2位の経済大国なので、テクノロジー情報報道されてもいいはずなのだが、

政治絡みの話に終始しているきらいがある。


Tik Tokのように、中国っぽさがないものについては報道されるので、何かしらの壁を超えないと伝えられないっぽい。


GAFA+BAT(バイドゥアリババテンセント)と言ってたが、バイドゥ評価が落ちている。

音声認識iFLYTEK、監視カメラハイクビジョンコンピュータビジョンセンスタイムやメグビーなどは話題に上らない。

2020-05-22

中国半導体政策くらい、日本政策取ってくれればな

経済産業省にある中国半導体についてのレポートを読んでいたんだけどさ。

そりゃ強いよな、アメリカも本気になるよなと思う。


個々の文言日本でも見たことあるけど、投資額が違う・・・

音声認識のiFLYTEKとか、そりゃ凄い企業出てくるわ。


日本政府もこれくらい産業政策が強けりゃな。

2020-05-21

そのうちプログラム法人契約音声認識でほぼ自動で書いてくれそう

そんな気がしてならない

2020-03-05

anond:20200305110503

音声合成でしゃべるゴースト最初からいくつかあった

音声認識もできるしオッケーグーグル的なことも可能かもしれない(本体設定:音声認識/合成参照)

どっちにしろ早すぎたんだ感はある

2020-02-10

レクサス2種類に試乗させてもらったので感想を書く

・型おちといってもいいくらい古いものなのに本皮シートがくさい そのせいか酔いと眠気がものすごくひどい 

スポーツタイプ助手席ダンボールみかん箱でお風呂遊びしている気分になった(目的のわからない板と取っ手が両サイドにある)

エスティマよりベースが縦横とも広いので山あい温泉地の駐車場ギリギリ。服で外装を掃除させられるはめに。

・かならずついてる昭和NHKの正午みたいな銀色の丸い時計盤面はなんのためにあるの?松本零士メーターへのオマージュなの?ナビのGPSのほうがコンマ単位で正確だよ

テスラがOSいじって怒られてるけどそれは最新だからだ。レクサスのはOS古臭い地名音声認識siriにもグーグルマップにもまけてるし、かといって五十音入力カーソル移動が不便(新しいのは静電パネルがついてるからそうでもない、さっと地名入力できる)

振動や音やオートクルーズコントロールもっとスゴいやつ?についてはよい

・後部座席人権がない。後部座席がシートを1°も倒せないばかりか、運転者がシートを倒すときに避けようもなく足が挟まったり。後頭部がずっとリアガラスについてたり。それでいて横にもなりにくいしなー

・車ってこんなに便利になってもあいかわらず不便なんだなとおもった、ていうかきっちり座ってる姿勢人間を運ぶために特化させすぎてるんだと思う。靴下いであぐらかきたいとかおねえさんずわりとか体育座りとか正座とかが許されないのが息苦しい。尻が痛くなりそう。 空いてる電車で定刻通り姿勢をかえたり窓によりかかって寝ながら行きたいとおもった

結論普通ファミリーカー+iPhoneバンザイ あっギア連動サイドブレーキとかサイドミラーの車いるよ警告表示、あと渋滞らくちんのホールドブレーキファミリーカーにもつけてくれればそれでいいや

2020-02-04

anond:20200204232411

人間簡単にやってることほど、機械には難しい。簡単にできるってことは、進化過程最適化が、めちゃ進んでいるので。

二足歩行音声認識写像認識が最たるもので、何十年も頑張って最近マシになったけどまだ精度悪く見える。

2020-01-09

人格資源時代

なんか世の中に振り落とされないぞ!しっかり技術キャッチアップして生き残っていくぞ〜って人見かけた。そうやって肩肘張って血気盛んに吠えてるときほど視野狭窄に陥ってるのかなって思います

なんでIT技術が安定して伸びていくと思ってんだろう。まあおれも十中八九大丈夫だろうとは思うけど、伸びしろ限定的になるとみている。

中途プレーヤーならこのまま業界に居座っててもポジションあるからなんとかなるけど。

おっとIT業界の今後とかいうどうでもいい話ではなかった。

人格資源時代が来ようとしていますよ。

皆さんはYoutuberとか見てないかもしれんけど、10年前のニコニコがチンカスに思えるほど、大量のyoutuberが大量の視聴者を獲得しています

なんでこのビッグウェーブについて触れている人が少ないのかちょっとわかりません。みんなブログとかニュースサイトしか見ていないってわけでもないだろうし。

そんな水や電気みたいにみなさんの生活に溶け込んでいるものこそもっとも重視したほうが良いとお思います

なんで人格重要視されるかって言うと、要はいままでTVが独占していたタレント市場が(Youtube一強とはいえ)オープンに開かれたわけです。

こんなこと聞くと、もう何年も昔から動画サイトなんて掃いて捨てるほど合ったじゃーんって言うかもしれんけど、アホ。その「どうがさいと」に乗ってたのって結局は海賊版TV番組だろが!youtubeにはTVにない一般人投稿している人気コンテンツが上がってるんだよ。

なんでTVよりYoutube面白いのかってのは、youtube技術的に優れている!とかっていうことだけじゃなく、既存芸能業界が死にかけているというか、youtubeという新たな怪物がその市場を本格的に食い始めているわけで、TVYoutubeに対する社会一般の人々の捉え方とか見方偏見とかが変わり始めることで実現しているっていう背景があります。あるよな。私はあると見ている。

なので今まで捉えていたいわゆる「動画サイトからすでに変容しつつある。

雑に例えると、ニフティサーブLINEくらいの違いで、使われ方や求められる性質全然違っています。結局文字情報でやり取りしてるだけだから同じだろー。とはならない。

同じ技術でも使われ方によって社会的効能は変わってきます

Youtube社会に受け入れられる体制が整ったのです。

ぶっちゃけ自分ヒカキンかいう顔芸激寒野郎が人気出てきた段階で、もうyoutube終わったな。ニコニコクソとはいえyoutube文化も耐えられん糞だしそのうちユーザー投稿動画サイト死ぬ。って確信したんだけど、ご覧の有様だね。

私は考えを改めたよ。これから動画時代だよ。それも超高速の5Gによる低遅延のインタラクティブなやつな。

今もライブ配信できるけど、視聴者も雑に発話コメントしたら音声認識チャットされたりとか、変声アプリとかで殴り合う世界がすぐ目の前に迫っています

iPhoneAndroidGAFAが無くなっても、個人人格に紐付いたブランディングはずっと残るんだよ。

そこに食い込むには今からでも自分アカウントを育てておいて、市場に定着させるのが最適解でしょう。

まだyoutube動画あげてないけどな。

このへんやってる人の見解を聞きたい。(増田での質問って解答もらえないよね)

2019-09-10

anond:20190910111120

増田ml-agentsをどこまで理解たか分からんけど、

基本は「あらゆるデータハッシュ化」した後に「現実よりもはやい速度で学習させる」のがメインだからどうしても物理演算系のサンプルがメインとなってはいるが、

使い方次第で例えば音声認識だったり物体認識、またその逆も作れる

(というか機械学習系のサンプルは全部実行可能)だからml-agentsを熟すで一先ず正解や思うぞ。

寧ろ変な方向に進まずml-agentsから始めてくれ。

ml-agentsならsuccerくらいからやると発想が広がっていいんじゃないか。

2019-09-04

英会話2.0

自分場合仕事英語を使うことが日常的にある。

とはいえメールのやり取りや、書類通読、自社製品規制情報収集がせいぜいのところで、外人リアルタイム意見を交換するようなことはない。

なので、いざ外人との会話になるとサッパリだし、会議に入ると貝になり、セミナーでもちょっと込み入った話になると理解が追いつかなくなる。

そこに、Google様がリリースした(リリース自体は2月だが)Live Transcribeである

https://www.buzzfeed.com/jp/yuikashima/live-transcribe

巷間言われているように、精度がかなり良い。試しにWebinerでモニタの前に置いてみたところ、なるほどここはこう言っていたのか・・・と気付かされることが多数ある。

これなら外人がグワーっとしゃべっても、次々と表示される文字列をチラ見し、とりあえずキーワードだけを拾っておけば、置いてけぼりになることもなさそうだ。

自分は以前からキーワードだけを聞き取って、必死で会話についてくタイプTOEICもこの方法で何とかしのいでいる次第)だったので、もともとキーワードだけは聞き取れていたことが多いのだが、それにしてもAIが正確に文字起こししてくれたもの視覚情報として入ってくるのは、想像以上に大きい。

ただ、問題点はこの文字列をどこで見るかだ。手元に泥タブやPixel3を置くのももちろん良いのだが、できればチンアップした状態で聞きたい。となると、目の前に仮想現実を写すスマートグラスの出番だ。

幸いにもエプソンが出しているMoverioはAndoroidの画面を投射できるらしい。

https://epson.com/moverio-augmented-reality

こいつにPixel3を繋げば、外人と会話しながら、常に英文字幕確認できることになる。

もっと言えば、仮にMoverioに2窓を映せるとしたら、自分日本語での受け答えを音声認識させ、そいつGoogle翻訳自動翻訳させた英文を表示させることも可能かもしれない。あとはそれを口に出して読み上げればいいだけなのだから、まさにほんやくコンニャクだ。いずれ読み上げるところも自動音声が代替するようになるだろう。

そんな時代がすぐそこまで来ていることに安心し、俺は英語勉強するのを一切止めることにした。今後はTOEICの点数を競う時代ではなく、上記のようなガジェットをどれだけ使いこなせるかの勝負になるのではないだろうか。

余談:最近英文書類も「みらい翻訳」で一度翻訳してから読むようにしている。理解スピードが上がるし、英文読解で何より怖い「先入観」によるミスリードを防止できる。最近英文メールも面倒くさくなって、一度日本文をみらい翻訳英文翻訳させてからアレンジして送るようにしている。

https://miraitranslate.com/trial/

2019-08-31

anond:20190830202743

「お前の音声を録音して参考にするよ」みたいなメッセージ出してくるくせに、何十回言っても最寄り駅をまともに音声認識しないので困っている。

2019-08-19

音声認識型の魔法戦闘VRゲームだってSUGEEEEEEEEEEEE!!!



音声は聞いてなくて、映像しか見てないけどすげぇ。

ピカチュウ元気でちゅう 最新版

できないかな。売れると思うんだ。

Google音声認識レベルは上がってきているし

音声認識テキスト化できるのであれば、それを元にどういう動作をさせるか決めるだけだし。

とても楽しいと思うんだ。ピカチュウ元気でちゅう。

ポケGOと同じように、結構ハマる人も出るんじゃ無いかな。

自分だけのピカチュウを育てるの。良くない?

2019-07-18

イーロン・マスクがやろうとしていることが今ひとつはっきり見えてこない

AIというバズワードを交えて攻殻機動隊ハッカーみたいなことができそうに語っているが、

実際のところ脳インターフェースから入力が広帯域データだったとして、それを受け取って活用できるソフトウェア

現実には存在しないし、それをどうやって作ればいいかのとっかかりも無い。

単純に念力マウスや内話音声認識ができるだけでも便利だとは思うが……。

2019-05-16

anond:20190516162837

から、俺はアクセルペダルを2段階認証方式にして、

アクセルペダルを踏みながら、「アクセルアクセル」と連呼している間だけ、

音声認識によりアクセル機能動作する方式が良いのではと提案している。

2019-05-04

なあ、前から思ってるんだけど

Googleって実は大した技術力ないんじゃないか

2019年になってもナビは変な道案内するし翻訳音声認識もいつまで経っても進化しない

何より本業検索が「彼氏は?」「いかがでしたか?」みたいなのにずっとやられっ放しやん

ちょっと前もやれ入社しただの退職しましただの一部で盛り上がってたけど要はそんなんで嬉しがる雑魚が出入りしてるって事だろ、でかくなりすぎてもう駄目になった企業典型

あえて言おう、Googleカスであると!

2019-04-19

anond:20190419093947

知らんけどそれはソフトウェアの作り次第だろ。

siri音声認識レイテンシは1秒以内だったと思うし、認識したのを即変換エンジンに流したり変換エンジンがお休みしてる時は「え~」とか「う~」とか適当なボイスを入れておくだけで大分違うと思うぜ。

ログイン ユーザー登録
ようこそ ゲスト さん