「OCR」を含む日記 RSS

はてなキーワード: OCRとは

2021-09-29

衆院選Twitter開票所速報ってできないか

しかしたらもうすでに組織的にやられているのかもしれないけど、ふとそんなことを考えてどんどんアイデアがふくらんで興奮してきたので増田アウトプット

国政選挙では全国1747の市区町村で一斉に開票が行われるわけだけど、これを草の根で速報して集計できたら面白くない?と思った。
やることは単純で(③は単純じゃねえよ!って怒られそうだけど)
①ひまな人がスマホ片手に最寄りの開票所に行って
開票速報が場内に張り出されたら写真とってツイートする。あらかじめハッシュタグきめとく。まあタグ打ち職人リツイートにまかせてもいいか
③賢人がそれをうまいこと集計して(フォーマットまちまちだとOCRはむずいか?)選挙区ごとの票数や当落を集計してババンと発表する
という内容。
少なくとも選挙の夜のお楽しみがひとつ増える。

そんなんテレビネットニュースでやってんじゃん、と思われるだろうけど、次のような意義があるんじゃないかと思った。
民主主義のよって立つ基本である選挙データをみんなで収集してつくったら、たぶんマスコミにはけっこう大きな打撃になるんじゃないかと思う
衆院選場合当落はどうせ出口調査でわかってるんだから今更判定なんてイラネ、とはならない。なぜならば比例区復活当選(という仕組みがあるのだ。あんまりわかりやすくないけどhttps://www.pref.tochigi.lg.jp/senkyo/24shugi/qanda/qanda-10.html)は実票の比率で決まって、それも場合によっては結構きわどいところで優劣がついているので(https://ja.wikipedia.org/wiki/%E6%83%9C%E6%95%97%E7%8E%87)、出口調査レベルの誤差では判定不能だろう。うまく集計できたらマスコミに先んじて当確を判定できそう

①について補足すると、現在すでに事件事故現場第一報はTwitterFacebookなどで伝えられていることがほとんどだけど、インナーサークル情報を独占している政治経済や、金とノウハウがモノをいう選挙報道にはアマチュアが入り込む余地は少ない、とされていたと思う。
でも選挙開票は公開で行われるのが原則で(公職選挙法第69条?)、そこに素人がつけ込むことは十分可能だ。②みたいにマスコミの鼻を明かすことができたらなおさら

中国北朝鮮みたいに政権が発表する選挙結果が眉唾だったりフィリピンみたいに武装ゲリラ投票箱を強奪する国に、日本も遠くない将来にならないとは限らないので、今から草の根監視システムを養っておいた方がいいなじゃいか、という気もちょっとだけあるけど、シンプルゲームとして面白いと思う。
特に18歳の君は立派な選挙人なので、受験勉強の合間に近くの公民館体育館でやってる開票作業の様子をのぞきに行ってパシャっと撮ってきてくれないか、と思う。バイトテロより楽しく有意義だ。君のデータが誰かの当落を決めるかもしれん。俺も当日暇ならやりたい。
実は開票所の中の様子はよく知らないんだけど、もし最高裁判事審査結果も貼り出されたり現地発表されたりしているのであれば、それもぜひ集計したいところ。これってテレビリアルタイムに積み上げた数字を見たことない気がする。

選挙結果に興味があるのであれば右翼でも左翼でも関係ない。なんなら候補者関係者(誰かしら陣営の人が詰めているんでしょ?)がやってくれてもいいと思う。
開票トラブルがあると夜明けまで泣きながら市職員らが開票作業をしているらしいけど、まあ無理して全部付き合うこともないでしょう。飽きたらてきとうに帰ればいい。
ほんとはTwitterジャパンあたりが枠組みつくって呼びかけるべきテーマなのかもしれないけど、とりあえずデータをすくって放流すればあとは誰かが役に立ててくれるんじゃないかSNSなんてそんなもんじゃいかと思った。

2021-09-10

anond:20210910113555

人類は率先してそういう個体を淘汰してきたぞ

公的な場からの性の排除はそれこそ紀元前からやってること

公の場でちんこもみもみしてるのが許容されてる国ってないでしょ?

キスですらこのレベルだぜ。サラダ油はマジ頑張ろうな

 

ロマンチックまたは性的愛情の公開展示

ロマンチック愛情性的愛情を公に示すことは、それが予期されていなかった場合に、多くの人々を不快にさせます

たとえば、キスセックスではありませんが、他の人がキスするのを見ると、不快に感じる人もいます

これは、学校職場家族など、性的ではない状況から知っている誰かが、予期していなかったとき

ロマンチック方法で誰かにキスしたり触れたりするのを見た場合特に当てはまります

 

公共の場相手の頬にキスをするのは通常適切ですが、

メイクアウト」(いちゃつく)したり、連続して何度も相手キスしたりすると、見物人を不快にさせる可能性があります

同様に、頬にしかキスをしていなくても、二人がとても近くに座っていたり、どちらかが相手の膝の上に座っていたりすると、

それもまた周囲の人を不快にさせてしまうかもしれません。

例:
ダニエルと彼のガールフレンドのナオミは、ある夜、友達と夕食に行きました。
夕食時、ダニエルとナオミはとても近くに座って、頬と唇に何度もキスしました。
ダニエルとナオミの友達はこれを見てとても不快で恥ずかしい思いをしました。
彼らはその夜ダニエルとナオミと過ごす時間を楽しんでおらず、次に夕食に行くときに彼らを招待しませんでした。

 

OCRSEX ED. FOR SELF-ADVOCATES:

https://researchautism.org/sex-ed-guide/

2021-09-02

PDF公開はいらない

https://www.digital.go.jp/posts/kMccIpBR

この記事ブコメがまぁまぁひどい。

論点

デジタル庁ともあろうもの役員人事の情報PDFだけで公開するのはどうしたものか」

という点なんだけど、やたらPDF擁護派が目立つ。

そもそもデジタル化(デジタライゼーション)とは

これまで紙文書として管理していたものWordExcelPDFにして管理することで

無駄プリンターでの印刷や紙媒体の保存などから脱却する、というのはデジタル化ではなくて単にペーパーレス

デジタル化というのはそれらの文書管理されていた情報構造化されたデータ統一

検索可能にしたり統計処理可能にしたりすることで業務効率化や解析による知見の発見を目指すもの

単に人事情報をPDF化したり、それをHTML化したりしてもまったくデジタル化ではない

大手企業とか政府とかならPDFHTMLになる前にシステムに投入してるんでしょ?」

と思う人が多いかもしれないが、実体としては大手企業政府ほどそういうシステム導入がされておらず

実質的に共有フォルダに置かれたPDFファイル管理されていたりする

これには定期的な人事異動が関連していて、システムを導入するとシステム操作の習熟という引き継ぎが発生してしまうために業務効率が悪い

それよりも一般常識化しつつある共有フォルダに設置されたPDFPPTを閲覧してもらったり編集して貰う方が誰でもできるし効率的、という現実があるためだったりする

この辺がPDF擁護派が本来主張しなければいけない部分

デジタル化の肝

こういった状況の大手企業政府に対してデジタル化を推進してもらうために取るべき方策は下記の通り

この3つを全て進めていかないとデジタル化はただのペーパーレス化になる

よくあるのは2つ目だけが行われ、慣例的に文書管理されているPDFファイルを共有フォルダではなくシステム投入するだけのデジタル化だ

結局データ解析できないからそのPDFOCRしようとかいう謎のムーブメントを見せたりするが

PDFに書かれている内容が構造化されていないので当然ながらデータ化できず、解析もできない

よくある領収書とか請求書とかは解析ができたりするがそういうのはそもそも電子的にやりとりされていてやる必要が無く

社員による立て替え払いの時だけ発生していたのがデジタル化されてお茶を濁される

PDFを公開することの何がダメ

「内部でPDF管理しているんだから公開するときはそのファイルリンクすればいいよね」

という安易な考え方に基づいてるのがPDFファイルWeb公開

まり1つ目の業務単位での見直しができていないし、2つ目のデータ構造化も行われていないだろうということが予想できる

また3つ目の利用者メリットのことを考えてみても、この役員人事の情報PDFで貰わないと困る一般人など存在しない

どうしても印刷したい人とか、どうしても自分管理している共有フォルダに置きたい人、なんかはいるのかもしれないが

それにしてもHTML表示されているものを保存するなり印刷すればよい

それよりもスマホで見ているのにA4縦の形式で表示される方がよっぽど不利益が大きい

デジタル化することで構造的なデータにさえなれば、表示する媒体に合わせてレイアウトを変えることは難しくない(大変ではあるが)

また、もしかしたら別の省庁や地方自治体とかがPDF保存している、というのは2つ目の統一的なシステム化ができていないことを意味する

まぁそもそもそれが本当に必要かという話にはなるだろう

PDFであれば改変ができないので公文書には最適」

などという意見もあったりするが、そもそもPDFであれば改変できないというわけではないし

今時なら画面キャプチャしてOCRをかければほぼ同じものが出来てしまうのでほぼ無意味である

それよりもTLS化されているURLで改変されていないことを保証することの方が何倍も役に立つ

結局のところPDFでこの手の情報を公開することには何のメリットもないが、ペーパーレス化のレベルで止まってしまうとPDFメリットばかりを主張しがちになってしま

今回のPDF公開は何がダメ

結論から言うと別にダメではない

発足したばかりの組織上記の3つをいきなり解決できるわけがない

これから少しずつデジタル化していくのだろう

ただ、一番大変なのは業務見直しである

この慣例的に行われているPDFファイル公開をやめる・やめさせるのは大変に骨が折れる

単純に「やめなさい」と下達的に言うだけなら簡単だが

そうなると結局はPDF管理HTML編集の2倍の工数がかかって実務者の反発しか生まない

更にはPDFHTMLの二重管理になってしまって不整合が発生する、なんていうのも想像できる

業務見直しシステムを入れ、利用者作業者メリットを与える、という3つを同時に進めないと上手くいかない

大きな組織でこれをやるのは非常に骨が折れるだろうが頑張って欲しい

PDF公開が無くなったときにはこれほどの大きな調整が行われたのだ、と素直に喜びたい

2021-08-14

マンガ表現力ってすごいな。

USBメモリ → セキュリティ皆無

・端末用にデータ組んどいた → サーバーサイドで処理できないから手動補正している

Excelデータ間違ってたよ? → 間違える余地のある手入力運用をしている

・紙の書類どっさり → OCR業務データに組み込む等のシステム存在していない

日本ほとんどの中小企業はこんな感じだろーなーと非常にわかやすい絵。

この1ページだけでこの会社業務運用がクソだとわかる。

マンガ表現力ってすごいな。

https://is.gd/vDTfml

2021-08-05

[]

けさソーター付スキャナで2度も紙詰まり起こしたわ。_| ̄|○OCRいいんだけど、スキャンしたデータ個別ピングとかペグとかのファイルに変換するところが面倒。というか複数ページのTIFF複数ファイルPNG変換方法からない。

2021-08-01

anond:20210801180913

ぶっちゃけ小泉さん農協系も潰したかったのだろうけど、時間憲法改正とか、そんなんで不可能だったみたいね

もう、JA 系の農林中央金庫システムATM や DX 化と流れに取り残されていて、かんぽとゆうちょ金融商品競争力でも勝てる未来が見えない。確かに ゆうちょ投資信託品質問題あったし、かんぽ生命問題社会問題化されてたよ。でもさ、ペンタブとかでサイン電子化、窓口で OCR で一瞬で登録、局員の持つ端末の高性能化、簡易郵便局リストラで、ここ10年で民間企業競争できる会社になりつつあるし、おそらく地銀は辛いと思う。

例えば、ATMデザインオペレーション比較してみろって。国内だと、セブン > ゆうちょ > MUFG > SMBC > みずほ > LANAEON > 地銀 > JA って感じだろ。それに、ゆうちょ銀行は俊敏性が高い。スマホアプリでも都市銀行に負けない開発速度で作ってくるし、なんか昔の謎な機能実装したりせずに素直に技術トレンドにのったアプリを作ってくる。おそらく、というかクレカJCBSMBC 系のシステムだけど、それでも Mijica というプリペをサクサク作る会社になってしまった。

一方で、JAJF はどうかな。親元の農林中央金庫はともかく、末端はコネ社員グダグダばかりがきこえる。システムも、MUFG流通してくれた感が溢れるものばっかりじゃないか最近JA の機材で「これは!」っていうのを聞いたかね?好きなくとも、俺はないよ。

それに、JA自動車保険が強いけど、かんぽ生命が参入すると、資本主義の犬になったかんぽ生命リセラーは強いぞ。ゆうちょ銀行は、今のところ iDeco にやる気ないけど、チャンスは常に伺っているぞ。あと、ゆうちょ銀行は個人向けのローンを組むノウハウをスルガ銀の窓口になって蓄積していってるからJAマイカーローンも虎視眈々と狙っているぞ。

ゆうちょ銀行とかんぽ生命は、確実に田舎で負けない組織になりつつあるぞ。都市部では JR とおんなじことやって、めちゃくちゃ金満ビル作ってるし、とは言っても JA にはそんな一等地不動産がないだろ。農林中央金庫はともかく、地方JA は。もう、そうなると郵便資本駆逐されるのは時間問題じゃないの?

ちなみに、本当に文句をつけたいのは、郵便系のカラーリング。緑は MUFGかぶるから、辞めてほしい。JA が緑で、JF が青なのは背景的にしかたがないが、郵便系は違うだろ。そうだな「ゆうちょ銀行が金(イエロー)で、かんぽ生命が銀(シアン)で、郵便が銅(マゼンダ)」にしてはどうかな?そろそろ、ゆうちょ銀行のキャッシュカードデザインは古いから、CI変更にしてみては如何でしょうか。

2021-07-19

汚い字は字ではないことをもっとちゃんと教えるべき

ブクマ集めてた件。

上手い下手は別として、誰にでも読める、誤読されえないという字は紙と鉛筆が消え果るまで必要ものだ。

国語は当然、算数でも、蛇がうにょろうにょろとしてcmなのかcnなのかよくわからん単位を書いてしまえば「×」でいいんじゃないの?


これを人間教師)が判定するのはおかしな話でもあるんだけど、じゃあいちいちOCRかけるの? OCRはどこのが最適なの? って突き詰めていくと、結局は自分他人から読みやすい字を心がけるしかなくて、それは小学生には難しい話で、機械化も無理で、教員良心暴走で伝授していくしかない。

(もちろん外れ教師に対して文句言う権利はあるとは思うが、多分おそらく予想だけど、そういうのに文句言う親って子供教育ちゃんとできないタイプから子供が将来不利益を被る)

自分なんて、習字を習ってたから筆で気合いれたらそこそこ上手い字は書けるが、メモとかノート取る時とかめっちゃ適当やってたから、あとから自分でも読み返せなくてメモ意味がなくなってる。

署名とか適当でよいし、なんかの手続き書類とかも郵便番号と番地さえあればなんとかなるので、そういう役所とか手続き系以外は全部デジタルにしてなんとか生きてけてる。

試験勉強自分が頑張って取ったノート意味なかったのは地味にきつかったが。

なんでもかんでもデジタル化されてくから、読みと意味さえわかれば大人になって苦労することはない、最低限自分名前だけでも書ければって意見なら尊重する。

10年後とかだとまだ、会議を録画したり、音声入力議事録とったりとか(そもそも会議自体無くてもいいと思うけど)、そこまで世間進歩してなさそうでもあるんだけど。

マナー会議中にPCキーボード叩いたら駄目みたいなのがあるからホワイトボードに書いてスマホ撮影して配布するみたいのめちゃめちゃ無駄なこととかやってるとこも無くならないんだし

2021-07-10

anond:20210709222822

ホントこの通りで

現場からすると

VRS=内閣官房ワクチン接種実績をアピールするためだけに考え出されたシステム

しかない。

このVRS、クソボロいNTTドコモタブレットで接種券番号の数字OCRで読み取らせるとかどんな拷問なんだろう?

接種券にあるバーコード意味???

あとこの時間がかかるOCRで読み取ったあと接種日とワクチンロット番号を目視確認してから登録して作業完了

きっと八甲田山死の彷徨もこんな感じだったんだろうなぁ〜〜

2021-07-05

スマホめんどい

統計データPDF からほんの 20 件弱のただの足し算の合計を知りたかった。

PC ならスプレッドシートコピペ10 秒以内、普段使わない OCR ソフトを読み取りに持ち出しても 30 秒以内には分かることだろう。

スマホでやりようがあるのは知っているが、アプリを切り替えたり普段使わないアプリライブラリから探すか似た機能提供するサイトを探して閲覧するまでに数分はかかりそうで、めんどいからいいやと思った。

他人が決めた区切りで何割ですって言われなきゃ、自分計算なんかせずそうなんだーで済ますだろう。

スマホ作業効率の話になるとタイプフリックの速度差なんかが比較されるが、ただ入力するなら音声入力一択だ。問題編集だ。

情報を加工しない計算しないデータおよび校正しない文章なんかあってもなくてもどうでもいい。動画でも撮ってろ。

データを処理しない高性能コンピュータを手に乗せて我々はなんで退化してんだ。鵜呑みにするだけか。

2021-06-14

底辺ITワーカーだからからの指示ファイル

ワード作成したもの代理店などを介することでプリントアウトした用紙に手書き追加したものになってやってくる

ワード文章ならOCRである程度いけるけど手書き部分は写経しないとダメなのがつらい

2021-06-02

anond:20210602222800

OCRFAX代10万をケチるという意味では

OCRリモートにすると、事務員交通費が0円になるから

どう考えてもOCRインターネットリモートアウトソーシングとなるんだが

もちろんオフィス派で事務員派だからアウトソーシングには否定的だが

いわれていることは聞けば聞くほど、いやあなたアウトソーシングしたほうがいい、となりそう

anond:20210602220950

であることが重要なの

なぜならパソコン使わずに済むから

データで送ってください」の意味が通じないレベルの人がいっぱいいるんだわ

信じられないだろうけどそういうことな

あとね、伝票は複写なの

複写の伝票を1枚ずつ社内や社外に回していくワークフローガチガチに出来上がってるの

ワークフローごと変えるのは時間予算も根回しも教育も沢山必要から

OCRにかけて電子化してお終いなんて簡単な話ではないんだ

anond:20210602220950

OCR化ができる、っていうことは概念として理解できても、

そのためにNASやら複合機の設定やらVPNルータやら、

そこのあたりがハードルになるのかもしれない

anond:20210602220515

いやFAXなんて、電子化されて送られてくるから

送ってこられる側からOCR電子化するのがこれほど簡単ものはなく

伝票のたぐいもOCR化しやすいし

事務類はアウトソーシングやすい=リモート化しやすいということでな

 

しろリモート機材を売っている

自分らが、

オフィス通勤していて、コロナみたいな、オフィスに出社しない特殊事情みたいな災害用で売ってるんだが

なにがオフィスのほうが良くて

なにがリモートのほうが良いか研究した結果

オフィスを持つという

2021-05-27

"パルパルクー"

5 件 (0.25 秒)

http://olis.or.jppdf › kansa2013

PDF

2014/05/13 — パルパルクー. * 小林一章. ** 14 野 一郎. 私たち監事は、2013年4月1日から 2014​年3月31日までの2013年会計年度における会計及. び事業執行監査をおこない、​次のとおり報告する。 1. 監査方法概要. 1. -. 4. (1)会計監査 ...

OCRが何かを読みとっている・・・

2021-05-25

世界初PDF追記アプリ「AxelaNote」

PDFに透明のOCR領域重ねるのは知ってたけど、そこにベクトルデータも貼り付けられるのか。

と思ったら別データを専用アプリ管理する形か。

これは良いアイデアだし日本企業向きというか、囲い込みがしやすビジネスだなあ。なぜ今までなかったのか。

技術的にも枯れてるから原価ほぼ人件費だけやん。

ゼロックスDocuWorksを思い出した。

AxelaNote」は「編集しない」から追記できる」

原本となるPDFファイルに重ねた「透明なシート」に追記する(プレスリリースより引用

 「PDF」にはいろいろな状態がある。自分作成したPDFファイルなら、一般的PDF編集ソフト問題なく扱える。しかし、謄本などの公的文書設計図面などのPDFでは、注釈編集制限されているものもある。改ざんを防ぐために当然なのだ業務では困ってしまう。そこで「AxelaNote」を使ってみたい。

 「AxelaNote」の特徴は、PDFファイルのものを「編集しない」ことで、どんなPDFファイルにも「追記できる」ことだ。矛盾して聞こえるが、修正指示などの赤字原本となるPDFファイルに重ねた「透明なシート」に書き込むことで実現する。

 ペーパーレスで、PDF原稿データ手書き校正できるのは助かる。いわゆる注釈機能を使った手書きよりも操作性がいい。修正後のデータaxlファイルかぶせる修正チェックは効率的だ。書籍校正では、書き込み履歴CSVで出力できるので、修正確認の精度も上がる。

https://forest.watch.impress.co.jp/docs/special/1325126.html

2021-05-20

anond:20210519214122 政府向けシステムの話をするときの前提知識

政府向けシステムに関わったことがある身からすると、政府向けシステムの話をするときに前提として知っておいてほしいことは、住基ネット最高裁判決に「現行法上,本人確認情報提供が認められている行政事務において取り扱われる個人情報一元的管理することができる機関又は主体存在しない」という骨子があること。これによって政府向けシステム個人情報一元的管理できず、個人情報各自治体で分散管理しかできない。この文面でググれば政府がどれだけこの骨子を気にしているかは分かると思う。

今回の話は「国民マスターテーブルを持たずに認証するにはどうすべきか」という政府向けシステムで常に挙がる課題で、良いアイデアがある人は政府提案しにいってほしい。個人情報保護法の目的外利用に違反しない上で。

はがき送りつけ

これをできるのは自治体のみで防衛省はできない。防衛省国民の住所氏名を知らないのではがきを送れない。防衛省に限らず、どの省庁も国民の住所氏名を一元的には知らないので、政府はできない。

自治体から発行済接種番号と生年月日のペアデータ提供を受けて、接種番号をIDとし、生年月日を仮パスワードとして登録し、認証システムとする。

かなり難しい。上の骨子により防衛省個人情報一元的管理することができないので、最高裁判決とは条件が異なることを主張しないといけない。たとえば「都市圏だけなので一元ではない」とか。それに国民野党が納得するかどうか。これがひろみちゅの言う「政治的にそう言えないというのはあり得るが、乗り越えなければならない」課題

来る者拒まずベストエフォート方式にする

これで良いなら予約システムなんていらないけど、密を作って高齢者に何日も前から徹夜で並ばせるのが今のシステムより良いと思う?

どうすればよかったのか?

政府が使える一元的情報マイナンバーしかない。マイナンバーカードを読み取れる人だけが利用できる予約システムなら認証できるけど、自治体ネット予約さえ高齢者には使えないと叩かれているのに「マイナンバーカードとリーダー必要です」なんて要件で作れるわけがない。そもそも短期間に多くの人に接種させる」という目的にもそぐわない。

各自治体の予約システムAPIを持って防衛省が接種券番号の有効性をAPI確認できれば認証できるけど、首都圏だけで200以上ある自治体がばらばらに調達しているすべての予約システムに高負荷でも落ちないAPI共通仕様で緊急で作らせれる必要がある。けど、そんな体力があるならば自治体の予約システム自体が落ちないようにすれば良いわけで、大規模接種自体不要かもしれない。

個人情報一元的管理することができる機関立法すればできる。けど、そんなものは「たった1年」じゃ作れない。マイナンバー住基ネットに何年掛かったと思っている?「パンデミックという緊急事態なので防衛省高齢者個人情報一元的管理することができる」世界は「戦争という緊急事態なので防衛省20代30代男性個人情報一元的管理することができる」世界につながっていることを理解した上で、国民はこの法案に賛成できるのか? できるなら、良くも悪くも政府向けシステムの将来は大きく変わる。

結局、「国民行政サービスを直接提供するのは自治体で、そのための個人情報を持っているのも自治体政府自治体支援する」というデザインですべてが作られている日本において、菅の「政府主導でのワクチン接種」というアイデアの実現がそもそも無理ゲー出生届転入届を出すのは各自治体、運転免許の番号を発行しているのは各都道府県公安委員会政府国民個人情報一元的に入った共通データベースをどこにも持っていないか管理できない。従来通り、政府自治体支援に特化するべきだった。

中国みたいな管理国家日本はならないという選択国民がした時点で、この予約システムでの認証実装難易度は相当高い。ウイルスとの戦いに強い国は戦争にも強い国で、「人間にせよウイルスにせよ、敵との戦いに勝つために国民政府にどれだけ一元管理されてもよいか」の総意を国民が取らないといけないので、マイナンバー住基ネットの実績を考えると1年くらいの準備期間じゃ、みんなが期待している認証をこのシステムでは実現できない。

認証は無理としてチェックデジットくらいは入れられたのでは?

チェックデジットがないことで誰かの誤入力自分の予約ができない確率が上がっているのは残念。ただ、発券しているのは各自治体なのでチェックデジットをつけられるのも各自治体なので、開発会社防衛省もやれることはない。誰なら事前に自治体統一仕様で作らせられたかというと厚労省だけど、接種券の仕様が決まったあとに大規模接種の話が出てきたので事後諸葛亮こんなこともあろうかとチェックデジットの指摘が事前にできる勘が良い人がいたなら、たぶん落ちない予約システムの作り方の指摘も事前にできただろうから、大規模接種自体不要だったかもしれない。

いたずら予約で枠を全部押さえられたらどうするの?

現状でもreCAPTCHABot対策されている。reCAPTCHAを越えて大量予約するやつは悪意があるので逮捕で良いでしょ。

接種券番号のバリデーションは無理として、市区町村コードバリデーションはできたのでは?

できた。でも、接種券番号のバリデーションができない時点で大した意味はない。入力フォーム電話番号SMS送って電話番号全体の有効性を確認することはあっても、市外局番存在有無だけをバリデーションするなんてことしないでしょ。入力された市外局番市外局番マスターを引きあててバリデーションをしている者だけが石を投げられる。

生年月日が65歳未満でも登録できるのはバリデーションすべきでは?

防衛省は生年月日の正しい情報を持っていないので、この数字に大した意味はない。たぶん予約キャンセル用のパスワード相当、当日の誤入力を見つけるためのヒントくらいの意味しかない。「パスワードを設定してください」でも良かったんだけど、高齢者には難易度が高いと思って生年月日にしたんだろう。秘密質問みたいなものあなた母親旧姓が本当に正しいかどうかにシステム側は興味がないのと同じくらい、この生年月日が正しいかどうかに大規模接種予約システムは興味がない。

SQLインジェクションは?

いまだに具体例が出てこないので、多分ガセ

接種券番号だけがユニークになっている

異なる市町村番号+同じ接種券番号+異なる生年月日でログインできないことで接種券番号だけがユニークと主張しているけど、ログインできない理由はそれだけじゃない。たとえば2-123,5678がすでに登録されていることをこの人は知らない状況で、この人は1-123,1234でログインできるけど、2-123,7890はログインできない。システムとしておかしくない。

追記(2021/05/21 2:45)

よくあるコメントに返信。

接種番号と生年月日は個人情報ではない

法律素人システム屋なので、この指摘は正しいのかもしれない。一方で「個人情報とは個人を一意に識別できる情報のことを指すもの」というコメントもある。私には判断できないけど、仮に個人情報ではないとすると、

かなり難しい。上の骨子により防衛省個人情報一元的管理することができないので、最高裁判決とは条件が異なることを主張しないといけない。たとえば「接種券番号は個人情報ではない」とか「都市圏だけなので一元ではない」とか。それに国民野党が納得するかどうか。これがひろみちゅの言う「政治的に(『接種券番号と生年月日は個人情報ではないので一元管理します』とは)言えないというのはあり得るが、乗り越えなければならない」課題

が正しいのかもしれない。住基ネット最高裁判決によって政府向けシステム認証機能をつけることは想像以上に難しいという趣旨は変わらないけど、悪いのは菅じゃなくて「個人情報ではない」で突っ張れなかった防衛省なのかもね。いずれにせよ「認証すらまともに作れない技術力」から「接種券番号は個人情報なのか」に議論が高まってくれれば書いた甲斐があった。

VRSでは一元管理できている

VRSってのは各自治体の接種会場で使われているバーコードがなくてOCR必要なことで有名なシステムOCRは置いておいて、VRSは一元管理していない。 https://cio.go.jp/sites/default/files/uploads/documents/vrs_overview_210506.pdf の6ページ目に書いてある。

市区町村ごとに区切られて保存されており、個人の記録は、接種券を発行した市区町村確認できます

国民の接種率が重要指標なんだからDBは1個にしたほうが便利なのに、「あえて」区切って保存している。また、個人の記録は各市区町村しか確認できい、つまり串刺しで全国民個人記録を見られる人はいないと書いてある。そんなわけでVRSは「政府は一元管理していません」に気を使っていることが分かる事例。

2021-04-09

DHCヤケクソくじ 会長差別メッセージ追記文 全文文字起こし

同じページへ追記されるとはてなブックマークでは議論ができないので、追記のみこちらに文字起こししました。

画像掲載されていたのでOCRしています。ちょこちょこ読み取りが怪しいので随時修正します。

NHKおはよう日本報道ディレクター大淵光彦と称する人物からDHC広報部に

電話が入り、当方の「ヤケクソくじ」の説明文に人種差別問題が含まれていて、今に

至ってもまだホームページ掲載が続いているがその理由を聞かせてくれとのことで

あった。名前を聞いて、明らかに在日系が好む日本名であることからNHKを騙るコリ

アン系の反日日本人かと思ったが、NHKに問い合わせてみると確かに在籍しているとの

こと。小生は常々、日本朝鮮化ということを何よりも危倶しているが、その元凶である

NHKからの問い合わせに小躍りした。NHKの状況を全国民に周知させる絶好の機会

からである朝鮮化ということではNHKは最も触れられたくない問題のはずである

これはもう日本国民の誰もが気がついていることであると思うが、NHK幹部アナ

ンサー・社員ほとんどがコリアンである出演者についても、学者芸能人スポーツ

選手の多くがコリアン系であり、ひどいことに偶然を装った街角インタビューさえコリア

ン系を選んでいる。予めリストアップしているのである。特徴のある名前とつき出たあご、

引きしまった小さな口元、何よりも後頭部の絶壁ですぐに見分けがつく。サントリーが日

本海を「東海」と言おうが、社員タレントコリアン系ばかりにしようと-私企業である

から誰も文句は言えない。NHKは全国民から強制的受信料をむしりとっている公的

機関であるから放置するわけにはいかない。誰がこんなふうにしてしまったのかというと

自民党の一部のコリアン系の国会議員であるが、野党コリアン系だらけだからNHK

やることには誰もストップをかけない。コリアン系は長い歴史の中で中国を常に宗主国

してきたから、宗主国のやることには逆らえないというDNAができている。韓国歴代

大統領を見るとよくわかるONHK朝鮮半島の悪IIは絶対に言わない。これは同族

から当然のことだが、親分中国にも何も言えない。党員のほぼ全員がコリアンである

立憲民主党は、総務省役人NTT接待に応じたとかのどうでもよい文春の三流記

事を盾にして連日のように国会でがなり立てている。そんな場合ではなかろう。国境を侵

して侵入している敵には即座に銃撃して追い返すのが常識であろう。

小生のことをマスコミ(これもコリアン系ばかり)は人種差別主義者だと言うが、人種差別

というのは本来マジョリティマイノリティに対して行う言動を指すのであって、今や日本

におけるコリアン系はマイノリティどころか日本の中枢をほとんど牛耳っている大マジョリ

ティである毎日ものすごい数で帰化人誕生している。数だけの同族マジョリティ

はなく、彼らは東大京大一橋早稲田を出ていることから政界財界法曹界・マスコ

ミ界という日本の中枢をすべて牛耳っている大マジョリティである

小生はもともと経団連の会員であったが、呆れ果てて昨年の12月に退会した。経団連

会員は日本代表する有名企業ばかりで、コリアン系などいないと思われるでしょうが

ここ数十年の間に続々とコリアン系が増殖して、幹部一般会員だけでなく、会を支え

事務局員までコリアン系で占められるようになった。そのため、彼らは日本のために

働いているのではなく、何かあると必ず中国寄りの態度を示し、韓国には常に同情的で

ある。中国ウイグル族などの少数民族に対してやっていることは明らかに人種差別

最たるものです。アメリカ白人が大多数を占めていた昔なら黒人朝鮮人は差別の対

象になっていましたが、今は一大勢力を形成していますからもう差別とは言えないで

しょう。数の力を頼って、西海岸朝鮮人は今や市議会の中心層になっており、やりたい

放題でマイノリティ日本人いじめています。言いたい事はきりがありませんが、NHK

に対してひと言感想をと言われれば、「NHK日本の敵です。不要です。つぶしましょう。」

株式会社ディーエイチシー代表取締役会長・CEO 𠮷田嘉明

2021-03-22

ワードか何かで書かれた指示原稿クライアントから制作代理店ファックスされて、そのファックスされたものメールで添付されて俺のところに回ってきて、その原稿を元に作業してんだけど、ブラックというより超ド底辺仕事してんなぁ〜って悲しくなってくる

なんでファックスで受けてるのか俺には知らされない

データでくれと一応言ったけどそれはできないという答え

指示原稿の中でFacebookリンクがあってここから文字抜粋してくださいとある

%英数字%英数字%英数字・・・なんて文字をいちいち入力してられっか!

googleドライブに入れてgoogleドキュメントで開くとOCRしてくれるの知ってて助かった

完全じゃないけどある程度文字を拾ってくれるので作業が助かる

写真資料は後日USBに入れて郵送するとのこと

この制作代理店は昔からウンコでもう付き合いたくないんだけど義理があるのでしょうがなく付き合ってるところ

後日USBに入れて郵送・・・

2021-03-18

LINEリリース否定していないこと

私が日本語を読み解いた限りでは否定されていないことです。間違いがあったら指摘お願いします。

ノートタイムライン・Keepの情報は全て暗号化されない状態国外サーバーに保存されていて、国内移転を行う予定はない

「1. 国内ユーザーデータ管理について」から暗号化されてDBに保管されているのはトークだけであり、それ以外はE2E暗号化は行っていない。(通信経路はSSLなどで暗号化されている。)

今後の国内への移管予定も画像動画サーバーのみ。

ユーザー名前電話番号メールアドレスLINE ID中国開発者アクセスできる状態だった

3-2の①の内容からLINE Digital Technology (Shanghai) Limited(大連)において、LINE捜査機関対応業務従事者用CMSの開発業務従事していた人は、これらのデータアクセスできていた。現在アクセス権を削除している。

ユーザー提供した顔写真中国開発者アクセスできる状態だった

3-2の④の内容からLINE Digital Technology (Shanghai) Limited(大連)において、アバター機能LINEアプリ内のOCR機能の開発に従事していた人は、ユーザー提供同意した顔写真データアクセスできていた。現在アクセス権を削除している。

Keep機能で保存したテキスト画像動画ファイル暗号化さておらず、中国開発者確認できる状態だった

3-2の⑤の内容からLINE Digital Technology (Shanghai) Limited(大連)において、Keep機能開発者は、Keepされたデータ全てにアクセスできていた。現在アクセス権を削除している。

2021-03-13

anond:20210313115609

「ル」が「ノレ」になっている

OCRミスだろ

「ポ」が「ボ」になっている

スマホで打ってんだろ

2021-03-04

Power automate desktop を試してハマったこ

スキャンしてOCRかけてデータ化を試してた時にうまくいかない。範囲指定画像認識して範囲指定がうまくいかない。

色々試して解決したのでメモ

スキャン画像と画面表示のdpiを一致させなければいけない模様。

スキャンは200dpiでやっていたのでデータも200dpi作成されていたけど画面が96だった。

powershellスクリプトimagemagick使ってスキャン画像dpiを96に変更してからOCRかけたらうまくいった。

全然ヘルプもなくググってもわからなかったので時間かかってしまったけど解決して満足。

これからもいろいろ試して遊べそう。

ログイン ユーザー登録
ようこそ ゲスト さん