はてなキーワード: OCRとは
もしかしたらもうすでに組織的にやられているのかもしれないけど、ふとそんなことを考えてどんどんアイデアがふくらんで興奮してきたので増田アウトプット。
国政選挙では全国1747の市区町村で一斉に開票が行われるわけだけど、これを草の根で速報して集計できたら面白くない?と思った。
やることは単純で(③は単純じゃねえよ!って怒られそうだけど)
①ひまな人がスマホ片手に最寄りの開票所に行って
②開票速報が場内に張り出されたら写真とってツイートする。あらかじめハッシュタグきめとく。まあタグ打ち職人のリツイートにまかせてもいいか
③賢人がそれをうまいこと集計して(フォーマットまちまちだとOCRはむずいか?)選挙区ごとの票数や当落を集計してババンと発表する
という内容。
少なくとも選挙の夜のお楽しみがひとつ増える。
そんなんテレビやネットニュースでやってんじゃん、と思われるだろうけど、次のような意義があるんじゃないかと思った。
①民主主義のよって立つ基本である選挙データをみんなで収集してつくったら、たぶんマスコミにはけっこう大きな打撃になるんじゃないかと思う
②衆院選の場合、当落はどうせ出口調査でわかってるんだから今更判定なんてイラネ、とはならない。なぜならば比例区の復活当選(という仕組みがあるのだ。あんまりわかりやすくないけどhttps://www.pref.tochigi.lg.jp/senkyo/24shugi/qanda/qanda-10.html)は実票の比率で決まって、それも場合によっては結構きわどいところで優劣がついているので(https://ja.wikipedia.org/wiki/%E6%83%9C%E6%95%97%E7%8E%87)、出口調査レベルの誤差では判定不能だろう。うまく集計できたらマスコミに先んじて当確を判定できそう
①について補足すると、現在すでに事件事故現場の第一報はTwitterやFacebookなどで伝えられていることがほとんどだけど、インナーサークルで情報を独占している政治経済や、金とノウハウがモノをいう選挙報道にはアマチュアが入り込む余地は少ない、とされていたと思う。
でも選挙の開票は公開で行われるのが原則で(公職選挙法第69条?)、そこに素人がつけ込むことは十分可能だ。②みたいにマスコミの鼻を明かすことができたらなおさら。
中国や北朝鮮みたいに政権が発表する選挙結果が眉唾だったりフィリピンみたいに武装ゲリラが投票箱を強奪する国に、日本も遠くない将来にならないとは限らないので、今から草の根監視システムを養っておいた方がいいなじゃいか、という気もちょっとだけあるけど、シンプルにゲームとして面白いと思う。
特に18歳の君は立派な選挙人なので、受験勉強の合間に近くの公民館や体育館でやってる開票作業の様子をのぞきに行ってパシャっと撮ってきてくれないか、と思う。バイトテロより楽しく有意義だ。君のデータが誰かの当落を決めるかもしれん。俺も当日暇ならやりたい。
実は開票所の中の様子はよく知らないんだけど、もし最高裁判事の審査結果も貼り出されたり現地発表されたりしているのであれば、それもぜひ集計したいところ。これってテレビでリアルタイムに積み上げた数字を見たことない気がする。
選挙結果に興味があるのであれば右翼でも左翼でも関係ない。なんなら候補者の関係者(誰かしら陣営の人が詰めているんでしょ?)がやってくれてもいいと思う。
開票でトラブルがあると夜明けまで泣きながら市職員らが開票作業をしているらしいけど、まあ無理して全部付き合うこともないでしょう。飽きたらてきとうに帰ればいい。
ほんとはTwitterジャパンあたりが枠組みつくって呼びかけるべきテーマなのかもしれないけど、とりあえずデータをすくって放流すればあとは誰かが役に立ててくれるんじゃないか。SNSなんてそんなもんじゃないかと思った。
https://www.digital.go.jp/posts/kMccIpBR
論点は
「デジタル庁ともあろうものが役員人事の情報をPDFだけで公開するのはどうしたものか」
これまで紙文書として管理していたものをWordやExcelにPDFにして管理することで
無駄なプリンターでの印刷や紙媒体の保存などから脱却する、というのはデジタル化ではなくて単にペーパーレス化
デジタル化というのはそれらの文書管理されていた情報を構造化されたデータに統一し
検索可能にしたり統計処理可能にしたりすることで業務効率化や解析による知見の発見を目指すもの
単に人事情報をPDF化したり、それをHTML化したりしてもまったくデジタル化ではない
「大手企業とか政府とかならPDFやHTMLになる前にシステムに投入してるんでしょ?」
と思う人が多いかもしれないが、実体としては大手企業や政府ほどそういうシステム導入がされておらず
実質的に共有フォルダに置かれたPDFファイルで管理されていたりする
これには定期的な人事異動が関連していて、システムを導入するとシステム操作の習熟という引き継ぎが発生してしまうために業務効率が悪い
それよりも一般常識化しつつある共有フォルダに設置されたPDFやPPTを閲覧してもらったり編集して貰う方が誰でもできるし効率的、という現実があるためだったりする
こういった状況の大手企業や政府に対してデジタル化を推進してもらうために取るべき方策は下記の通り
この3つを全て進めていかないとデジタル化はただのペーパーレス化になる
よくあるのは2つ目だけが行われ、慣例的に文書管理されているPDFファイルを共有フォルダではなくシステム投入するだけのデジタル化だ
結局データ解析できないからそのPDFをOCRしようとかいう謎のムーブメントを見せたりするが
PDFに書かれている内容が構造化されていないので当然ながらデータ化できず、解析もできない
よくある領収書とか請求書とかは解析ができたりするがそういうのはそもそも電子的にやりとりされていてやる必要が無く
社員による立て替え払いの時だけ発生していたのがデジタル化されてお茶を濁される
「内部でPDF管理しているんだから公開するときはそのファイルをリンクすればいいよね」
という安易な考え方に基づいてるのがPDFファイルのWeb公開
つまり1つ目の業務単位での見直しができていないし、2つ目のデータ構造化も行われていないだろうということが予想できる
また3つ目の利用者メリットのことを考えてみても、この役員人事の情報をPDFで貰わないと困る一般人など存在しない
どうしても印刷したい人とか、どうしても自分で管理している共有フォルダに置きたい人、なんかはいるのかもしれないが
それにしてもHTML表示されているものを保存するなり印刷すればよい
それよりもスマホで見ているのにA4縦の形式で表示される方がよっぽど不利益が大きい
デジタル化することで構造的なデータにさえなれば、表示する媒体に合わせてレイアウトを変えることは難しくない(大変ではあるが)
また、もしかしたら別の省庁や地方自治体とかがPDF保存している、というのは2つ目の統一的なシステム化ができていないことを意味する
などという意見もあったりするが、そもそもPDFであれば改変できないというわけではないし
今時なら画面キャプチャしてOCRをかければほぼ同じものが出来てしまうのでほぼ無意味である
それよりもTLS化されているURLで改変されていないことを保証することの方が何倍も役に立つ
結局のところPDFでこの手の情報を公開することには何のメリットもないが、ペーパーレス化のレベルで止まってしまうとPDFのメリットばかりを主張しがちになってしまう
発足したばかりの組織が上記の3つをいきなり解決できるわけがない
この慣例的に行われているPDFファイル公開をやめる・やめさせるのは大変に骨が折れる
単純に「やめなさい」と下達的に言うだけなら簡単だが
そうなると結局はPDF管理とHTML編集の2倍の工数がかかって実務者の反発しか生まない
更にはPDFとHTMLの二重管理になってしまって不整合が発生する、なんていうのも想像できる
業務を見直し、システムを入れ、利用者・作業者にメリットを与える、という3つを同時に進めないと上手くいかない
大きな組織でこれをやるのは非常に骨が折れるだろうが頑張って欲しい
ぶっちゃけ、小泉さんは農協系も潰したかったのだろうけど、時間と憲法改正とか、そんなんで不可能だったみたいね。
もう、JA 系の農林中央金庫のシステムは ATM や DX 化と流れに取り残されていて、かんぽとゆうちょの金融商品の競争力でも勝てる未来が見えない。確かに ゆうちょの投資信託は品質で問題あったし、かんぽ生命の問題は社会問題化されてたよ。でもさ、ペンタブとかでサインも電子化、窓口で OCR で一瞬で登録、局員の持つ端末の高性能化、簡易郵便局のリストラで、ここ10年で民間企業と競争できる会社になりつつあるし、おそらく地銀は辛いと思う。
例えば、ATM のデザインやオペレーションを比較してみろって。国内だと、セブン > ゆうちょ > MUFG > SMBC > みずほ > LAN や AEON > 地銀 > JA って感じだろ。それに、ゆうちょ銀行は俊敏性が高い。スマホのアプリでも都市銀行に負けない開発速度で作ってくるし、なんか昔の謎な機能も実装したりせずに素直に技術トレンドにのったアプリを作ってくる。おそらく、というかクレカは JCB と SMBC 系のシステムだけど、それでも Mijica というプリペをサクサク作る会社になってしまった。
一方で、JA や JF はどうかな。親元の農林中央金庫はともかく、末端はコネ社員のグダグダばかりがきこえる。システムも、MUFG の流通してくれた感が溢れるものばっかりじゃないか。最近、JA の機材で「これは!」っていうのを聞いたかね?好きなくとも、俺はないよ。
それに、JA は自動車保険が強いけど、かんぽ生命が参入すると、資本主義の犬になったかんぽ生命のリセーラーは強いぞ。ゆうちょ銀行は、今のところ iDeco にやる気ないけど、チャンスは常に伺っているぞ。あと、ゆうちょ銀行は個人向けのローンを組むノウハウをスルガ銀の窓口になって蓄積していってるから、JA のマイカーローンも虎視眈々と狙っているぞ。
ゆうちょ銀行とかんぽ生命は、確実に田舎で負けない組織になりつつあるぞ。都市部では JR とおんなじことやって、めちゃくちゃ金満ビル作ってるし、とは言っても JA にはそんな一等地に不動産がないだろ。農林中央金庫はともかく、地方の JA は。もう、そうなると郵便系資本に駆逐されるのは時間の問題じゃないの?
ちなみに、本当に文句をつけたいのは、郵便系のカラーリング。緑は MUFG とかぶるから、辞めてほしい。JA が緑で、JF が青なのは背景的にしかたがないが、郵便系は違うだろ。そうだな「ゆうちょ銀行が金(イエロー)で、かんぽ生命が銀(シアン)で、郵便が銅(マゼンダ)」にしてはどうかな?そろそろ、ゆうちょ銀行のキャッシュカードのデザインは古いから、CI変更にしてみては如何でしょうか。
ブクマ集めてた件。
上手い下手は別として、誰にでも読める、誤読されえないという字は紙と鉛筆が消え果るまで必要なものだ。
国語は当然、算数でも、蛇がうにょろうにょろとしてcmなのかcnなのかよくわからん単位を書いてしまえば「×」でいいんじゃないの?
これを人間(教師)が判定するのはおかしな話でもあるんだけど、じゃあいちいちOCRかけるの? OCRはどこのが最適なの? って突き詰めていくと、結局は自分が他人から読みやすい字を心がけるしかなくて、それは小学生には難しい話で、機械化も無理で、教員の良心と暴走で伝授していくしかない。
(もちろん外れ教師に対して文句言う権利はあるとは思うが、多分おそらく予想だけど、そういうのに文句言う親って子供の教育ちゃんとできないタイプだから子供が将来不利益を被る)
自分なんて、習字を習ってたから筆で気合いれたらそこそこ上手い字は書けるが、メモとかノート取る時とかめっちゃ適当やってたから、あとから自分でも読み返せなくてメモの意味がなくなってる。
署名とか適当でよいし、なんかの手続きの書類とかも郵便番号と番地さえあればなんとかなるので、そういう役所とか手続き系以外は全部デジタルにしてなんとか生きてけてる。
試験勉強で自分が頑張って取ったノートが意味なかったのは地味にきつかったが。
なんでもかんでもデジタル化されてくから、読みと意味さえわかれば大人になって苦労することはない、最低限自分の名前だけでも書ければって意見なら尊重する。
10年後とかだとまだ、会議を録画したり、音声入力で議事録とったりとか(そもそも会議自体無くてもいいと思うけど)、そこまで世間が進歩してなさそうでもあるんだけど。
謎マナーで会議中にPCでキーボード叩いたら駄目みたいなのがあるから、ホワイトボードに書いてスマホで撮影して配布するみたいのめちゃめちゃ無駄なこととかやってるとこも無くならないんだし
統計データの PDF からほんの 20 件弱のただの足し算の合計を知りたかった。
PC ならスプレッドシートにコピペで 10 秒以内、普段使わない OCR ソフトを読み取りに持ち出しても 30 秒以内には分かることだろう。
スマホでやりようがあるのは知っているが、アプリを切り替えたり普段使わないアプリをライブラリから探すか似た機能を提供するサイトを探して閲覧するまでに数分はかかりそうで、めんどいからいいやと思った。
他人が決めた区切りで何割ですって言われなきゃ、自分で計算なんかせずそうなんだーで済ますだろう。
スマホの作業効率の話になるとタイプとフリックの速度差なんかが比較されるが、ただ入力するなら音声入力一択だ。問題は編集だ。
PDFに透明のOCR領域重ねるのは知ってたけど、そこにベクトルデータも貼り付けられるのか。
これは良いアイデアだし日本企業向きというか、囲い込みがしやすいビジネスだなあ。なぜ今までなかったのか。
原本となるPDFファイルに重ねた「透明なシート」に追記する(プレスリリースより引用)
「PDF」にはいろいろな状態がある。自分で作成したPDFファイルなら、一般的なPDF編集ソフトで問題なく扱える。しかし、謄本などの公的な文書や設計図面などのPDFでは、注釈や編集が制限されているものもある。改ざんを防ぐために当然なのだが業務では困ってしまう。そこで「AxelaNote」を使ってみたい。
「AxelaNote」の特徴は、PDFファイルそのものを「編集しない」ことで、どんなPDFファイルにも「追記できる」ことだ。矛盾して聞こえるが、修正指示などの赤字は原本となるPDFファイルに重ねた「透明なシート」に書き込むことで実現する。
ペーパーレスで、PDFの原稿データに手書きで校正できるのは助かる。いわゆる注釈機能を使った手書きよりも操作性がいい。修正後のデータにaxlファイルをかぶせる修正チェックは効率的だ。書籍の校正では、書き込み履歴をCSVで出力できるので、修正確認の精度も上がる。
https://forest.watch.impress.co.jp/docs/special/1325126.html
政府向けシステムに関わったことがある身からすると、政府向けシステムの話をするときに前提として知っておいてほしいことは、住基ネット最高裁判決に「現行法上,本人確認情報の提供が認められている行政事務において取り扱われる個人情報を一元的に管理することができる機関又は主体は存在しない」という骨子があること。これによって政府向けシステムは個人情報を一元的に管理できず、個人情報は各自治体で分散管理しかできない。この文面でググれば政府がどれだけこの骨子を気にしているかは分かると思う。
今回の話は「国民マスターテーブルを持たずに認証するにはどうすべきか」という政府向けシステムで常に挙がる課題で、良いアイデアがある人は政府に提案しにいってほしい。個人情報保護法の目的外利用に違反しない上で。
これをできるのは自治体のみで防衛省はできない。防衛省は国民の住所氏名を知らないのではがきを送れない。防衛省に限らず、どの省庁も国民の住所氏名を一元的には知らないので、政府はできない。
かなり難しい。上の骨子により防衛省が個人情報を一元的に管理することができないので、最高裁判決とは条件が異なることを主張しないといけない。たとえば「都市圏だけなので一元ではない」とか。それに国民や野党が納得するかどうか。これがひろみちゅの言う「政治的にそう言えないというのはあり得るが、乗り越えなければならない」課題。
これで良いなら予約システムなんていらないけど、密を作って高齢者に何日も前から徹夜で並ばせるのが今のシステムより良いと思う?
政府が使える一元的な情報はマイナンバーしかない。マイナンバーカードを読み取れる人だけが利用できる予約システムなら認証できるけど、自治体のネット予約さえ高齢者には使えないと叩かれているのに「マイナンバーカードとリーダーが必要です」なんて要件で作れるわけがない。そもそも「短期間に多くの人に接種させる」という目的にもそぐわない。
各自治体の予約システムがAPIを持って防衛省が接種券番号の有効性をAPIで確認できれば認証できるけど、首都圏だけで200以上ある自治体がばらばらに調達しているすべての予約システムに高負荷でも落ちないAPIを共通仕様で緊急で作らせれる必要がある。けど、そんな体力があるならば自治体の予約システム自体が落ちないようにすれば良いわけで、大規模接種自体が不要かもしれない。
個人情報を一元的に管理することができる機関を立法すればできる。けど、そんなものは「たった1年」じゃ作れない。マイナンバーと住基ネットに何年掛かったと思っている?「パンデミックという緊急事態なので防衛省が高齢者の個人情報を一元的に管理することができる」世界は「戦争という緊急事態なので防衛省が20代30代男性の個人情報を一元的に管理することができる」世界につながっていることを理解した上で、国民はこの法案に賛成できるのか? できるなら、良くも悪くも政府向けシステムの将来は大きく変わる。
結局、「国民に行政サービスを直接提供するのは自治体で、そのための個人情報を持っているのも自治体。政府は自治体を支援する」というデザインですべてが作られている日本において、菅の「政府主導でのワクチン接種」というアイデアの実現がそもそも無理ゲー。出生届や転入届を出すのは各自治体、運転免許の番号を発行しているのは各都道府県公安委員会。政府は国民の個人情報が一元的に入った共通データベースをどこにも持っていないから管理できない。従来通り、政府は自治体の支援に特化するべきだった。
中国みたいな管理国家に日本はならないという選択を国民がした時点で、この予約システムでの認証の実装の難易度は相当高い。ウイルスとの戦いに強い国は戦争にも強い国で、「人間にせよウイルスにせよ、敵との戦いに勝つために国民は政府にどれだけ一元管理されてもよいか」の総意を国民が取らないといけないので、マイナンバーや住基ネットの実績を考えると1年くらいの準備期間じゃ、みんなが期待している認証をこのシステムでは実現できない。
チェックデジットがないことで誰かの誤入力で自分の予約ができない確率が上がっているのは残念。ただ、発券しているのは各自治体なのでチェックデジットをつけられるのも各自治体なので、開発会社も防衛省もやれることはない。誰なら事前に自治体に統一仕様で作らせられたかというと厚労省だけど、接種券の仕様が決まったあとに大規模接種の話が出てきたので事後諸葛亮。こんなこともあろうかとチェックデジットの指摘が事前にできる勘が良い人がいたなら、たぶん落ちない予約システムの作り方の指摘も事前にできただろうから、大規模接種自体が不要だったかもしれない。
現状でもreCAPTCHAでBot対策されている。reCAPTCHAを越えて大量予約するやつは悪意があるので逮捕で良いでしょ。
できた。でも、接種券番号のバリデーションができない時点で大した意味はない。入力フォームの電話番号にSMS送って電話番号全体の有効性を確認することはあっても、市外局番の存在有無だけをバリデーションするなんてことしないでしょ。入力された市外局番と市外局番マスターを引きあててバリデーションをしている者だけが石を投げられる。
防衛省は生年月日の正しい情報を持っていないので、この数字に大した意味はない。たぶん予約キャンセル用のパスワード相当、当日の誤入力を見つけるためのヒントくらいの意味しかない。「パスワードを設定してください」でも良かったんだけど、高齢者には難易度が高いと思って生年月日にしたんだろう。秘密の質問みたいなもの。あなたの母親の旧姓が本当に正しいかどうかにシステム側は興味がないのと同じくらい、この生年月日が正しいかどうかに大規模接種予約システムは興味がない。
いまだに具体例が出てこないので、多分ガセ
異なる市町村番号+同じ接種券番号+異なる生年月日でログインできないことで接種券番号だけがユニークと主張しているけど、ログインできない理由はそれだけじゃない。たとえば2-123,5678がすでに登録されていることをこの人は知らない状況で、この人は1-123,1234でログインできるけど、2-123,7890はログインできない。システムとしておかしくない。
よくあるコメントに返信。
法律は素人のシステム屋なので、この指摘は正しいのかもしれない。一方で「個人情報とは個人を一意に識別できる情報のことを指すもの」というコメントもある。私には判断できないけど、仮に個人情報ではないとすると、
かなり難しい。上の骨子により防衛省が個人情報を一元的に管理することができないので、最高裁判決とは条件が異なることを主張しないといけない。たとえば「接種券番号は個人情報ではない」とか「都市圏だけなので一元ではない」とか。それに国民や野党が納得するかどうか。これがひろみちゅの言う「政治的に(『接種券番号と生年月日は個人情報ではないので一元管理します』とは)言えないというのはあり得るが、乗り越えなければならない」課題。
が正しいのかもしれない。住基ネット最高裁判決によって政府向けシステムに認証機能をつけることは想像以上に難しいという趣旨は変わらないけど、悪いのは菅じゃなくて「個人情報ではない」で突っ張れなかった防衛省なのかもね。いずれにせよ「認証すらまともに作れない技術力」から「接種券番号は個人情報なのか」に議論が高まってくれれば書いた甲斐があった。
VRSってのは各自治体の接種会場で使われているバーコードがなくてOCRが必要なことで有名なシステム。OCRは置いておいて、VRSは一元管理していない。 https://cio.go.jp/sites/default/files/uploads/documents/vrs_overview_210506.pdf の6ページ目に書いてある。
>市区町村ごとに区切られて保存されており、個人の記録は、接種券を発行した市区町村が確認できます
国民の接種率が重要指標なんだからDBは1個にしたほうが便利なのに、「あえて」区切って保存している。また、個人の記録は各市区町村しか確認できい、つまり串刺しで全国民の個人記録を見られる人はいないと書いてある。そんなわけでVRSは「政府は一元管理していません」に気を使っていることが分かる事例。
同じページへ追記されるとはてなブックマークでは議論ができないので、追記分のみこちらに文字起こししました。
画像で掲載されていたのでOCRしています。ちょこちょこ読み取りが怪しいので随時修正します。
NHK「おはよう日本」報道局ディレクター大淵光彦と称する人物からDHCの広報部に
電話が入り、当方の「ヤケクソくじ」の説明文に人種差別の問題が含まれていて、今に
至ってもまだホームページに掲載が続いているがその理由を聞かせてくれとのことで
あった。名前を聞いて、明らかに在日系が好む日本名であることから、NHKを騙るコリ
アン系の反日日本人かと思ったが、NHKに問い合わせてみると確かに在籍しているとの
こと。小生は常々、日本の朝鮮化ということを何よりも危倶しているが、その元凶である
NHKからの問い合わせに小躍りした。NHKの状況を全国民に周知させる絶好の機会
だからである。朝鮮化ということではNHKは最も触れられたくない問題のはずである。
これはもう日本国民の誰もが気がついていることであると思うが、NHKは幹部・アナウ
ンサー・社員のほとんどがコリアン系である。出演者についても、学者・芸能人・スポーツ
選手の多くがコリアン系であり、ひどいことに偶然を装った街角のインタビューさえコリア
ン系を選んでいる。予めリストアップしているのである。特徴のある名前とつき出たあご、
引きしまった小さな口元、何よりも後頭部の絶壁ですぐに見分けがつく。サントリーが日
本海を「東海」と言おうが、社員・タレントをコリアン系ばかりにしようと-私企業である
から誰も文句は言えない。NHKは全国民から強制的に受信料をむしりとっている公的
機関であるから放置するわけにはいかない。誰がこんなふうにしてしまったのかというと
自民党の一部のコリアン系の国会議員であるが、野党はコリアン系だらけだからNHKの
やることには誰もストップをかけない。コリアン系は長い歴史の中で中国を常に宗主国と
してきたから、宗主国のやることには逆らえないというDNAができている。韓国の歴代
の大統領を見るとよくわかるONHKは朝鮮半島の悪IIは絶対に言わない。これは同族だ
から当然のことだが、親分の中国にも何も言えない。党員のほぼ全員がコリアン系である
立憲民主党は、総務省の役人がNTTの接待に応じたとかのどうでもよい文春の三流記
事を盾にして連日のように国会でがなり立てている。そんな場合ではなかろう。国境を侵
して侵入している敵には即座に銃撃して追い返すのが常識であろう。
小生のことをマスコミ(これもコリアン系ばかり)は人種差別主義者だと言うが、人種差別
というのは本来マジョリティがマイノリティに対して行う言動を指すのであって、今や日本
におけるコリアン系はマイノリティどころか日本の中枢をほとんど牛耳っている大マジョリ
ティである。毎日ものすごい数で帰化人が誕生している。数だけの同族でマジョリティで
はなく、彼らは東大・京大・一橋・早稲田を出ていることから政界・財界・法曹界・マスコ
ミ界という日本の中枢をすべて牛耳っている大マジョリティである。
小生はもともと経団連の会員であったが、呆れ果てて昨年の12月に退会した。経団連の
会員は日本を代表する有名企業ばかりで、コリアン系などいないと思われるでしょうが、
ここ数十年の間に続々とコリアン系が増殖して、幹部や一般会員だけでなく、会を支え
る事務局員までコリアン系で占められるようになった。そのため、彼らは日本のために
働いているのではなく、何かあると必ず中国寄りの態度を示し、韓国には常に同情的で
ある。中国がウイグル族などの少数民族に対してやっていることは明らかに人種差別の
最たるものです。アメリカで白人が大多数を占めていた昔なら黒人や朝鮮人は差別の対
象になっていましたが、今は一大勢力を形成していますからもう差別とは言えないで
しょう。数の力を頼って、西海岸の朝鮮人は今や市議会の中心層になっており、やりたい
放題でマイノリティの日本人をいじめています。言いたい事はきりがありませんが、NHK
ワードか何かで書かれた指示原稿がクライアントから制作代理店にファックスされて、そのファックスされたものをメールで添付されて俺のところに回ってきて、その原稿を元に作業してんだけど、ブラックというより超ド底辺の仕事してんなぁ〜って悲しくなってくる
なんでファックスで受けてるのか俺には知らされない
データでくれと一応言ったけどそれはできないという答え
指示原稿の中でFacebookのリンクがあってここから文字を抜粋してくださいとある
%英数字%英数字%英数字・・・なんて文字をいちいち入力してられっか!
googleドライブに入れてgoogleドキュメントで開くとOCRしてくれるの知ってて助かった
私が日本語を読み解いた限りでは否定されていないことです。間違いがあったら指摘お願いします。
「1. 国内ユーザーのデータ管理について」から、暗号化されてDBに保管されているのはトークだけであり、それ以外はE2E暗号化は行っていない。(通信経路はSSLなどで暗号化されている。)
3-2の①の内容から、LINE Digital Technology (Shanghai) Limited(大連)において、LINEの捜査機関対応業務従事者用CMSの開発業務に従事していた人は、これらのデータにアクセスできていた。現在はアクセス権を削除している。
3-2の④の内容から、LINE Digital Technology (Shanghai) Limited(大連)において、アバター機能、LINEアプリ内のOCR機能の開発に従事していた人は、ユーザーが提供に同意した顔写真データにアクセスできていた。現在はアクセス権を削除している。
3-2の⑤の内容から、LINE Digital Technology (Shanghai) Limited(大連)において、Keep機能の開発者は、Keepされたデータ全てにアクセスできていた。現在はアクセス権を削除している。
スキャンしてOCRかけてデータ化を試してた時にうまくいかない。範囲指定や画像認識して範囲指定がうまくいかない。
スキャン画像と画面表示のdpiを一致させなければいけない模様。
スキャンは200dpiでやっていたのでデータも200dpiで作成されていたけど画面が96だった。
powershellスクリプトでimagemagick使ってスキャン画像のdpiを96に変更してからOCRかけたらうまくいった。
全然ヘルプもなくググってもわからなかったので時間かかってしまったけど解決して満足。
これからもいろいろ試して遊べそう。