「正規化」を含む日記 RSS

はてなキーワード: 正規化とは

2024-03-09

anond:20240309152009

正社員登用するってこと?

でもその手の人は正社員登用打診すると断られるのよね

フルタイムで働くのを嫌がってるから

フルタイム非正規なら正規化乗る人多いと思うけど

2024-01-10

anond:20240110212207

頭の良さの件はサイズ正規化した場合じゃなかったっけ?

残念なことに女性は体が小さい傾向がある。もしくは男性が大きくなるように選抜されている

2023-12-18

メールよりはFAXの方がマシなケース

同じ質問に対する回答を複数から回収するケースでは、メールよりもFAXの方が良い。

メールは回答が自由書式になってしまうので、回答の表記も内容もブレが大きく、集計作業定型作業に適さない。

Googleフォーム等の回答を正規化できるシステムであれば、入力・集計の手間が減るのでFAXよりも優れている。

しかし、メールのように回答が正規化されず手作業入力・集計しなければならないシステムは、FAXのように回答が正規化されるシステムに劣る。

要するに「Googleフォーム>>>(越えられない壁)>>>FAX>>>(越えられない壁)>>>メール」ということ。

2023-10-22

anond:20231022145039

なんの補正もされてないデータ

 ← いえ、人口について正規化(すなわち補正)されたデータです。人口に関してなんの補正もされていない生の「販売台数」や「保有台数」ではありません。

人口密度が高い東京都最下位になるのは当然っちゃ当然

 ← その当然の事すら理解できてないバカがいるようなので、敢えて当然のデータを持ってきたまで。

anond:20201020170719

横だが、その主張のどこがどうおかしいんだ? 俺にはこっちの方がはるかにまともに見えるぞ。人口での正規化の点だけでも既にあの主張は破綻しているではないか

anond:20201020163748

人口正規化もしてないデータとかなんの意味もない

 ・・・ まったくだ。この一点だけでも既にダメ確定。

2023-10-06

anond:20231006041251

偏差値っていうのはね、50+(10(x_i - μ_x))/σ_xですよ

標準偏差で割って、平均で引いて正規化してるんです

ですからデータがどうであっても、偏差値50以下が同じ割合だけいるんですよ

まあ、君は偏差値40だからしょうがないね

2023-09-30

anond:20230930133458

元増田じゃないけど

https://www.weblio.jp/content/%E6%82%A6%E3%81%AB%E6%B5%B8%E3%82%8B

ウェブ国語辞典だし、悦に浸るはもともと悦に入る誤用から始まってる表現から気になるのもわかるが、突っかかることでもなかろう

誤用から一般化して正規化した言葉なんて他にもいくらでもある

2023-08-01

anond:20230731115218

そういうのってマイナンバーカードなどの件でも感じるよな。文字コード/異字体や住所表記正規化標準化)などに十分に対応しないまま事を進めた結果、名寄せがうまく出来なくて困っちゃう日本政府......

2023-07-14

商業漫画だけでも戦前から全部把握してる人っているのかな?

全部把握してた方が安心感があるよね。全部把握してないなかで自分の好きな漫画を探しても、もしかしたら自分が把握してないなかにもっと面白い漫画があると思うと不安になる。

戦後貸本赤本時代漫画家も追うのが大変なのだそうだが、そういうのもひっくるめて全部把握してて、漫画家、出版社ジャンル正規化されたデータベース作ってる人がいたらぜひ公開してほしい。

そのなかからジャンルとかをキー検索すれば自分が好みのジャンルのなかでこの世に存在する漫画で真に自分にとって一番おもしろものちゃんと見つけられるだろう。

でもそんなことは多分ありえないんとわかってる精神的に成熟した大人は一体どうやってこのあたり割り切ってるんだろう?

俺もさすがに同人誌含めて一番おもしろもの探すってのはコミケですら「全部は回れないか優先順位つけてリストアップしてる」って人の話を聞いていくうちに割り切れるようになったけど。

商業漫画に限っても割り切るしかないのかまだまだ悩み中。足るを知るってやつってやつなんだろうか?具体的にどうすればいい?

国家試験ITパスポート合格からみるIT立県・非IT立県

【はじめに】

少し前にニトリが自社社員IT人員増加を目的に、「ITパスポート」を取得させるというニュースがあった。

果たしてITパスポート」がどれほどIT化の変化に意義を持つのかの議論はさて置き、仮に「ITパスポート取得=最低限のITリテラシーを持つ者」として

見た場合都道府県別ではどれくらいそのバラつきがあるのかを見てみる。

【「ITパスポート」とは】

経済産業省政策実施機関である独立行政法人情報処理推進機構IPA:Information-technology Promotion Agency, Japan)」が

取り仕切る、情報処理技術者としての「知識技能」が一定以上の水準であることを認定している国家試験

その人が持つ情報技術レベルを測るIPA試験にあれこれ種類がある中の入門編に位置付けされている。

年中実施されており、理屈上、最大年12受験できる。

IPA公表している「情報処理技術者試験 統計資料ITパスポート編)」からIT立県・非IT立県を読み取る】

IPA試験の結果を月ごとに公表しており、その中で様々な観点から受験者・合格者の内訳を分析している。

そこに都道府県別の合格率を表しているものがあるので、これを使ってIT立県・非IT立県を見てみる。

その前に全国の合格率は以下の通り。

○令和5年度(4/5/6月)全国平均合格率:53.0%(合格者:25,456名 / 受験者:48,022名)

 2人に1人以上は合格できる試験

 とはいえ、実務経験ない人がノー勉強では合格できない感じ。

 根詰めなくても一通りちゃん勉強した人は1回で合格できるレベルと思われる。

では都道府県別の合格ベスト3・ワースト3を見てみる。

合格ベスト3】

合格ベスト3:東京都 60.1%

合格ベスト2:京都府 60.9%

合格ベスト1:滋賀県 61.3%

あれ。ソフトウェア産業が盛んな関東圏が独占すると思っていたけど、結果はご覧の通り。

滋賀県日本で一番ITリテラシーが高い県らしい。

ふーん。意外。

では続いてワースト3。

合格ワースト3】

合格ワースト3:徳島県 40.2%

合格ワースト2:熊本県 39.8%

合格ワースト1:群馬県 39.7%

ITイメージが全くない県群が堂々のワースト3入り。

群馬県にいたっては全国平均合格率(53.0%)より13.3ポイントも低い結果に。

熊本県TSMC進出で沸いてるけど、装置産業からITとか関係ないのか?

全国ベスト1の滋賀県(61.3%)と全国ワースト1の群馬県(39.7%)の落差は21.6ポイント

共に10人受けたら2人ほど合格者数が違う感じ。

なかなかだね。

以上、国家試験ITパスポート合格からみるIT立県・非IT立県でした。

(※番外編1※ 年齢別からみる合格率)

統計資料には年齢別の合格率というものもある。

これをざっと見てみるとこんな感じ。

10・・・29.8%

20代・・・53.52%

30代・・・58.42%

40代・・・57.61%

50代・・・55%

60代・・・73.19%

70代・・・68.6%

少年老い易く学成り難し」という故事があるけど、あながちそうでもない感じ。

つか、20代もっと頑張れ。コスパが~ タイパが~ 言ってるヒマあるんだったらもっと頑張れ。オッサンジィサン年代に負けてる。

(※番外編2※ ええっ・・・

この統計資料PDFのほかにエクセルでも公開されている。

されているんだけど、バリバリセル結合されまくっててそのままだと分析材料として使い物にならない。

・・・情報処理推進機構、なんだよね?

リレーショナルデータベースにおける正規化とか、試験範疇にないの?

ちょっと困惑した。

2023-06-07

住居表示正規化問題技術ではなく、社会全体の問題である

住居表示正規化話題になっていたが、住居表示正規化不可能である

まずデタラメに書く人がいるということが重要な点である。これはどうやっても防げないものだ。デタラメさ加減にも許容範囲はあろうが、この許容範囲のものも各要件によっては曖昧ものである

問題は、そのデタラメに書かれたものや、虚無的な例外までも救おうとする態度にある。我々はとかくすべてを100%完全にやろうとしがちであり、ここについてコスト意識を持って考えない。

しかしながら、7〜8割ほどうまくいくルールというのは示せるはずであろう。そうしたルールを公開し、「このルール・規格に沿った自治体恩恵が大きい。そうでなければ各自プラグインなどを作って頑張って。OSSもあればなお可」というようにすればよい。

要はシステムを作る側が地方自治体配慮し過ぎなのであり、「住所正規化に携わる人間組織は、名寄せ困難な地方自治体よりも格下」というような位置付けに現状なっている。これでは正規化原理的に不可能ではないかAIを使おうが無理であろう。

無限例外があるならば、「その無限例外を切る」という態度が非常に重要であるはずだ。だいたい、無限例外があるのならば正規化もクソもない。正規ものなど何もないのだ。星の数ほどある例外まで気にしていたら、金がいくらあっても足りない。経験者たちが、バラエティに富んだ無限例外の1つ1つについての苦労話を次世代に引き継ぐ語り部になっているだけではないか

これではまるで、多種多様契約非正規雇用パートナー社員と呼んで、全員を「正規社員です」と言っているようなものである

こうした「例外を切る」という態度について「酷い」という意見もあるかもしれないが、コストパフォーマンスで見れば、切らない方がコストが増えてかえって酷いのである。こうした事象False Economyなどと言われる。嫌われる勇気を持てないのだ。

実際に例外を切っていけば「住居表示正規化ができない地方自治体は滅びる」というような状態になってしまうであろう。だから、そちらを逆に支援すればよいのだ。支援すればよい、というよりも支援しなければならない。これこそが進歩であり前進である

ただしこれは楽観的な論であり、住居表示正規化のために地方自治体無視するような法律を作ることは現状ではかなり困難であろう。各自治体住民から反対運動が起きかねないし、必ず当地議員からの反発が予想される。

まりシステム開発側が、小金ときでおもねるのではなく明確に「ノー」と言わなければならないのである。それを「へへぇっ〜!お金様ですかいっ!」と平伏して、日本各地で勇猛果敢なインパール作戦に突貫しているのが現実ではないのか??

そういう構造を評して「住居表示正規化程度の問題」と無知な人から言われている。要は軽んじられており、気にも留められていない。「俺たちの方が賢いぞ」と思われているのだ。開発者が不可触民だった時代はすでに終焉を迎えているにもかかわらずだ。

ほう、政府とはそんなパワーすらない存在なのか?と思われている。鶴の一言でやればよいではないか?と思われている。

しかしそんな政府に我々の生活をなんとかしてくれと国民は言う。未だにそういう臣民体制社会なのである政府は弱いし、国民も弱いし、俺もお前も弱いのだ。経済がそれを示している。

AIさまがなんとかしてくれるというのは、単なるドラえもん待ちの空想ではないのか?

AIは、残念なことに不思議ポッケで夢を叶えてくれるドラえもんではない。したがって我々のび太くんが変わらなければならないのだ。のび太くんだけで住居表示正規化をなんとかしなければならないのだ。

「できぬものはできぬ」「やらぬものはやらぬ」とハッキリ言える力が我々には必要なのかもしれない。

俺は住居表示正規化はやらん。お前もやるな。

そもそも住所を正規化しなくていいのでは?

荷物が届けばいいっていうだけなら現状でも届いているので十分なのでは?

らくだけど現状って

っていう感じになってて、ほぼインターネットルーティングみたいになってる気がする(インターネットの方が後発だが)

配達員知識をどうやって継承していくか、っていう問題はあるけど

まぁそこにAIを使うか、照会前提にしておいて電話番号等の連絡先を併記すれば良いんじゃないか

一括管理したい理由として土地情報を知りたいなら登記管理してるし

なぜ住所を正規化デジタル化したいのかな

住所って増えたり減ったり表記が変わったり住む人変わったりするのでめちゃくちゃアナログ

正確にデジタル化できるようなものではないと思うけどね

河野大臣が将来的には住所の表記の揺れをAIを使って読み取るかもしれないと発言して、ツイッター民ITオンチだって罵倒してた。

「住所の正規化がどれだ難しいか、やれるもんならやってみろ」みたいな感じで。

でも素人からすると、画像の読み取りとか、プロンプトの解釈かに比べたら、住所の解釈なんてずっと簡単そうと思ってしまう。

日本の住所の読み取りとかローカル問題日本IT技術者しか取り組まないから、IT技術者のレベルが低くて難しいってだけなんじゃねって思ってしまう。

2023-06-06

表記ゆれ正規化簡単にできると豪語してるやつは想定内で収まると思い込んでるタイプだよなあ

英数程度の正規表現レベルで考えてるなんちゃってエンジニアっぽいしこの手のエンジニアほどやたらとSNS自己主張が強いイメージ

ユーザーはわけわからんことやるし、あえてやるやつもいるし、MacOSのように突然結合文字列使ってくるのもあるし

2023-01-31

anond:20230131121539

2009-06-18 - はてなブックマーク開発ブログ

この現状を受けて、はてなブックマーク側でも、ブックマークレットブックマークするときcanonical URL をチェックし、ブックマークしようとしている URL が異なる場合、ナビゲーションによる正規化された URL提示するようなインターフェイス作成を行いました。

最近・・・

2022-12-28

anond:20221228061359

そうなんだ

RDB正規化とかも出題範囲かと思ってた

大して難しい話じゃないんだけど

大半のWebプログラマは知らんのでは

2022-10-07

anond:20221007113147

ちょうど、最近資格試験を目指していて。SQLは、SQL Boltというウェブサイト英語無料サイト勉強するのも一つの方法という記事をよんだところ。

その前に、表のデータ正規化について、勉強した。書籍を読みつつ、びっくりしたことがある。

なんと、ちょっとした売上げ伝票だとか、図書館の貸し出し管理だとかもデータベースで管理するようにしないと、ただの表だとだめで、分割しないといけないのかと。

Excelでやりきれなのかよって思い始めましたわ。

2021-11-07

ブログ書くのって面倒くさいね

今、ナチュラルに思っていることを文章に書きだすだけならそう難しいことではないけど、

過去にあったことをメモ画像なんかかからまとめて文章にして、時系列ごとに並び替えたりするとなると途端に難易度が上がる

それも別に仕事のことじゃなくて趣味ことなんだけど

記録のつけ方が雑で、なんというか必要情報メモられてないんだよね。

情報飛ばし飛ばしになってる。原因はまぁ、これやってる間はそんな記録付けるとか面倒でしたくないし、そもそもこれくらい覚えておけるやろって思ってて一日放置してたりする。

そうなると思うだめで昨日のことすら詳細に思い出せない状態なので、記録をつけること自体がおっくうになってくる

そうなるとさらに記録をつけるのが面倒になってブログを書くときに苦労する

どうしたらいいんでしょうねこ

うーんとあと、書いてる途中でメモ画像で食い違いがあったりするんだよね。日付とか。こういう時どうしてんのかなみんな。

見直して、文章おかしいなこれってなったときに整えるのもまた面倒なんだよね。誤字脱字レベルならいいんだけど、句読点つけずに長々と書いてたりすると、自分でも読みづらいか修正したいんだけど

うまい修正方法が思いつかなかったり。

ここで区切ったほうがいいか?それとも流れ的に一気に読ませる方がいいか

そもそも文章リズムとかどうとかそれ以前にまともに読める文章書けてる気がしない。というか書けてない。でも修正方法分からんからそのまんまってなってる。

これが積み重なると自分の悪文をいつまでもネット上に置いておくのは嫌だし、かといって消すのももったいないってことで結局新規で書くのがすごい面倒だなって思うようになる

あとはなんかデータフォーマット形式とかさ、どっかで統一して書かないと読み返してて面倒なんだけど、どういうフォーマットなら読みやすいか?みたいなのがない

というかよくわからないのでブログ記事ごとに試行錯誤で変えてる。でもそうなるとほかの記事とのフォーマット互換性みたいなのも取れなくなるし、記録として読んでて面倒だなって気にもなる

そもそも表にデータ書くってのもなんか面倒だよな。記録してあるメモが抜けだらけなんだから正規化できない。抜けてるところは適当想像で補うとかするしかないんだけどまぁ。

記録付けるの面倒なら一日ごとにブログ書けばいいってのはなしな。

記録付けるのより段違いでブログ書く方が面倒くさい。なんせ画像必要になってくるんで

2021-09-25

エクセルが生まれ理由

エクセルを作る場合も、その逆もやっているんだけど

エクセルがなぜ生まれるのかをちょっと考えてみる。


1 既存帳票との互換性を強く求められるケース

 意外と忘れられがちだが法的に手書きまたは印字出力を要求する書類は多く、改正には政令場合によっては法改正まで必要な時がある。

 こうなると印字前提で、フォームだけ出力できればよいとなる。

2 電子申請拒否感を示す人は多い

 神エクセルが横行しやす申請業務について、そもそも申請者はコンピューターに明るいとは限らない。

 コンピューター申請するというだけですぐに拒否感を示す人が多い。業種にもよるが手書きでできるなら手書きにしたいところが多いのも事実

 数年前国土交通省がやっていたとある補助金業務で完全電子化を図ったケースがあったが、不評すぎて結局電子申請と紙申請ハイブリッドになってしまたことがある。

 事務局はよくやっていてもこの有様だ。

3 郵送の問題

 神エクセル書類は概ね郵送を想定される書類で多く用いられる傾向が多い。少なくてもこちらの現場ではそうだ。

 神エクセルは一枚の書類情報圧縮できる。視認性が低いかもしれないが、郵送費用圧縮できるのだ。

 郵送先が万オーダーになってくると郵送費用馬鹿にならない。電子メールならその点費用が安いと思うかもしれないが添付ファイル容量制限もあるし

 電子メールに一定署名を導入するソフトの導入費用はどこから出るのって話にもなる。最近になって印紙税を浮かすために電子契約を用いるようになっているが普及はまだ先。

4 ある程度のデータ正規化保証される

 一マスあたりに文字を入れさせるケースでは、最大文字数をコンピューター弱者にも即理解できるというメリットがあり、全部記載してもらえば

 少なくても不正データは減らせる。 電子申請場合この部分をいちいち実装しないといけない。

 フォームでどうこうっていう気持ちもわかるが、フォーム入力しても問題ない程度に設問内容を最適化しないといけない。

 

結論

 神エクセル批判する気持ちはわかるが神エクセルを利用する合理的理由もまた存在することは知ってほしい。

 とはいえ役所ローカルルールだったり、変な法令があったりなど不合理な部分は改善しないといけないとは思う。

2021-07-20

anond:20210720154108

コメントの長さを補正するような関数を使って選ばれたコメントですら、290文字あるんですよ。

はてぶが100文字制限しているかぎり、このコメントの長さを無視するための正規化ほとんど意味がない。

ログイン ユーザー登録
ようこそ ゲスト さん