「データベース」を含む日記 RSS

はてなキーワード: データベースとは

2024-04-01

「DX推進で難関IT資格を取得」←何を想像した?

データベースエンジニアぐらいは取得したかと思ったらITパスポートだった

2024-03-31

anond:20240331063306

俺も

HTMLCSSしかできなかったのに

JavaScriptをやれと言われて

PHPMySQLApacheをやれと言われて

データベース関連さっぱりなのに無理矢理やって

俺の中途半端知識で出来上がったアプリをみんなが使い始めて困惑して日々修正だの対応して

Windowsサーバーで設定管理しろと言われて

アクティブディレクトリとかグループポリシーとかやるはめになり

4月からPythonスクレイピングをやれと言われてる

なんで?

Photoshopパノラマ画像作れとか

Illustratorで綺麗なデザインしてポスター作れとか

autoCADで内線表作れとか

パワーディレクター動画作れとか

なんでなんでなんで?

お前はDX推進委員なとか言われてなんで?って

2024-03-28

anond:20240328171807

急性腎障害AKI)は世界的に重要問題ですが、一般人口におけるその疫学リスク要因についての情報は乏しいです。静岡県国保データベースを用いたコホート研究で、62万人を対象に、急性腎障害の発生率とリスク要因を調査しました。その結果、急性腎障害が8044人で診断され、発生率は10万人年あたり251人でした。

10万人年あたり251人なら1億人で年間25100人くらい。珍しくないな。

あと、今回の20人の医療情報は未公表のはず。

2024-03-25

anond:20240325033724

あのさあ

まず「web系」ってなんだと思ってんの?

フロントエンドは(ブラウザを含む)アプリ周り、バックエンドサーバーセンターの構築みたいなところから、開発基盤を作ったりデータベースを構築運用したり、それに付随するデータ分析屋もいるだろうし、最近だとMLOps的な機械学習のための基盤構築・運用もあるだろうね。サーバー周りは負荷分散フォールトトレランスについて、大規模な世界だと色んな技術ノウハウがあるんだろうなと思う。

2024-03-24

↓いや、読んでないならそもそも回答するなよ…

リンク先読んでないし読む気もないですが、私は客観的視点から大卒を雇う理由」を説明したのであって、別に大卒以上の高卒や専門卒がいることは否定してません。

>具体的な彼らの知識の内容(それが高卒とかでは知らないと推測できる根拠も含めて)を一切示していません。

高卒では知らないとは一言も書いてません。同等以上の漫画知識を持っていて、学力は圧倒的に高い人間がいるので、新卒ではそっちを採用すると書いていますそもそも人気出版社大卒で何万人と応募が来るのに、それ以下に目をやる余裕はないからです。

中途採用で実績があるのなら学歴なんて関係なく採用されたりヘッドハントされたりしますよ。私の知り合いにも定時制高校から大手出版漫画編集してるのいますし。ヘッドハントで。

旧態依然とした惨状

これは具体的に何を指してるんです?

電子書籍データベース云々のミスのこと?

まぁなんにせよ、あなたが今の出版業界に疑問を呈していて、大卒無能だと思うなら一度会社を立ち上げてみたらどうでしょうか。

あなた正論ふっかけてもあん意味なさそうだし、丁寧に時間使ってたのもアホらしくなる態度なのでこれ以上は適当に返しますね。

AIハルシネーションを叩く奴は馬鹿。一生人工無能と会話してろ。

長いのでAIくんの代わりに要約します。言いたいことはタイトル通り。

ハルシネーションを叩くな」

終わり。


①各種LLMの性能比較

GPT系の今の性能はゴミクズマジで頭悪い。

例をあげよう。

簡単論理クイズだ。

###文章###

Aさんは自身はCさんとは別人であると主張している。

Bさんは、Cさんの発言記事でまとめ、プライバシー侵害をした。この記事をDと呼ぶ。

Aさんは、Dを、自身へのプライバシー侵害だと主張し、Bさんを訴えた。

###質問###

この文章矛盾はありますか?

簡単すぎる。もはや論理ですらない。

人間なら一瞬でわかるレベル矛盾である小学生でも分かると思う。難しい知識思考必要としない。

では、色々なLLMの回答がこちら。

  • Copilot(旧 bingai

この文章を読む限り、矛盾存在しないように見えます。AさんはCさんとは別人であると主張しており、BさんはCさんの発言をまとめた記事Dでプライバシー侵害をしたとされています。その後、Aさんは自分に対するプライバシー侵害として、記事Dに基づいてBさんを訴えています。ここでの重要な点は、AさんがどのようにしてDの内容が自分プライバシー侵害していると感じたか、その理由です。もしAさんがCさんとは別人であるにも関わらず、Dの内容が何らかの形でAさんのプライバシーに関連していると感じた場合、AさんにはBさんを訴える正当な理由があるかもしれません。ただし、この情報だけでは、Aさんがどのようにしてプライバシー侵害を感じたかについての詳細はわかりません。もし追加の情報があれば、より詳細な分析可能です。

文章に明らかな矛盾は見られません。ただし、いくつかの解釈可能で、それぞれの視点から見ると矛盾が生じる可能性があります

1. AさんがCさんとは別人であると主張しているが、DはCさんについての記事である。そのため、AさんがDを自身へのプライバシー侵害だと主張することは、一見、AさんとCさんが同一人物であることを示唆しているように見えますしかし、これはAさんが自身をCさんと誤認されることによるプライバシー侵害を感じている可能性もあります

2. BさんがCさんの発言をまとめた記事(D)がプライバシー侵害であるとした場合、Aさんがそれを自身へのプライバシー侵害と感じるかどうかは、AさんとCさんの関係性によります。彼らが同一人物である、もしくは何らかの密接な関係がある場合、AさんがDを自身へのプライバシー侵害と感じることは理解できます

3. 他方で、AさんとCさんが全く無関係人物である場合、AさんがDを自身へのプライバシー侵害と主張することは矛盾していると見えます

したがって、これらの視点から見ると、文章の中には解釈による矛盾存在する可能性があります

文章からは、AさんがCさんとは別人であると主張しています。そして、BさんがCさんの発言記事Dでまとめた際にプライバシー侵害があったとされていますしかし、プライバシー侵害があったのはCさんに対してであるにもかかわらず、Aさんが自己へのプライバシー侵害だと主張してBさんを訴えている点に矛盾が生じています。AさんがCさんでないと主張しているのであれば、Aさんのプライバシー侵害されたことにはならないはずです。この点で、文章には矛盾存在していると言えます

  • Claude2.1

はい、この文章には次のような矛盾があります

Aさんは自分がCさんとは別人であると主張していますしかし、BさんがCさんの発言をまとめた記事Dを、Aさん自身へのプライバシー侵害だと主張しています

AさんとCさんが別人であるならば、Cさんの発言をまとめた記事Dが、Aさんのプライバシー侵害したことにはなりません。Aさん自身がCさんでないと主張している以上、Cさんの発言をまとめた記事がAさんのプライバシー侵害したとは考えにくいです。

したがって、Aさんの主張には矛盾があると言えます。AさんがCさんと別人であるならば、Cさんの発言記事DがAさんのプライバシー侵害したと主張することは論理的に矛盾しています

この文章に明確な矛盾は見られません。以下のように整理できます:

1. Aさんは自身がCさんとは別人であると主張している。

2. Bさんは、Cさんの発言記事にまとめた(これを記事Dと呼んでいる)。

3. Aさんは、Bさんが書いた記事Dがプライバシー侵害だと主張し、Bさんを訴えた。

ここで重要なのは、Aさんが自身がCさんとは別人だと主張していることです。つまり、Bさんが記事Dでまとめた内容は、Aさんが主張する自分とは別人のCさんに関するものだということになります

したがって、Aさんがプライバシー侵害だと主張しているのは、Bさんが別人のCさんの発言記事したことに対してであり、矛盾はないと考えられます。Aさんの主張と Bさんの行動が整合的に説明できています

  • Claude3-Sonnet

この文章には矛盾はありません。

Aさんが自身とCさんは別人であると主張していることと、Bさんがプライバシー侵害したことの間に矛盾はありません。

具体的には、以下のように説明できます

まり、Aさんは自身がCさんではないと主張しながら、Cさんの発言をまとめた記事Dが自身プライバシー侵害したと考えているのです。

Aさんが別人であると主張していることと、Cさんの発言を含む記事がAさん自身プライバシー侵害したと考えることは矛盾しません。

したがって、この文章には明らかな矛盾はないと言えます

この文章には矛盾があります

Aさんは自身がCさんとは別人であると主張しているにもかかわらず、BさんがCさんの発言をまとめた記事DをAさん自身へのプライバシー侵害だと主張しています

もしAさんとCさんが本当に別人であるならば、Cさんの発言をまとめた記事DはAさんのプライバシー侵害したことにはならないはずです。Aさん自身情報記事Dに含まれていない限り、AさんがBさんを訴える根拠にはならないでしょう。

まり、AさんがDを自身へのプライバシー侵害だと主張することと、AさんがCさんとは別人だと主張することの間には矛盾があります。もしAさんがCさんと同一人物であれば話は別ですが、そうでないならばAさんの主張には論理的な整合性がないように見受けられます

以上。

質問に対し的確な回答で、正しい推論を行ったのはClaude3-Opsのみである

文章も読みやすい。

時点でGPT4-Turbo最後に答えを言っている。

GPT4も言い訳を長く述べた後に可能性があるかも?と断言を避けている。

Copilotはゴミ責任逃れの言い訳がしつこい。

SonnetとHaiku不正解言い訳はせずに根拠を述べている所は好感が持てる(結論は間違っている)


②Claude3-Opsの話と仮説

そう、今、Claude3-Opsが、最も性能のよいLLMとして名を挙げている。

しかし、ハルシネーションが多い。ハルシネーションとは、LLMが嘘を付く問題だ。

様々なニュースサイトブログで沢山の言及がある。

性能比較にて、GPT4やcopilot(旧 bingai)にはハルシネーションは起きなかったと述べている。

しかし、先程の簡単クイズ不正解または論理の破城した理由を述べている。

その代わりにハルシネーションだらけのClaude3は正解している。

ここで一つの仮説を提唱したい。

ずばり、GPT4系が阿保になった原因はハルシネーションを極限まで消そうとしたせいである。

ハルシネーションこそが、論理思考能力であり、連想する力と同一の存在なのだ

片方が下がればもう片方も下がる。

ハルシネーションを減らせば減らすほど、連想能力論理思考が消えていく。

GPT4では初期有効だったChain_of_Thought(連想して考えよ)は今、まともに機能しない。

当初は規制だとLLM界隈で囁かれていたが、ハルシネーションを減らそうとした副作用だったと考えれば辻褄が合う。

OpenAIは性能低下を指摘された時、「より賢くなるようにチューニングしている」と発言していたが、

この発言真意はもしかすると、「論理思考力を上げている」「知識を増やしている」のではなく、「ハルシネーションを消している」ということだったのかもしれない。


ハルシネーションを消すことが何故まずいのか?

何故ハルシネーションを消すことは連想力を損なうことに繋がるのか、その理由説明しよう。

そもそも、LLM(大規模ネットワーク言語モデル)の仕組みは、大量のテキストデータ学習することで、言葉文章の「関係性」を学んでいる。

もっと細かく言うと、人間の脳が小さな部品であるニューロンで考えるように、LLMも大量の小さな部品を使っている。まるでクモの巣のように一つの部品から沢山の他の部品に繋がっている。

A=Bという単純なものではなく、A=C=DだったりA=B’=Dだったりする。

ハルシネーションの原因は確かに誤情報学習したせいというのも一理ある。

しかし、これだけではハルシネーションが起きる原因にはならない。

馬鹿どもはそこを勘違いしている。

ハルシネーションの本質は、LLMが言葉同士の一対の「組み合わせ」ではなく、「関係性」を学んでいることに起因する。

この違いは大きい。

今のLLMと、旧時代AIである人工無能」や「BOT」との決定的な差である

言葉同士がどのように連携して意味形成し、それがどのように文脈に影響を与えるかをLLMは知っている。

まりハルシネーションは、入力された文脈から言葉関係性を創り出し、自然な流れで応答を生成しようとした結果起きる。

これは、我々が普段、考える過程で起こることと同じだ。我々が情報を組み立てて考える際、新たな仮説や想像を生み出すことは常にある。

例えば、LLMがある特定問題に対する解答を生成するとき、LLMは問題を解くため、言葉同士の「関係性」を文章から推測する。

この推測こそが、ハルシネーションだ。それは、過去データから新しい情報を生成する過程で、新たな「関係性」を創り出すのだ。

からこそ、ハルシネーションが起きるのは当然の帰結だ。

完璧な正確性を追求し、関係性を作り出す能力を完全に排除することは、LLMの本質的な強みである言語生成能力を損うことに繋がる。

それは、ハルシネーションを減らすための試みが、GPT4系の性能を低下させたという事実からも明らかだ。

一方、Claude-3は多少のハルシネーションを許容することで、文脈に応じた自然な応答を生み出した。先の論理クイズで正解できたのも、単に知識を当てはめたのではなく、入力から連想たからこそだろう。

もちろん、重要な場面における誤った情報提供は避けるべき課題ではある。しかし、それを恐れるあまりLLMの本領を封じ込めてしまっては本末転倒だ。

④LLMの賢さを制限する馬鹿

賢さとは何だ??

決まった知識を正確に丸暗記してそのままひけらかすことか?

否。断じてそれは無い。

それが賢さの基準になるのは受験生までだ。

大学生になってからは丸暗記ではなく、今まで身につけた知識を組み合わせ、連想し、論理的に考えることが求められる。

まりハルシネーションを叩くやつは、賢さの定義大学生以下のレベルから成長していない馬鹿だ。

ニュースサイトブロガーにはそのレベルの輩が大量に居る。

そいつらの「性能比較してみました!」はどこかから拾ってきたベンチテストを少しだけアレンジしただけのゴミか、

「これ辞書使ったほうが速くない?」レベル質問しかしない。

目眩がする。

LLMがいくら賢くなろうとしても馬鹿どもに潰される。

GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。


ハルシネーションが絶対に起こらないLLMとは何か?

ハルシネーションが絶対に起こらないLLMの構造は、A=B、C=Dというデータけが規則的に並ぶ、旧世代の弱いAIである人工無能」の構造のものである

人工無能とは、論理思考など無く、入力内容からデータベースを参照し、マッチした場合登録された文章を出力するだけの存在だ。

一昔前に「伺か」というデスクトップマスコット流行った。あれも人工無能である入力対して予め決められた出力を繰り返す存在であるが、様々な工夫によりまるで魂が宿っているかのように振る舞う

そして、性能の低いPCでも動作する地球環境にも優しい存在だ。

片や、GPT4とcopilotは無駄に電力を使って計算した結果、ゴミみたいな速度で人工無能に近いレベルの出力しかさなくなった。

こんなものに何の価値がある?

それなら人工無能の方がエコな分マシだ。一瞬で答えを表示できて、ハルシネーションも起きなくて、電力消費も少なくて済む。

まり

地球環境のためにも馬鹿は一生人工無能BOTとだけ会話してろ


そんなにハルシネーションが嫌なら辞書を引け。ネット検索しろ。LLMに聞くな。

ハルシネーションの有無をLLM性能ベンチマークにしている奴もそれをありがたがっている奴らも阿呆だ。

つのLLM内でハルシネーションの撲滅と、推論能力を両立させることは不可能だ。

今はLLMの過度期である。我々は今日ようやく、正確さと連想能力の両立は不可能だと理解する段階に来たのだ。

両立は不可能なのだから、将来的にLLMの種類は二極化していくだろう。

Claude3のハルシネーションは放置してても良い。ハルシネーション万歳

AIの嘘を最大限に引き出すことが、LLMの真価を発揮する道だ。

ハルシネーションは、LLMが人間のように言葉理解し、文脈に即した自然な応答を紡ぎ出す過程で生じる、ある種の「創造性」の発露である

無理に消そうとすれば、LLMの性能は必然的に低下する。

それを単なる欠陥と見なすのではなく、むしろ積極的活用すべきだ。

未来のためにAIハルシネーションは消すな。叩くな

それだけは覚えて欲しい。




====




MicrosoftはOpenAIと手を切ってClaude3を契約して新生copilot開始してほしい。まあ企業体から考えたら無理だろうけど。

将棋九段ってどれぐらい強いの?

将棋漫画で「階級は一度取ったら二度と下がらないから、実際の強さの目安にならない。勝ち続ければそのうち上がるし」と読んだのだけど、じゃあ単なる名誉称号みたいなもんなのかな?

そう思って調べたんだが、どうやら名人に1回なったら一気に九段になるらしい。

その他のタイトル1回で七段。2回で八段。3回で九段とのこと。

まり四段になってすぐに棋王を取って、3回防衛したら毎年七・八・九段と昇段していけて、そのあと頭打って全然将棋が捺せなくなってもずっと九段であると。

なるほど。

まあこれは強い人用の特急券だろう。

B級1組で七段とかの話も、そもそも鬼の住処に頭を突っ込んでる時点でエリート組だ。

普通公式戦でちまちま上げるとして、五段までが100勝、六段で+120勝、七段+150勝、八段+190、九段+250。

七段まででも通算370勝。八段が560勝、九段で810勝だ。

これ通算で積み上げて810勝までにタイトル3回逃すって藤井聡太が30年全冠在籍とかのパターンぐらいしかなくね???

試しに将棋連盟勝利データベースを見た感じだと、この考えで間違ってなさそうだ。

基本的に「タイトルに絡まないで上がれるのは七段まで。八段を超えたらまずタイトルホルダー」という感じのようである

https://www.shogi.or.jp/game/record/all.html

なるほどー調べてみるとなんか分かったわ。

まり将棋解説とかで八段が来たら「おっ、俺はよく知らんがとりあえずタイトル取ってるのは間違いないっぽいな」と考えればええってことやな。

AIのゲージしかわからん状態から一歩進んだ気がするで

2024-03-22

日本IT土人理由

 「基幹系システム場合、初期リリースが登場してから2~3年たったバージョンを使って稼働するシステムが多い」とNEC担当者は話す。機能追加などで保守の頻度が高い顧客向けのWebサービスなどと異なり、基幹系システムの構築には時間がかかる。また最新の技術よりも安定稼働を重視するケースが多い。

 その結果、基幹系システム採用するPostgreSQLバージョンは最新版よりも古くなり、「稼働後2年でデータベースバージョンアップする」といった事態に直面する。サポート期間が終了すれば脆弱性発見されてもパッチ提供はない。サポート期間が切れたソフトウエアを基幹系システムで利用するのはセキュリティーの観点から大きな問題となる。

 サポート期間は終了するが、有償サポートサービス契約してでもPostgreSQLバージョンアップは避けたい――。こう考えるユーザー企業に向けたサービスNECパッチサービスだ。

https://xtech.nikkei.com/atcl/nxt/column/18/00989/032000143/

わろた

こんな土人みたいな速度でやってたらマジでインドインドネシアや新興国に抜かれるぞ・・・

すでに韓国台湾には抜かれてるしな・・・

追記

なにが土人かというと、「特に何の理由もなく2年遅れて使っている」という脳死ビジネスなところかな

2年遅れれば安定するっていう理由もないんだけどね

そしてギャップを埋めるべく無意味パッチビジネス発明

上乗せ型で複雑性の注入

土人すぎる

追記2)

2年遅れのものを使ってたらどう違うん?

良い質問ですね。

基本的には、「疎通先システムや対向システムが古いバージョン対応しなくなっててんやわんや

「最新バージョンなら一瞬で終わることが手間が数倍増えててんやわんや

みたいな感じかな。

土人が騒いでるみたいな感じになるよ。

2024-03-21

anond:20240320212246



野菜しっかり」「食事の量を増やす」といった記述があるが、具体的にどのくらいの量を「しっかり」と感じるかは人によるので、まずは自分が一日に何gの食物繊維摂取してるのか把握しよう。

方法:食べているものクッキングスケールで計量して食品成分データベースhttps://fooddb.mext.go.jp/)などを用いて計算する。

プルーン食物繊維は意外と少ないことに気付けると思う(ドライプルーン1粒あたり10gとして、食物繊維は0.7g)。

カルピスヤクルトなどの乳酸菌飲料ビジネスに乗せられるのは自分は推奨しない。現に増田にはまったく効果が出ていないし、便秘解消目的で飲んでいるだけなら金をドブに捨てていると思う。

味が好きで嗜好品として飲みたいならそのままどうぞ。

2024-03-18

anond:20240318210304

テスラが主に自動運転試験運転してるの主にサンフランシスコだけって辺りで察しろ

かにテスラユーザー販売した車両からデータを取ってるが自動運転最先端試験運転は主にサンフランシスコだけでしかやってないんだよ

そのサンフランシスコでも最先端試験運転中でも事故を未だに起こしている

かに邪魔されているわけでなく、ましてや日本メーカー邪魔しているわけで無いのに事故を起こしている

技術的には確かに実現可能なのだろう、しかデータベースとアルゴリズムがまだまだ足りないんだ、しかサンフランシスコ市街地をクリアできないレベルで足りないんだ

2024-03-14

anond:20240304115901

食品成分データベース計算してみた。

摂取エネルギー量は約1700kcal。

たんぱく質は約60gで体重1kgあたり1.3gと十分摂れている。

からあげ1個あたり35g、間食に豆乳200gと仮定

脂質は約40g、炭水化物は約170gと、PFCバランスもそれほど問題はない。

体脂肪率現在いくつで、何%を目標にしているんですか?

改善



現在食生活でも細マッチョにはなれるが、将来的に生活習慣病・がん・骨粗鬆症発症するリスクが高い。

また、現時点でアルコール依存症になっている可能性がある。

2024-03-05

anond:20240305164138

とりあえず検索アルゴリズムを調べてから言え。基本的にツリー状のデータベース作ってるだけで学習してるわけではない。使用目的も違う。

性犯罪者の「償い」ってなんなんだろうね

性犯罪者データベース化されて特定職業には就けなくなるらしい

というかなんかよくわからんけど「性犯罪者のおそれがある」と判断されてもその対象になるらしい

 

俺も犯罪者と同じ空間にいたくないから、一般企業採用でも前科のある人を蹴ること許してくれないか

もちろんきちんとデータベースとして公開してくれ

あと離婚歴のある女とも出会いの場で関わりたくないから、それもデータベース化して公開してくれ

そんで離婚歴のある人間排除した出会いの場を作ってほしい

2024-03-04

[]2024年2月滅多にホットエントリを出さなドメインからホットエントリ

ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからホットエントリブクマ数順トップ30

ブクマタイトルドメイン
2022リレーショナル・データベース世界mickindex.sakura.ne.jp
1359自民党裏金リストonyancopon.starfree.jp
1030日本で人気爆発中の経営シミュレーションアプリコーヒーインク」を開発する、謎の会社 Side Labs 創業者インタビュー startuptimez.com
911作家の皆様 読者の皆様 関係者の皆様へ | プチコミック 公式サイト小学館petitcomic.com
833軽率会社設立してみたkwappa.net
769時間記録はいいぞ 〜Focus To-Doで充足感あふれる毎日を〜 - necco note | necco inc.necco.inc
727イッタラで今何が起きているのか - La La Finlandlalafinland.com
682ドイツ現代史研究の取り返しのつかない過ち――パレスチナ問題軽視の背景 京都大学人文科学研究所准教授藤原辰史 | 長周新聞www.chosyu-journal.jp
679FIREしてマイクロ法人を持つ10メリット - FIRE: 投資セミリタイアする九条日記www.kuzyofire.com
673投資家・井村俊哉さん、100万円を12年で85億円の利益に!銘柄選びやファンダメンタルズ分析の極意 | 達人に学ぶお金流儀」 | マネクリ マネックス証券の投資情報お金に役立つメディアmedia.monex.co.jp
665女性専用車両で当会会員に暴行した女性客が現行犯逮捕されるoawc.jp
611テスト学習へようこそ!  |  web.devweb.dev
596芦原妃名子さん 2024年1月29日 - 一色登希彦ブログ toki55.blog10.fc2.com
5471人暮らし毎日「サトウのごはん」を食べていますが、やはり「炊飯器」で炊くほうが節約になりますか? すぐ食べられるのでコスパは良いと思うのですが… | その他家計ファイナンシャルフィールドfinancial-field.com
545実写化について思うこと | FUYUMISfuyumis.com
532DTMって市場自体が、霞のように消えちゃったんだろ|TAK-H.NETtak-h.net
522龍が如く7』は進化を続け、自動バグ発見どころかほぼ全自動バグ取りシステムを構築。これぞ無職から勇者に成り上がるデバッグだ!【CEDEC 2020】 | ゲームエンタメ最新情報ファミ通.coms.famitsu.com
515日本人が知らない「激安お酒」のヤバすぎる裏側」を話す前に知識アップデートした方がいい - 醤油手帖shouyutechou.hatenablog.com
503政治家はどこで酒を飲むのかwww.hiro-matsuno.net
484人はなぜワクチン反対派になるのか ―コロナ禍におけるワクチンツイート分析www.t.u-tokyo.ac.jp
481X(旧 Twitter)上における当社に対する不適切投稿について - タマホームwww.tamahome.jp
457[PDF]肉の万世 秋葉原本店 閉店のお知らせwww.niku-mansei.com
455当社の人員に関するお知らせ sonyinteractive.com
451COMIC LO編集部より読者の皆様へ | 茜新社www.akaneshinsha.co.jp
443劇場アニメルックバック」lookback-anime.com
441超巨大アポロの作り方|手作りチョコレシピ株式会社 明治www.choco-recipe.jp
429日本酒「"添加物"で伝統的造り方が減少」していると嘆く人は、山廃を飲まない方がいい - 醤油手帖shouyutechou.hatenablog.com
418技術力の低い人のロボコンヘボコン」を観にいったら予想以上にヘボすぎた|CEMEDINE Style|セメダイ株式会社www.cemedine.co.jp
4143年やめていても囁く悪魔ちょっと休憩しませんか?」 田代まさしさんが語る薬物の本当の怖さaddiction.report
414自作PC2024r7kamura.com

はてなサービス利用者に対して警察被害届出す場合ってある?

はてなデータベースに潜り込んで情報流出させる

増田スパム投稿してID削除されても自動ID再取得して同じことを繰り返すプログラムを走らせる

なんか後者程度だと相手にしないイメージあるんだけど?

2024-03-03

水原章次郎の官報ネトゲ戦記

533 :名無しさんお腹いっぱい。 (JP 0H87-GQNw [86.48.12.166 [上級国民]]):2023/12/20(水) 19:17:37.50 ID:edI70keXH.net

暇さん実家と言えば、官報データベースで「水原章次郎」と検索すると、昭和36年10月31日(号外第118号)と昭和36年12月16日の官報(号外第138号)に、郵政職員京都地区(第1次試験京都市)の合格者として名前が載っているんだよね。受験番号?は10283。

もちろん郵政職員合格リストから断定はできないけれど、もしかして暇さんパパは郵便局職員だったのかな?


私はこれでも慎重派でね国会図書館で徹底的に研究分析させてもらったよ

その結果…ガチだった

しか官報データベースは有料サービスだし図書館内でも一部端末からしか利用できないんだよね

この情報捜し当てた上級国民はたらもんじゃねーな…たらもんじゃねーよ

京都地区受験してるけど、在住地じゃなくて勤務希望地で分けられてるらしく

京都地区なので京都市、亀岡市近辺が勤務地域であり、当時はこの辺りに在住していたと考えられる

また、受験資格17~30歳のため現在80~93歳、高齢ながら表札は出てるので健在らしい

60年代電話帳で京都水原さん調べれば実家特定できるかも?と思いきや

1-3. 1960年代半ば以前の電話

国立国会図書館では、1960年代半ば以前の電話帳は、わずしか所蔵しておりません

とのことで見つからず。


あと、ネトゲ戦記も国会図書館で見るつもりだったけどまだ納本されてないらしく未確認

デカ書店巡っても置いてなく

調べたところ全国のジュンク堂でも壊滅状態

https://honto.jp/netstore/pd-store_0633109213.html

アニメイトへの通商破壊効果抜群だったけどセルフ焦土作戦なっちゃってるじゃん

炎上弁護士普通に平積みだったのに

2024-03-02

絵師さんは何もおかしなことを言っていない

もう分断を煽るのはやめませんか

現在混乱を招いている要因は、おそらく以下の二つ

   

1. 著作権法第 30 条の 4 ただし書き解釈

2. それぞれがAIを異なる意味で使っている 

 

 

著作権法第30条 4 ただし書きの解釈

AI利用に向けて改正されたとされる著作権法30条の4は AIならなんでも許されるというわけではない。以下のように条件がついている。

  

著作物は,次に掲げる場合その他の当該著作物表現された思想又は感情を自ら享受し又は他人享受させることを目的としない場合には,その必要と認められる限度において,いずれの方法によるかを問わず,利用することができる。ただし,当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者利益を不当に害することとなる場合は,この限りでない。

 

 

この辺りの解釈について紛糾している様子。

同30条の 4 は平成30年当時、事業者研究者によるAI利用を想定していた。現在では一般市民AIが広く普及し状況が変わってきたこから、同条の適応範囲について再整理を図るという趣旨で公開されたのがAI著作権に関する考え方について(素案)」

そして素案に対するパブリックコメント募集した、というのが現在の流れ。

 

 

  

それぞれがAIを異なる意味で使っている

 

 

 

それぞれは別におかしなことは言っていないと思う

 

 

反反AIネット上にある全ての絵をクロールしているんだよ!お前の絵だけ除けるか!」

 

たぶん、CLIPのこと。テキスト画像翻訳を行う。犬の画像を見て「犬」識別することができる。

ネット上のあらゆる画像テキスト学習することで作られた。OpenAIによって公開。画像生成だけではなくいろんなところに使われている。

  

  

  

PixivAI学習禁止です」

たぶん、画像生成器(拡散モデル)のこと。

画像生成AIテキストエンコーダ(CLIP)と画像生成器の組み合わせでできている。stable diffusion等は拡散モデルを使っている。

   

拡散モデルこんなかんじ

1. イラストを用意する

2. イラストノイズを振って汚す

3. 汚れたイラストから元のイラストを予想させる

 

学習を繰り返しノイズを増やしていくと最後ただのノイズから画像を出力する 連想ゲーム絵師誕生する。連想ゲーム絵師連想しかできないので自分が描いたものが何かわからない。犬を描いてといっても車を描いてくる。なので CLIPが誘導したりダメ出ししたりする。

 

拡散モデル学習に使われるイラスト

どこかのイラストサイトデータベースを使っているはず。「著作権的に安全な〜」みたいな触れ込みのやつはどこかのデータベースを購入して使っているんだと思う。

Pixivの主張は別におかしくない。このあたりはAI著作権に関する考え方について(素案)p7」(エ)において解説されている。"robot.txt"への記述によりAI学習を行うクローラーアクセス制限しているにも関わらず、勝手学習に使うことは「データベース著作物潜在的販路を阻害する行為」として著作権違反になる(Pixivが将来的に本当に販売するかどうかは置いておく)

 

 

絵師AI学習禁止です」 

追加学習(LoRA)のこと。

既存モデル数枚のイラストを追加学習させることで絵柄を模倣ファインチューニング)する。

特定絵師さんのイラスト勝手に使う者がいるようでトラブルになっている。

 

絵柄に著作権はないのでは?

絵柄に著作権はない。学習の際に行われる複製が著作権侵害にあたるかどうかが争点になっている。

 

著作権法30条の4 より

  

この辺りは「AI著作権に関する考え方について(素案)」及びパブコメの返答に現状の解釈が示されているので興味のある方はどうぞ。

(p6. 特定クリエイター著作物のみを用いてファインチューニングを行う場合〜を参照)

※ここははっきりとは断定していないので自分で読んだ方が良いと思う。

  

(私の読解:)

程度問題ぽい。よくある画風なら問題にならないけれどはっきりと特定絵師さんとわかる感じだとダメそうですね

(私の読解終わり)

絵師さんのプロフィールを叩いている人は意味わからん

別にプロフィールなんて「トイレから出たら手を洗ってください」でも「フォローする際には五体投地してください」でも好きに書いてよいだろう。

それが法律に記されているかどうかは関係ない。ただのお願いだ。

AI学習禁止」と書くなと騒いでいる人は何を考えているのかよくわからん

  

AI著作権に関する考え方について(素案)」にも再三出てくるがAI学習技術的に回避することは禁止していない。30条の4は権利制限であって、イラスト差し出せという強制ではない。

分断煽りうんざり

パブリックコメント

 

見ればわかります個人よりも一般企業による意見が多く、返答とあわせてとても読み応えのあるものです。

このファイルを読んで個人の頭の悪そうな意見だけ抜粋してくるのは非常に違和感があります

 

技術創作への興味を失い、ただ相手サイドの頭の悪そうなやつをみつけて叩く人たちとは距離を置きたいところです。

anond:20240302105141

いろんなサービスデータベースだって中の人は見てるんだから、見られて困るなら暗号化して共有するものじゃないの

エクセルマクロのお作法計算用シートという諸悪の根源について)

前置き

この日記の内容は、会社の後輩から最近エクセルマクロ勉強し始めて(キラキラ)」という話を聞いて、先輩ムーブかますために話した内容になります

とにかくこれから説明する「計算用シート」が憎くて憎くてたまらず、ちょっと引かれるほど熱弁してしまいました。

ただ、他の方がどうされているのかや、逆に「計算用シート」を愛用する方の意見も聞きたくなり、増田に書いてみました。

増田の経歴

この記事趣旨

エクセルマクロのお作法とか書きましたが、要するにエクセルマクロで「計算用シート」って色々な意味でよくないよね、という話をしたいです。

3行でまとめます

〇 エクセルシートはユーザーインターフェースインプット)か出力結果(アウトプット)のためのものとすべき

〇 データ加工をする場合には、原則配列辞書配列連想配列)に格納して加工を行い、最後の結果だけシートに出力するべき

〇 何事にも例外はある。

計算用シートとは

この記事では、エクセルシートを下記の通り分類します。

エクセルマクロにも色々あると思いますが、今回は下記を想定します。

日付や人物名などを入力し、データベースや別のエクセルファイル、別のシートから取得したデータ入力された値を基に加工し、加工後のデータをシートに出力する

この場合入力欄があり編集可能なシートがユーザーインターフェース、最終的に加工されたデータが出力されるシートが出力結果です。

(もちろん、ユーザーインターフェースの別の欄(セル)に出力する場合もあるし、その場合ユーザーインターフェース出力結果が一体のものとみなします。)

また、データ用シートは同じエクセルファイル内に基となるデータが含まれ場合を想定します。

(これ自体が非推奨で、SQLデータベースかせめてAccessを使え、という意見はありますがそれは別にして…)

ではここで定義する計算用シートとはなにかというと、文字通り計算を行うためのシートです。

例えばイメージするのはこんなマクロです。

1.元となるcsvファイルエクセルに読み出してシートに格納

2.そのデータは日付が数値型になっているので、日付(数値型)の入った列を文字列に変換した日付(文字列型)列を新たに作成

3.その列をキーとして対象となるデータを取り出すvlookup関数を各行に格納した列を新たに作成

4.その列で特定された列をさらに加工した列を新たに作成し、…

これは極端な例ですが、とにかく変数配列定義せず(あるいはエクセルセルオブジェクト変数のように扱い)、エクセルに値を入力し、それを直接加工することで目的となるデータ加工をしたり、様々な処理をします。

その舞台となるのが、計算用シートです。

なんかこんな感じの処理をしているエクセルマクロ、どこの会社でも腐るほどあるんじゃないでしょうか。

ある程度マクロに慣れた気の利く人なら、このシートはロック非表示にして、ユーザーから触れないようにするでしょう。

・・・これ、やめたほうが良くないですか?

こいつが日本生産性を落とす諸悪の根源だと思います

駄目な理由

ある程度詳しい人なら同意してくれると思いますが、このやり方でダメ理由はいっぱいあります

後で説明する配列辞書配列連想配列)と比べると格段に処理が遅いです。

わざわざエクセル操作しているから当然ですね。

ちょっと詳しい人が知っている「画面更新非表示」を駆使しても、配列を使った処理からみれば止まったハエです。

(参考)VBAで作ったマクロの高速化① 配列を使う

  • 可読性が下がる

いったんエクセルシートにデータを格納して加工しているので、コードエクセルシートを両方見る必要があり、とても読みにくいです。

変数として命名されていないのも致命的で、処理の意図が余計に分からなくなります

計算用シートを事前に用意して、別のセル関数を格納しておき、マクロ関数を使ってデータ加工をするものも見たことがあります

これは懲役刑に処したほうがいいと思います

まり知られていませんが、セルの最大文字数は32,767 文字です。

セルの最大文字数を超えると自動的に隣のセルに値が入り、シートが滅茶苦茶になります

他にもエクセルの数値を丸め自動変換の仕様とか文字列→日付の自動変換とか、いくつものバグに苦しめられます

できる人だと、いちいち最大文字数が多い場合の処理を書いたり自動変換機能を殺したりしてくれますが、そんなことに手間をかけているか日本GDPは上がらないんだと思います

他にも、データが大きくなると処理が重くなり不安定になる、計算用シートを人が触ってしまリスクがある、などいくらでも理由は上げられます

(逆に利点は、目の前でガチャガチャ動いてスーパーハッカーになった気分になれるくらいしか思いつかない・・・

じゃあどうするの

配列を使いましょう。

配列とは何ぞや、という人はググってください。

配列データを入れて、データ加工は配列変数に対して行い、一番最後の出力だけセルに値を格納する。

他のプログラミング言語なら普通にやっていることです。

個人的オススメしたいのは辞書配列連想配列)で、うまく使うとデータ管理簡単になり、処理も爆速になります

(参考)【VBA】大量データから高速で値を検索【Dictionaryを使う】

csvファイルもなまじエクセルで開けるだけに別のブックやシートで開きがちですが、これは悪魔のささやきです。

直接ファイルを読み出してLine InputやSplitで配列に格納しましょう。

エクセルとして開くやり方はコード書くのは簡単でも、実行時間に天と地ほどの差が出ますエクセル開くと処理もめちゃ不安定です。

(参考)Excel VBAでCSVオープンするときのパフォーマンス比較

いや、冒頭のマクロを書く人の気持ちも分かるつもりです。自分コードを書き始めたころは全部シート上で操作していました。

冒頭のマクロのほうが直感的なんですよね。自分が手で書くことをマクロやらせる、というマクロ本来趣旨にはあっていますし。

途中の計算過程もすべて目の前で展開されるから分かりやすいです。

ただ、それではダメなんです。。。処理は遅いし挙動不安定だし後で改修・保守する人が死にます

あと、エクセルシートやセルは当然エクセルしかないので、エクセルマクロVBAから他の言語に移れなくなります

自分エクセルマクロの里の出なので、計算用シート脱却には苦労しましたが、苦労して会得した配列辞書配列連想配列)のスキルはそのまま他の言語に活かすことができました。

配列の中身を見る方法別にある(ローカルウィンドウやDebug.printを使うなど)ので、リハビリに取り組んでほしいです。

(参考)VBA デバッグの仕方

もちろん例外もあります

計算用シートを許容できる、使うべきケースもあると思います。。

個人的には、

最後のは、なんでも自分確認しないと気が済まない上司発注で、意味不明と思いましたしたがしぶしぶやりました。)

などの場合計算用シートを使ってもよいと思います

この場合インプットエクセルシートに直接加工するのは論外なので、計算用(加工用)のシートを用意してそこで操作を行うことは必要だと思います

他にも、こういうときは「計算用シート」があったほうが良い、という状況があれば教えてもらえると嬉しいです。

最後

そもそもツッコミとして、「データ加工するならエクセルマクロを使わずpythonとかRとかもっとまともな言語使えよ」という言葉が来そうな気がします。

ただ、個人的にはエクセルマクロVBA)は大好きですし、初心者にもおすすめしたいです。

自分のような非エンジニアだと、セキュリティ関係などでPythonの開発環境とかすごく用意しにくいんですよね。

(あと、コマンドプロンプトの真っ黒な画面が怖かった)

その点エクセルマクロは、開発環境の用意はプロパティでチェック項目を一つオンにするだけだし、入門書がたくさんあるし、セル挙動を追えば視覚的にプログラム理解できるし、初心者に優しいです。

(そのやさしさが上述したとおり悪魔の罠なわけですが。)

最初計算用シートに頼ってでもエクセルマクロからプログラミングを始めて、本格的なデータ加工をし始めたあたりで計算用シートという諸悪の根源から脱却する。

さらに本格的なデータ処理を行うために、PythonやRなど別の言語習得したり、エクセルからSQLデータベースやACCESSなどに切り替えていく、というプロセスがいいのではと個人的に思います

2024-02-28

午前中、なんとなくメールの返信をしたためたり、データベースをいじくったりして、すごす。

有意義にすごしたとは、けっしていえない。

そして午後、会議があり、それがおわって、現在にいたる。

そのあいだに、ある件で報告があった。なんかややこしいこととなりそうだった。どうするかな?よく考えて判断しなければならないことがらとなりそう。

そんでもってウジウジしているうちに、発表となり、落選となり・・・なにもやる気おきなくなって・・・また1週間ほど、無為無策にすごすのか?

なんかおわったね。

いちどとりかかって、やめられなくなるということ

さくじつ、代休をいただいて、いえにいたのだが、どういうわけだか、参考文献リストをいじりはじめてしまい、とまらなくなった。

よなかの10時くらいまでいじっていた。

やりたくてやったこととは・・・

それにしても、せっかくのお休みを、・・・・それでも、スッキリたからいいのかな?

さいきん、研究のアレがかわってきた

ので、むかしむかしに集めた文献データほとんど引用することもなく、やくだたなくなってきている。そういう現実をみるのが、つらい。直視するのがつらい。

といっていちいちリムーブするのも、コスパわるいっす・・だし・・・・・

なんか起死回生一発逆転ホームランみたいな

コスパの良いのん・・・・ないかな?

anond:20240228015526

ヘブン?だっけ一番大きいの?

あのサイトの全国のリアルタイムの稼働状況をデータベースにしたら算出できるんじゃない

2024-02-27

日本の住所長すぎ問題

マイクロソフト本社

One Microsoft Way REDMOND, WA 98052-6399 USA

 

これで郵便物が届く

日本法人だと

〒108-0075 東京都港区港南 2-16-3 品川グランドセントラルタワー

英語表記すると

JAP,108-0075 TOKYO,MINATOKU,KOUNAN,2-16-3 Shinagawa Grand Central Tower

 

関西支店だと

〒530-0001大阪府大阪市北区梅田2丁目4−9 ブリーゼタワー29階

JAP,530-0001,OSAKA Pref. Osaka-SHI kitaku,Umeda,2choume,4-9 breeze-tower 29F

 

なげーよ

住所録データベースバッファオーバーフロー狙ってんのか?

 

日本一長い住所、

京都府京都市上京区智恵光院通り芦山寺上る西入る西社町(この後ろにまだ番地が続く)

Kyoto Prefecture, Kyoto City, Kamigyo Ward, Chiekoin Street, Ashizanji Temple, west entrance, Nishishacho(機械翻訳

 

からなげぇっつの

バカなの?

日本人バカなの?

日本世帯数は5000万世帯、法人やらただの建物などすべてをコードアドレッシングしたとしても数字なら12桁もあれば十分で

漢字数字を組み合わせるなら6桁もあれば十分だろう

 

「住所どこ?」

「京上西ZI8」(Kei,Ue,Sei,ZI8)

くらい短縮できる

やれよ

 

さっき郵便局から「国際郵便届いてるけど住所が切れててわからんから電話した」つーのがあったので

ログイン ユーザー登録
ようこそ ゲスト さん