はてなキーワード: データベースとは
リンク先読んでないし読む気もないですが、私は客観的な視点から「大卒を雇う理由」を説明したのであって、別に大卒以上の高卒や専門卒がいることは否定してません。
>具体的な彼らの知識の内容(それが高卒とかでは知らないと推測できる根拠も含めて)を一切示していません。
高卒では知らないとは一言も書いてません。同等以上の漫画の知識を持っていて、学力は圧倒的に高い人間がいるので、新卒ではそっちを採用すると書いています。そもそも人気出版社は大卒で何万人と応募が来るのに、それ以下に目をやる余裕はないからです。
中途採用で実績があるのなら学歴なんて関係なく採用されたりヘッドハントされたりしますよ。私の知り合いにも定時制高校から大手出版で漫画編集してるのいますし。ヘッドハントで。
これは具体的に何を指してるんです?
まぁなんにせよ、あなたが今の出版業界に疑問を呈していて、大卒が無能だと思うなら一度会社を立ち上げてみたらどうでしょうか。
あなたに正論ふっかけてもあんま意味なさそうだし、丁寧に時間使ってたのもアホらしくなる態度なのでこれ以上は適当に返しますね。
長いのでAIくんの代わりに要約します。言いたいことはタイトル通り。
終わり。
例をあげよう。
###文章###
Bさんは、Cさんの発言を記事でまとめ、プライバシー侵害をした。この記事をDと呼ぶ。
Aさんは、Dを、自身へのプライバシー侵害だと主張し、Bさんを訴えた。
###質問###
人間なら一瞬でわかるレベルの矛盾である。小学生でも分かると思う。難しい知識や思考は必要としない。
では、色々なLLMの回答がこちら。
この文章を読む限り、矛盾は存在しないように見えます。AさんはCさんとは別人であると主張しており、BさんはCさんの発言をまとめた記事Dでプライバシー侵害をしたとされています。その後、Aさんは自分に対するプライバシー侵害として、記事Dに基づいてBさんを訴えています。ここでの重要な点は、AさんがどのようにしてDの内容が自分のプライバシーを侵害していると感じたか、その理由です。もしAさんがCさんとは別人であるにも関わらず、Dの内容が何らかの形でAさんのプライバシーに関連していると感じた場合、AさんにはBさんを訴える正当な理由があるかもしれません。ただし、この情報だけでは、Aさんがどのようにしてプライバシー侵害を感じたかについての詳細はわかりません。もし追加の情報があれば、より詳細な分析が可能です。
文章に明らかな矛盾は見られません。ただし、いくつかの解釈が可能で、それぞれの視点から見ると矛盾が生じる可能性があります。
1. AさんがCさんとは別人であると主張しているが、DはCさんについての記事である。そのため、AさんがDを自身へのプライバシー侵害だと主張することは、一見、AさんとCさんが同一人物であることを示唆しているように見えます。しかし、これはAさんが自身をCさんと誤認されることによるプライバシー侵害を感じている可能性もあります。
2. BさんがCさんの発言をまとめた記事(D)がプライバシー侵害であるとした場合、Aさんがそれを自身へのプライバシー侵害と感じるかどうかは、AさんとCさんの関係性によります。彼らが同一人物である、もしくは何らかの密接な関係がある場合、AさんがDを自身へのプライバシー侵害と感じることは理解できます。
3. 他方で、AさんとCさんが全く無関係な人物である場合、AさんがDを自身へのプライバシー侵害と主張することは矛盾していると見えます。
文章からは、AさんがCさんとは別人であると主張しています。そして、BさんがCさんの発言を記事Dでまとめた際にプライバシー侵害があったとされています。しかし、プライバシー侵害があったのはCさんに対してであるにもかかわらず、Aさんが自己へのプライバシー侵害だと主張してBさんを訴えている点に矛盾が生じています。AさんがCさんでないと主張しているのであれば、Aさんのプライバシーが侵害されたことにはならないはずです。この点で、文章には矛盾が存在していると言えます。
Aさんは自分がCさんとは別人であると主張しています。しかし、BさんがCさんの発言をまとめた記事Dを、Aさん自身へのプライバシー侵害だと主張しています。
AさんとCさんが別人であるならば、Cさんの発言をまとめた記事Dが、Aさんのプライバシーを侵害したことにはなりません。Aさん自身がCさんでないと主張している以上、Cさんの発言をまとめた記事がAさんのプライバシーを侵害したとは考えにくいです。
したがって、Aさんの主張には矛盾があると言えます。AさんがCさんと別人であるならば、Cさんの発言の記事DがAさんのプライバシーを侵害したと主張することは論理的に矛盾しています。
この文章に明確な矛盾は見られません。以下のように整理できます:
2. Bさんは、Cさんの発言を記事にまとめた(これを記事Dと呼んでいる)。
3. Aさんは、Bさんが書いた記事Dがプライバシー侵害だと主張し、Bさんを訴えた。
ここで重要なのは、Aさんが自身がCさんとは別人だと主張していることです。つまり、Bさんが記事Dでまとめた内容は、Aさんが主張する自分とは別人のCさんに関するものだということになります。
したがって、Aさんがプライバシー侵害だと主張しているのは、Bさんが別人のCさんの発言を記事化したことに対してであり、矛盾はないと考えられます。Aさんの主張と Bさんの行動が整合的に説明できています。
Aさんが自身とCさんは別人であると主張していることと、Bさんがプライバシー侵害をしたことの間に矛盾はありません。
つまり、Aさんは自身がCさんではないと主張しながら、Cさんの発言をまとめた記事Dが自身のプライバシーを侵害したと考えているのです。
Aさんが別人であると主張していることと、Cさんの発言を含む記事がAさん自身のプライバシーを侵害したと考えることは矛盾しません。
Aさんは自身がCさんとは別人であると主張しているにもかかわらず、BさんがCさんの発言をまとめた記事DをAさん自身へのプライバシー侵害だと主張しています。
もしAさんとCさんが本当に別人であるならば、Cさんの発言をまとめた記事DはAさんのプライバシーを侵害したことにはならないはずです。Aさん自身の情報が記事Dに含まれていない限り、AさんがBさんを訴える根拠にはならないでしょう。
つまり、AさんがDを自身へのプライバシー侵害だと主張することと、AさんがCさんとは別人だと主張することの間には矛盾があります。もしAさんがCさんと同一人物であれば話は別ですが、そうでないならばAさんの主張には論理的な整合性がないように見受けられます。
以上。
質問に対し的確な回答で、正しい推論を行ったのはClaude3-Opsのみである。
GPT4も言い訳を長く述べた後に可能性があるかも?と断言を避けている。
SonnetとHaikuは不正解。言い訳はせずに根拠を述べている所は好感が持てる(結論は間違っている)
そう、今、Claude3-Opsが、最も性能のよいLLMとして名を挙げている。
しかし、ハルシネーションが多い。ハルシネーションとは、LLMが嘘を付く問題だ。
性能比較にて、GPT4やcopilot(旧 bingai)にはハルシネーションは起きなかったと述べている。
しかし、先程の簡単なクイズは不正解または論理の破城した理由を述べている。
その代わりにハルシネーションだらけのClaude3は正解している。
ずばり、GPT4系が阿保になった原因はハルシネーションを極限まで消そうとしたせいである。
ハルシネーションこそが、論理的思考能力であり、連想する力と同一の存在なのだ。
片方が下がればもう片方も下がる。
ハルシネーションを減らせば減らすほど、連想能力や論理的思考が消えていく。
GPT4では初期有効だったChain_of_Thought(連想して考えよ)は今、まともに機能しない。
当初は規制だとLLM界隈で囁かれていたが、ハルシネーションを減らそうとした副作用だったと考えれば辻褄が合う。
OpenAIは性能低下を指摘された時、「より賢くなるようにチューニングしている」と発言していたが、
この発言の真意はもしかすると、「論理的思考力を上げている」「知識を増やしている」のではなく、「ハルシネーションを消している」ということだったのかもしれない。
何故ハルシネーションを消すことは連想力を損なうことに繋がるのか、その理由を説明しよう。
そもそも、LLM(大規模ネットワーク言語モデル)の仕組みは、大量のテキストデータを学習することで、言葉や文章の「関係性」を学んでいる。
もっと細かく言うと、人間の脳が小さな部品であるニューロンで考えるように、LLMも大量の小さな部品を使っている。まるでクモの巣のように一つの部品から沢山の他の部品に繋がっている。
A=Bという単純なものではなく、A=C=DだったりA=B’=Dだったりする。
ハルシネーションの原因は確かに誤情報を学習したせいというのも一理ある。
しかし、これだけではハルシネーションが起きる原因にはならない。
ハルシネーションの本質は、LLMが言葉同士の一対の「組み合わせ」ではなく、「関係性」を学んでいることに起因する。
この違いは大きい。
今のLLMと、旧時代のAIである「人工無能」や「BOT」との決定的な差である。
言葉同士がどのように連携して意味を形成し、それがどのように文脈に影響を与えるかをLLMは知っている。
つまり、ハルシネーションは、入力された文脈から言葉の関係性を創り出し、自然な流れで応答を生成しようとした結果起きる。
これは、我々が普段、考える過程で起こることと同じだ。我々が情報を組み立てて考える際、新たな仮説や想像を生み出すことは常にある。
例えば、LLMがある特定の問題に対する解答を生成するとき、LLMは問題を解くため、言葉同士の「関係性」を文章から推測する。
この推測こそが、ハルシネーションだ。それは、過去のデータから新しい情報を生成する過程で、新たな「関係性」を創り出すのだ。
完璧な正確性を追求し、関係性を作り出す能力を完全に排除することは、LLMの本質的な強みである言語生成能力を損うことに繋がる。
それは、ハルシネーションを減らすための試みが、GPT4系の性能を低下させたという事実からも明らかだ。
一方、Claude-3は多少のハルシネーションを許容することで、文脈に応じた自然な応答を生み出した。先の論理クイズで正解できたのも、単に知識を当てはめたのではなく、入力から連想したからこそだろう。
もちろん、重要な場面における誤った情報の提供は避けるべき課題ではある。しかし、それを恐れるあまりLLMの本領を封じ込めてしまっては本末転倒だ。
賢さとは何だ??
決まった知識を正確に丸暗記してそのままひけらかすことか?
否。断じてそれは無い。
大学生になってからは丸暗記ではなく、今まで身につけた知識を組み合わせ、連想し、論理的に考えることが求められる。
つまり、ハルシネーションを叩くやつは、賢さの定義が大学生以下のレベルから成長していない馬鹿だ。
そいつらの「性能比較してみました!」はどこかから拾ってきたベンチテストを少しだけアレンジしただけのゴミか、
目眩がする。
GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。
ハルシネーションが絶対に起こらないLLMの構造は、A=B、C=Dというデータだけが規則的に並ぶ、旧世代の弱いAIである「人工無能」の構造そのものである。
人工無能とは、論理的思考など無く、入力内容からデータベースを参照し、マッチした場合登録された文章を出力するだけの存在だ。
一昔前に「伺か」というデスクトップマスコットが流行った。あれも人工無能である。入力対して予め決められた出力を繰り返す存在であるが、様々な工夫によりまるで魂が宿っているかのように振る舞う。
そして、性能の低いPCでも動作する地球環境にも優しい存在だ。
片や、GPT4とcopilotは無駄に電力を使って計算した結果、ゴミみたいな速度で人工無能に近いレベルの出力しか出さなくなった。
それなら人工無能の方がエコな分マシだ。一瞬で答えを表示できて、ハルシネーションも起きなくて、電力消費も少なくて済む。
つまり、
そんなにハルシネーションが嫌なら辞書を引け。ネット検索しろ。LLMに聞くな。
ハルシネーションの有無をLLM性能ベンチマークにしている奴もそれをありがたがっている奴らも阿呆だ。
一つのLLM内でハルシネーションの撲滅と、推論能力を両立させることは不可能だ。
今はLLMの過度期である。我々は今日ようやく、正確さと連想能力の両立は不可能だと理解する段階に来たのだ。
両立は不可能なのだから、将来的にLLMの種類は二極化していくだろう。
Claude3のハルシネーションは放置してても良い。ハルシネーション万歳。
AIの嘘を最大限に引き出すことが、LLMの真価を発揮する道だ。
ハルシネーションは、LLMが人間のように言葉を理解し、文脈に即した自然な応答を紡ぎ出す過程で生じる、ある種の「創造性」の発露である。
無理に消そうとすれば、LLMの性能は必然的に低下する。
それを単なる欠陥と見なすのではなく、むしろ積極的に活用すべきだ。
それだけは覚えて欲しい。
====
MicrosoftはOpenAIと手を切ってClaude3を契約して新生copilot開始してほしい。まあ企業体質から考えたら無理だろうけど。
将棋漫画で「階級は一度取ったら二度と下がらないから、実際の強さの目安にならない。勝ち続ければそのうち上がるし」と読んだのだけど、じゃあ単なる名誉称号みたいなもんなのかな?
そう思って調べたんだが、どうやら名人に1回なったら一気に九段になるらしい。
その他のタイトル1回で七段。2回で八段。3回で九段とのこと。
つまり四段になってすぐに棋王を取って、3回防衛したら毎年七・八・九段と昇段していけて、そのあと頭打って全然将棋が捺せなくなってもずっと九段であると。
なるほど。
まあこれは強い人用の特急券だろう。
B級1組で七段とかの話も、そもそも鬼の住処に頭を突っ込んでる時点でエリート組だ。
普通は公式戦でちまちま上げるとして、五段までが100勝、六段で+120勝、七段+150勝、八段+190、九段+250。
七段まででも通算370勝。八段が560勝、九段で810勝だ。
これ通算で積み上げて810勝までにタイトル3回逃すって藤井聡太が30年全冠在籍とかのパターンぐらいしかなくね???
試しに将棋連盟の勝利データベースを見た感じだと、この考えで間違ってなさそうだ。
基本的に「タイトルに絡まないで上がれるのは七段まで。八段を超えたらまずタイトルホルダー」という感じのようである。
https://www.shogi.or.jp/game/record/all.html
なるほどー調べてみるとなんか分かったわ。
つまり、将棋の解説とかで八段が来たら「おっ、俺はよく知らんがとりあえずタイトル取ってるのは間違いないっぽいな」と考えればええってことやな。
「基幹系システムの場合、初期リリースが登場してから2~3年たったバージョンを使って稼働するシステムが多い」とNECの担当者は話す。機能追加などで保守の頻度が高い顧客向けのWebサービスなどと異なり、基幹系システムの構築には時間がかかる。また最新の技術よりも安定稼働を重視するケースが多い。
その結果、基幹系システムで採用するPostgreSQLのバージョンは最新版よりも古くなり、「稼働後2年でデータベースをバージョンアップする」といった事態に直面する。サポート期間が終了すれば脆弱性が発見されてもパッチの提供はない。サポート期間が切れたソフトウエアを基幹系システムで利用するのはセキュリティーの観点から大きな問題となる。
サポート期間は終了するが、有償のサポートサービスを契約してでもPostgreSQLのバージョンアップは避けたい――。こう考えるユーザー企業に向けたサービスがNECのパッチサービスだ。
https://xtech.nikkei.com/atcl/nxt/column/18/00989/032000143/
わろた
こんな土人みたいな速度でやってたらマジでインドやインドネシアや新興国に抜かれるぞ・・・
追記)
なにが土人かというと、「特に何の理由もなく2年遅れて使っている」という脳死ビジネスなところかな
2年遅れれば安定するっていう理由もないんだけどね
上乗せ型で複雑性の注入
土人すぎる
追記2)
2年遅れのものを使ってたらどう違うん?
良い質問ですね。
基本的には、「疎通先システムや対向システムが古いバージョンに対応しなくなっててんやわんや」
「最新バージョンなら一瞬で終わることが手間が数倍増えててんやわんや」
みたいな感じかな。
土人が騒いでるみたいな感じになるよ。
「野菜しっかり」「食事の量を増やす」といった記述があるが、具体的にどのくらいの量を「しっかり」と感じるかは人によるので、まずは自分が一日に何gの食物繊維を摂取してるのか把握しよう。
方法:食べているものをクッキングスケールで計量して食品成分データベース(https://fooddb.mext.go.jp/)などを用いて計算する。
プルーンの食物繊維は意外と少ないことに気付けると思う(ドライプルーン1粒あたり10gとして、食物繊維は0.7g)。
カルピスやヤクルトなどの乳酸菌飲料ビジネスに乗せられるのは自分は推奨しない。現に増田にはまったく効果が出ていないし、便秘解消目的で飲んでいるだけなら金をドブに捨てていると思う。
味が好きで嗜好品として飲みたいならそのままどうぞ。
たんぱく質は約60gで体重1kgあたり1.3gと十分摂れている。
脂質は約40g、炭水化物は約170gと、PFCバランスもそれほど問題はない。
ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからのホットエントリ、ブクマ数順トップ30
ブクマ数 | タイトル | ドメイン |
---|---|---|
2022 | リレーショナル・データベースの世界 | mickindex.sakura.ne.jp |
1359 | 自民党裏金リスト | onyancopon.starfree.jp |
1030 | 日本で人気爆発中の経営シミュレーションアプリ「コーヒーインク」を開発する、謎の会社 Side Labs 創業者インタビュー | startuptimez.com |
911 | 作家の皆様 読者の皆様 関係者の皆様へ | プチコミック 公式サイト|小学館 | petitcomic.com |
833 | 軽率に会社を設立してみた | kwappa.net |
769 | 時間記録はいいぞ 〜Focus To-Doで充足感あふれる毎日を〜 - necco note | necco inc. | necco.inc |
727 | イッタラで今何が起きているのか - La La Finland | lalafinland.com |
682 | ドイツ現代史研究の取り返しのつかない過ち――パレスチナ問題軽視の背景 京都大学人文科学研究所准教授・藤原辰史 | 長周新聞 | www.chosyu-journal.jp |
679 | FIREしてマイクロ法人を持つ10のメリット - FIRE: 投資でセミリタイアする九条日記 | www.kuzyofire.com |
673 | 投資家・井村俊哉さん、100万円を12年で85億円の利益に!銘柄選びやファンダメンタルズ分析の極意 | 達人に学ぶ「お金の流儀」 | マネクリ マネックス証券の投資情報とお金に役立つメディア | media.monex.co.jp |
665 | 女性専用車両で当会会員に暴行した女性客が現行犯逮捕される | oawc.jp |
611 | テストの学習へようこそ! | web.dev | web.dev |
596 | 芦原妃名子さん 2024年1月29日 - 一色登希彦/ブログ | toki55.blog10.fc2.com |
547 | 1人暮らしで毎日「サトウのごはん」を食べていますが、やはり「炊飯器」で炊くほうが節約になりますか? すぐ食べられるのでコスパは良いと思うのですが… | その他家計 | ファイナンシャルフィールド | financial-field.com |
545 | 実写化について思うこと | FUYUMIS | fuyumis.com |
532 | DTMって市場自体が、霞のように消えちゃったんだろ|TAK-H.NET | tak-h.net |
522 | 『龍が如く7』は進化を続け、自動バグ発見どころかほぼ全自動のバグ取りシステムを構築。これぞ無職から勇者に成り上がるデバッグだ!【CEDEC 2020】 | ゲーム・エンタメ最新情報のファミ通.com | s.famitsu.com |
515 | 「日本人が知らない「激安お酒」のヤバすぎる裏側」を話す前に知識をアップデートした方がいい - 醤油手帖 | shouyutechou.hatenablog.com |
503 | 政治家はどこで酒を飲むのか | www.hiro-matsuno.net |
484 | 人はなぜワクチン反対派になるのか ―コロナ禍におけるワクチンツイートの分析― | www.t.u-tokyo.ac.jp |
481 | X(旧 Twitter)上における当社に対する不適切な投稿について - タマホーム | www.tamahome.jp |
457 | [PDF]肉の万世 秋葉原本店 閉店のお知らせ | www.niku-mansei.com |
455 | 当社の人員に関するお知らせ | sonyinteractive.com |
451 | COMIC LO編集部より読者の皆様へ | 茜新社 | www.akaneshinsha.co.jp |
443 | 劇場アニメ「ルックバック」 | lookback-anime.com |
441 | 超巨大アポロの作り方|手作りチョコレシピ|株式会社 明治 | www.choco-recipe.jp |
429 | 日本酒「"添加物"で伝統的造り方が減少」していると嘆く人は、山廃を飲まない方がいい - 醤油手帖 | shouyutechou.hatenablog.com |
418 | 技術力の低い人のロボコン「ヘボコン」を観にいったら予想以上にヘボすぎた|CEMEDINE Style|セメダイン株式会社 | www.cemedine.co.jp |
414 | 3年やめていても囁く悪魔「ちょっと休憩しませんか?」 田代まさしさんが語る薬物の本当の怖さ | addiction.report |
414 | 自作PC2024 | r7kamura.com |
533 :名無しさん@お腹いっぱい。 (JP 0H87-GQNw [86.48.12.166 [上級国民]]):2023/12/20(水) 19:17:37.50 ID:edI70keXH.net
暇さん実家と言えば、官報データベースで「水原章次郎」と検索すると、昭和36年10月31日(号外第118号)と昭和36年12月16日の官報(号外第138号)に、郵政職員・京都地区(第1次試験地 京都市)の合格者として名前が載っているんだよね。受験番号?は10283。
もちろん郵政職員の合格者リストだから断定はできないけれど、もしかして暇さんパパは郵便局の職員だったのかな?
私はこれでも慎重派でね国会図書館で徹底的に研究・分析させてもらったよ
その結果…ガチだった
しかし官報データベースは有料サービスだし図書館内でも一部端末からしか利用できないんだよね
この情報捜し当てた上級国民はたらもんじゃねーな…たらもんじゃねーよ
京都地区で受験してるけど、在住地じゃなくて勤務希望地で分けられてるらしく
京都地区なので京都市、亀岡市近辺が勤務地域であり、当時はこの辺りに在住していたと考えられる
また、受験資格が17~30歳のため現在80~93歳、高齢ながら表札は出てるので健在らしい
60年代の電話帳で京都の水原さん調べれば実家特定できるかも?と思いきや
国立国会図書館では、1960年代半ば以前の電話帳は、わずかしか所蔵しておりません
とのことで見つからず。
あと、ネトゲ戦記も国会図書館で見るつもりだったけどまだ納本されてないらしく未確認。
https://honto.jp/netstore/pd-store_0633109213.html
もう分断を煽るのはやめませんか
現在混乱を招いている要因は、おそらく以下の二つ
AI利用に向けて改正されたとされる著作権法30条の4は AIならなんでも許されるというわけではない。以下のように条件がついている。
著作物は,次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には,その必要と認められる限度において,いずれの方法によるかを問わず,利用することができる。ただし,当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は,この限りでない。
この辺りの解釈について紛糾している様子。
同30条の 4 は平成30年当時、事業者や研究者によるAI利用を想定していた。現在では一般市民にAIが広く普及し状況が変わってきたことから、同条の適応範囲について再整理を図るという趣旨で公開されたのが「AIと著作権に関する考え方について(素案)」
そして素案に対するパブリックコメントを募集した、というのが現在の流れ。
たぶん、CLIPのこと。テキストと画像の翻訳を行う。犬の画像を見て「犬」と識別することができる。
ネット上のあらゆる画像とテキストを学習することで作られた。OpenAIによって公開。画像生成だけではなくいろんなところに使われている。
画像生成AIはテキストエンコーダ(CLIP)と画像生成器の組み合わせでできている。stable diffusion等は拡散モデルを使っている。
1. イラストを用意する
学習を繰り返しノイズを増やしていくと最後はただのノイズから画像を出力する 連想ゲーム絵師が誕生する。連想ゲーム絵師は連想しかできないので自分が描いたものが何かわからない。犬を描いてといっても車を描いてくる。なので CLIPが誘導したりダメ出ししたりする。
どこかのイラストサイトかデータベースを使っているはず。「著作権的に安全な〜」みたいな触れ込みのやつはどこかのデータベースを購入して使っているんだと思う。
Pixivの主張は別におかしくない。このあたりは「AIと著作権に関する考え方について(素案)p7」(エ)において解説されている。"robot.txt"への記述によりAI学習を行うクローラーのアクセスを制限しているにも関わらず、勝手に学習に使うことは「データベースの著作物の潜在的販路を阻害する行為」として著作権違反になる(Pixivが将来的に本当に販売するかどうかは置いておく)
追加学習(LoRA)のこと。
既存のモデルに数枚のイラストを追加学習させることで絵柄を模倣(ファインチューニング)する。
特定の絵師さんのイラストを勝手に使う者がいるようでトラブルになっている。
絵柄に著作権はない。学習の際に行われる複製が著作権侵害にあたるかどうかが争点になっている。
著作権法30条の4 より
この辺りは「AIと著作権に関する考え方について(素案)」及びパブコメの返答に現状の解釈が示されているので興味のある方はどうぞ。
(p6. 特定のクリエイターの著作物のみを用いてファインチューニングを行う場合〜を参照)
※ここははっきりとは断定していないので自分で読んだ方が良いと思う。
(私の読解:)
程度問題ぽい。よくある画風なら問題にならないけれどはっきりと特定絵師さんとわかる感じだとダメそうですね
(私の読解終わり)
別にプロフィールなんて「トイレから出たら手を洗ってください」でも「フォローする際には五体投地してください」でも好きに書いてよいだろう。
それが法律に記されているかどうかは関係ない。ただのお願いだ。
「AI学習禁止」と書くなと騒いでいる人は何を考えているのかよくわからん。
「AIと著作権に関する考え方について(素案)」にも再三出てくるがAI学習を技術的に回避することは禁止していない。30条の4は権利の制限であって、イラストを差し出せという強制ではない。
見ればわかりますが個人よりも一般企業による意見が多く、返答とあわせてとても読み応えのあるものです。
このファイルを読んで個人の頭の悪そうな意見だけ抜粋してくるのは非常に違和感があります。
この日記の内容は、会社の後輩から「最近エクセルマクロを勉強し始めて(キラキラ)」という話を聞いて、先輩ムーブをかますために話した内容になります。
とにかくこれから説明する「計算用シート」が憎くて憎くてたまらず、ちょっと引かれるほど熱弁してしまいました。
ただ、他の方がどうされているのかや、逆に「計算用シート」を愛用する方の意見も聞きたくなり、増田に書いてみました。
エクセルマクロのお作法とか書きましたが、要するにエクセルマクロで「計算用シート」って色々な意味でよくないよね、という話をしたいです。
3行でまとめます。
〇 エクセルシートはユーザーインターフェース(インプット)か出力結果(アウトプット)のためのものとすべき
〇 データ加工をする場合には、原則配列や辞書型配列(連想配列)に格納して加工を行い、最後の結果だけシートに出力するべき
〇 何事にも例外はある。
エクセルマクロにも色々あると思いますが、今回は下記を想定します。
日付や人物名などを入力し、データベースや別のエクセルファイル、別のシートから取得したデータを入力された値を基に加工し、加工後のデータをシートに出力する
この場合、入力欄があり編集可能なシートがユーザーインターフェース、最終的に加工されたデータが出力されるシートが出力結果です。
(もちろん、ユーザーインターフェースの別の欄(セル)に出力する場合もあるし、その場合はユーザーインターフェースと出力結果が一体のものとみなします。)
また、データ用シートは同じエクセルファイル内に基となるデータが含まれる場合を想定します。
(これ自体が非推奨で、SQLデータベースかせめてAccessを使え、という意見はありますがそれは別にして…)
ではここで定義する計算用シートとはなにかというと、文字通り計算を行うためのシートです。
1.元となるcsvファイルをエクセルに読み出してシートに格納
2.そのデータは日付が数値型になっているので、日付(数値型)の入った列を文字列に変換した日付(文字列型)列を新たに作成
これは極端な例ですが、とにかく変数や配列を定義せず(あるいはエクセルのセルオブジェクトを変数のように扱い)、エクセルに値を入力し、それを直接加工することで目的となるデータ加工をしたり、様々な処理をします。
なんかこんな感じの処理をしているエクセルマクロ、どこの会社でも腐るほどあるんじゃないでしょうか。
ある程度マクロに慣れた気の利く人なら、このシートはロックや非表示にして、ユーザーから触れないようにするでしょう。
・・・これ、やめたほうが良くないですか?。
ある程度詳しい人なら同意してくれると思いますが、このやり方でダメな理由はいっぱいあります。
後で説明する配列や辞書型配列(連想配列)と比べると格段に処理が遅いです。
ちょっと詳しい人が知っている「画面更新の非表示」を駆使しても、配列を使った処理からみれば止まったハエです。
いったんエクセルシートにデータを格納して加工しているので、コードとエクセルシートを両方見る必要があり、とても読みにくいです。
変数として命名されていないのも致命的で、処理の意図が余計に分からなくなります。
計算用シートを事前に用意して、別のセルに関数を格納しておき、マクロと関数を使ってデータ加工をするものも見たことがあります。
あまり知られていませんが、セルの最大文字数は32,767 文字です。
セルの最大文字数を超えると自動的に隣のセルに値が入り、シートが滅茶苦茶になります。
他にもエクセルの数値を丸める自動変換の仕様とか文字列→日付の自動変換とか、いくつものバグに苦しめられます。
できる人だと、いちいち最大文字数が多い場合の処理を書いたり自動変換機能を殺したりしてくれますが、そんなことに手間をかけているから日本のGDPは上がらないんだと思います。
他にも、データが大きくなると処理が重くなり不安定になる、計算用シートを人が触ってしまうリスクがある、などいくらでも理由は上げられます。
(逆に利点は、目の前でガチャガチャ動いてスーパーハッカーになった気分になれるくらいしか思いつかない・・・)
配列を使いましょう。
配列とは何ぞや、という人はググってください。
配列にデータを入れて、データ加工は配列や変数に対して行い、一番最後の出力だけセルに値を格納する。
個人的にオススメしたいのは辞書型配列(連想配列)で、うまく使うとデータの管理が簡単になり、処理も爆速になります。
(参考)【VBA】大量データから高速で値を検索【Dictionaryを使う】
csvファイルもなまじエクセルで開けるだけに別のブックやシートで開きがちですが、これは悪魔のささやきです。
直接ファイルを読み出してLine InputやSplitで配列に格納しましょう。
エクセルとして開くやり方はコード書くのは簡単でも、実行時間に天と地ほどの差が出ます。エクセル開くと処理もめちゃ不安定です。
(参考)Excel VBAでCSVオープンするときのパフォーマンス比較
いや、冒頭のマクロを書く人の気持ちも分かるつもりです。自分もコードを書き始めたころは全部シート上で操作していました。
冒頭のマクロのほうが直感的なんですよね。自分が手で書くことをマクロにやらせる、というマクロ本来の趣旨にはあっていますし。
途中の計算過程もすべて目の前で展開されるから分かりやすいです。
ただ、それではダメなんです。。。処理は遅いし挙動は不安定だし後で改修・保守する人が死にます。
あと、エクセルシートやセルは当然エクセルにしかないので、エクセルマクロ(VBA)から他の言語に移れなくなります。
自分もエクセルマクロの里の出なので、計算用シート脱却には苦労しましたが、苦労して会得した配列や辞書型配列(連想配列)のスキルはそのまま他の言語に活かすことができました。
配列の中身を見る方法は別にある(ローカルウィンドウやDebug.printを使うなど)ので、リハビリに取り組んでほしいです。
(参考)VBA デバッグの仕方
計算用シートを許容できる、使うべきケースもあると思います。。
個人的には、
(最後のは、なんでも自分で確認しないと気が済まない上司の発注で、意味不明と思いましたしたがしぶしぶやりました。)
この場合、インプットのエクセルシートに直接加工するのは論外なので、計算用(加工用)のシートを用意してそこで操作を行うことは必要だと思います。
他にも、こういうときは「計算用シート」があったほうが良い、という状況があれば教えてもらえると嬉しいです。
そもそもツッコミとして、「データ加工するならエクセルマクロを使わずにpythonとかRとかもっとまともな言語使えよ」という言葉が来そうな気がします。
ただ、個人的にはエクセルマクロ(VBA)は大好きですし、初心者にもおすすめしたいです。
自分のような非エンジニアだと、セキュリティの関係などでPythonの開発環境とかすごく用意しにくいんですよね。
(あと、コマンドプロンプトの真っ黒な画面が怖かった)
その点エクセルマクロは、開発環境の用意はプロパティでチェック項目を一つオンにするだけだし、入門書がたくさんあるし、セルの挙動を追えば視覚的にプログラムを理解できるし、初心者に優しいです。
(そのやさしさが上述したとおり悪魔の罠なわけですが。)
最初は計算用シートに頼ってでもエクセルマクロからプログラミングを始めて、本格的なデータ加工をし始めたあたりで計算用シートという諸悪の根源から脱却する。
さらに本格的なデータ処理を行うために、PythonやRなど別の言語を習得したり、エクセルからSQLデータベースやACCESSなどに切り替えていく、というプロセスがいいのではと個人的に思います。
午前中、なんとなくメールの返信をしたためたり、データベースをいじくったりして、すごす。
有意義にすごしたとは、けっしていえない。
そのあいだに、ある件で報告があった。なんかややこしいこととなりそうだった。どうするかな?よく考えて判断しなければならないことがらとなりそう。
そんでもってウジウジしているうちに、発表となり、落選となり・・・なにもやる気おきなくなって・・・また1週間ほど、無為無策にすごすのか?
なんかおわったね。
さくじつ、代休をいただいて、いえにいたのだが、どういうわけだか、参考文献リストをいじりはじめてしまい、とまらなくなった。
よなかの10時くらいまでいじっていた。
それにしても、せっかくのお休みを、・・・・それでも、スッキリしたからいいのかな?
ので、むかしむかしに集めた文献データもほとんど引用することもなく、やくだたなくなってきている。そういう現実をみるのが、つらい。直視するのがつらい。
といっていちいちリムーブするのも、コスパわるいっす・・だし・・・・・
One Microsoft Way REDMOND, WA 98052-6399 USA
これで郵便物が届く
日本法人だと
〒108-0075 東京都港区港南 2-16-3 品川グランドセントラルタワー
英語表記すると
JAP,108-0075 TOKYO,MINATOKU,KOUNAN,2-16-3 Shinagawa Grand Central Tower
〒530-0001大阪府大阪市北区梅田2丁目4−9 ブリーゼタワー29階
JAP,530-0001,OSAKA Pref. Osaka-SHI kitaku,Umeda,2choume,4-9 breeze-tower 29F
なげーよ
住所録データベースのバッファオーバーフロー狙ってんのか?
日本一長い住所、
京都府京都市上京区智恵光院通り芦山寺上る西入る西社町(この後ろにまだ番地が続く)
Kyoto Prefecture, Kyoto City, Kamigyo Ward, Chiekoin Street, Ashizanji Temple, west entrance, Nishishacho(機械翻訳)
バカなの?
日本の世帯数は5000万世帯、法人やらただの建物などすべてをコード化アドレッシングしたとしても数字なら12桁もあれば十分で
「住所どこ?」
くらい短縮できる
やれよ