はてなキーワード: 判別とは
ヨドバシがガンプラ発売日に中国人テンバイヤーをシャットアウトしたのは差別だとして非難轟々だったのに、、、
あとブクマカは「Hi-νガンダム」がなぜか各言語で名前が変わってると思ってそうなんだけど、それなんのためのローカライズ?
ponpon_qonqon それって「おまえ!十五円五十銭と言ってみろ!」とどこが違うんだ・・・。まあ小売が個別の売買契約を結ぶか結ばないかは自由だからいいとしても、周りがやんやともてはやすのはアホだと思うぞ
gm91 いや、これは有効かも知れんけどあかんやつ。 なんて読むか知らんけどカコイイから買う、ができない。 転売ヤー撲滅は転売ヤーから買わないことだよ。
necDK 俺は読めない…!興味が無いからだけど、作ってみたくなった時には買えないことになる。まぁいまのとこ興味わいてないからいいけど
leb 「日本語は分からないが自国語で発音した」場合も正解だと思うけど、ヨドバシ店員は各言語での商品名を把握しているのだろうか
white_rose プレゼントを買いにきたら排除されるのか。オタクじゃなきゃいちいち覚えてない
camellow ザマー!ではあるけど本当に日本語が苦手なだけの普通の購買者だったらかわいそうだな。例えばスペイン語やロシア語発音で正しく読んでたとしてそれを店員は判別できるのか?
[B! ガンダム] 「RG Hi-νガンダム」販売→ヨドバシカメラで商品名を言えない転売ヤーが次々撃退される : 痛いニュース(ノ∀`)
https://b.hatena.ne.jp/entry/s/itainews.com/archives/2010406.html
生成AIに関して詳しく書いてある文章があったので、興味深いと思って読みました。
ttps://note.com/freena_illust/n/ne1442b0563c3?sub_rt=share_b
返歌ではありませんし、技術的根拠も出せませんが、思ったことをまとめたいなあと思いました。
断っておくと、上記の記事に対して肯定的な感情を抱かなかった人が書いてます。
そして生成AIはChatGPTを無料でしか使ったことがない人が書いてます。
嫌な予感がする人は読まないほうがいい。
冒頭で書いたように私は生成AIに詳しくはありません。
でも一応話の軸がぶれないように、最初に主張したいことを述べます。
「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。
先日びっくり発言を見かけました。
曰く、生成AIの技術を認めている人はすべからく盗作を認めている(意訳)、とのことでした。
現在の生成AIツールがそうなっているだけなので、学習元を変えれば権利侵害にはならないはずです。
まあ技術的に可能というだけで実際にそうする人はいないと思いますが。
権利の問題が解決されていないのに生成AIのツールばかり絶賛するものだから、生成AI賛成派は著作権を踏み倒していると解釈されるのは理にかなっているとも思います。
先に述べたように、私は生成AIに限らず、AIという技術が発達すればいいなと思っています。
がしかし、問題があるとすればAIという技術には膨大な学習データが必要で、ネット上にある膨大なデータは全てが著作権フリーではないということです。
さて、件の記事では「無許可のデータを学習」という文がありました。
ふと思ったのですが、逆ならいいのでしょうか。
ですが、「許可されたデータ」の数とはどれほどなのでしょうか。
それで生成できるコンテンツとは何なのでしょう。
ニューラルネットワークの階層が極端に少なく、陳腐なものが成果物となるでしょう。
法で「許可されたデータ」のみを学習対象とするように律することは出来たとしたら、AIの未来はないと思います。
理由は当初に述べたとおりです。
機械学習の本を読んだら寝たので諦めましたが。
それで、だいぶ路線が違うのですが、過去に形態素解析をかじっていたころがありました。
その際に「データ量が少ないと何もできないな」ということを痛感しました。
形態素解析というのは文章をスパスパ区切って順位付けなり分類なりをするというものです。
その文章をスパスパ区切るために、単語の分類と区切りが記載されているであろう「辞書」が必要になります。
「今日魔界ではどちゃくそ雪が降った」という例文があったとして、
単語量の少ない辞書では「今日/魔/界/では/ど/ちゃ/くそ/雪/が/降った」
単語量の多い辞書では「今日/魔界/では/どちゃくそ/雪/が/降った」
になる、というかんじ。
イメージ図なので本当に魔界が分割されるかはわかりませんが、固有語はほとんど未知の単語と認識されて分解されると思います。
無料に頼るからよくないのですが、ネット上の無料の辞書は単語量が少ないため、現代風の言い回しがだいたい判別できません。
ボボボーボ・ボーボボなんてこようものなら、もはや人名とすらも認識されません。
いやどっちかというとマンガ名か?
いいかんじにメンテされてた辞書も、とある日を境に更新されなくなってしまいました。
そんな具合で、当時はデータ量が少ないと何もできないなあと、役に立たねえなあとひしひし感じました。
先ほどの無許可、許可のことを書きながら、このデータ量のことを思い出しました。
文章生成AIであれば、学習する際、単語を分割したり重みづけをしたりする際に相応の辞書を使っているはずです。
要はデータ元もそれを補助するツールも、多くのデータがあればあるほど真価を発揮するはずなのです。
フェイク画像やらなにやらが話題になったのは、サムネイル段階で目を引く造形だったからですよね。
その点では遠目で人の興味を惹く成果物を作れるほどになった技術自体は賞賛すべきものだと思います。
でもそれで作られたものって盗作だよね? という声が聞こる気がしますが……。
私も趣味で絵を書いたり文章を書いたりするので、同一のもの、あるいはひどく酷似したものが他者から後出しで出されたらぞっとします。
この手のものはトレパクというものに当てはまりますが、時系列の証拠を出せばおよそどちらが権利を侵害しているかが認められるものだと思っています。
ただ、生成AIでの成果物は本当に権利を侵害しているのか、という疑問はあります。
ttps://note.com/compass_0000/n/na536a5d16c7a
上記の記事はとある絵師さんのトレパク疑惑について書かれたものです。
記事の内容を見ても、この勝訴した絵師さんはトレパク冤罪をかけられたものだと思えたのですが、某SNSで検索をかけて驚きました。
敗訴した絵師さんをかばい、勝訴した絵師さんを非難するような方が多く見られたのです。
しかも裁判が起こるだいぶ前にこのトレパク問題はとても話題になり、「トレパク疑惑」というところがすっぽ抜けて「トレパク」とだけ把握する人が多数いたようです。
つまり、かの絵師さんには「トレパク疑惑の絵師」から「トレパクの絵師」というレッテルが貼られてしまったのです。
そんな先入観からか、はたまたもう片方の絵師さんを妄信しているのか、ふたりを殆ど知らない私ですら妥当と思った判決結果に疑問を抱く人が世の中にいます。
証拠がはっきりしているトレパク裁判ですら、すべての人が納得出来ていないのです。
(なんでだろうね)
トレパクではしばしば線の重なりが証拠として出されますが、生成AIでの盗作の証拠とは何なのでしょうか。
私の作品を学習してると思います、という見知らぬ絵師さんの引用投稿を以前見かけたことがあります。
こことこことここがその証拠です、と赤丸をつけていた記憶があります。
決して私も詳しいわけではありませんが、かの絵師さんは生成AIの生成過程をご存じないのでは、と思いました。
1枚の絵が与える影響がそんなに大きいとは思えません。
ノイズを出してから1px単位で要素を除外していく、という過程だけを知っていたらそんな言いがかりはつけないと思います。
今、このような方がどれだけいるか分かりませんが、身を守るのだとしたら敵を知るべきです。
思い込みや無知では戦えません。……と思い込みでこの文章を書いている私が言うのも説得力がありませんが。
絵柄を寄せて作り出した成果物であれば話は別です。
あえて特定の絵柄に寄せ続けた成果物を作ることで、模倣元の著作者が得るはずだった利益を奪い取ったと訴えることが可能と考えます。
が、この場合も似ている絵柄などごまんとある、という反証が出来てしまうのかなとも思います。
「学習したことの証拠」よりは「模倣したことの証拠」のほうが敷居が低そうではありますが、それでも茨の道ではあります。
逆に言えば証拠らしい証拠を出せないのが生成AIなのかもしれません。
裏はブラックボックスなので……。仮に問い合わせて計算データ云々を入手できたとしても数値の羅列でしょうし。
現状では、生成AIの成果物は盗作疑惑が永遠に付きまとう、という認識にしかなりえないと思います。
盗作じゃないって証明でないならいいじゃーんって開き直る人がいそうですが、グレーゾーンって喜んでいいのかなあ……。
「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。
データがたくさんあればAIという技術の発展が見込めるけれど、それには権利の問題が立ちふさがる。
仮にそれが権利者の権利を守る段階に来たらAIの発展は終わる。
でも、現状の生成AIの成果物は権利侵害をしているともしていないとも言い切れないのでは?
そう思っています。
NFTがいい例ですが、著作権を持っていたとしても物理的には何の意味もありません。
権利持っている人以外スクショできる機能なんてスマホにはありませんし。
絵を描いたのならばAI学習疎外ツールを使って自己防衛する時代になっています。
正直、盗作盗作いう人たちの決めつけ発言に辟易しますが、グレーゾーンであることは変わりませんし、この先白か黒かに変わることもないと思います。
そうです、私はAIという技術が気になっているだけあって、生成AI技術=盗作ツールというレッテルが貼られるのが嫌だなあと思ってるだけです。
今現在は否定できる証拠もないので、断言はできないでしょ! としか言えないのですが。
AIがうまーく発展してる未来のフィクションはどうやって高精度で大容量なデータットの獲得と権利問題を解決したのでしょう。
フィクションに聞いてもわかりませんね。
そうそう思い出した。
DXが進んだのはコロナの影響という話を以前聞いたんです。
企業がちまちまやっている業務効率化や働き方改革なんてちっとも効果がなくて、COVID19が一番の功績者だったと。
その部分はただの皮肉でしたが、事実でもあるので、人間って環境が変わるとそれに対応していくんだなあとつくづく感じました。
とはいえ、今回話題にしている生成AIはおよそ画像生成AIのことを指しているので、環境変化によって必要に迫られることはないと思います。
何に使うんだろう。
気にはなってるけど傍観者なもんで……。
なんかこう、心理学に似てるような……一般人は何に使うんだろうってなる……専門家は分かってそう……。
技術の発展って難しいですね。
ペンタブで描いたものよりアナログの絵が賞賛されたように、ハイテクはすごい、という先入観があるのかもしれません。
すごいからずるい、になるんでしょうね。
障害があって絵が描けない人が生成AIで絵を出せるようになったという話を見たとき、そういう人もいるのかと感心しました。
乱数要素も絡むため、著作物であると主張できるかはさておいて、想像したものを出力できるのは楽しいと思います。
……使ったことないですけど。
そこを上手くやっていて、売れることで良いサイクルを産んでいる企業だから、俺は称賛している。
ランダム性をまるごと否定してしまう人は、本当にゲーマーなのだろうか?
DLCというビジネスモデルで成功しているところ、本当にあるのか?
基本無料で優れた人材を集めてライブサービスゲームを作っている所がますます良いものを作る一方で
DLCのような買ってみなければクソか神かも判別できない、ギャンブルみたいなオファーを突き付けてくるビジネスモデルこそ、時代遅れの信者ビジネスなんじゃないか?
追加開発に何百億もかけられる基本無料スキームと違い、DLCは本体を超える収益を望めない。制作側にとっても、開発費を思い切って投入できないギャンブルになる。
だから、DLCを頑張って作るよりは、ブランドバリューを活かして新作を粗製乱造するほうが合理的になってしまう。実際そうなりつつあるだろう。そういう未来をゲーマーは望んでるのか?
基本無料というのは、有害な売り方さえしていなければ、各々が自分の経済力と理性をコントロールして、各々の感じる価値観に準じて対価を支払える、極めて柔軟でスマートな支払い方法だと思うんだが。
基本無料やガチャというシステムを採用したこれまでのゲームに、辟易してきた思いは俺だってよく分かる。
でも、だからって傑出したものまでいっしょくたにしてヒステリックな反応を示し、ガチャという属性だけで理解を拒んでしまうのは、思考停止なんじゃないか?
逆から読むと
konozama……このざまだよ?
そんな僕を変えてくれたのは、8年前に出会ったAliExpress。
グローバル水準の常識を教えてもらい、期待しすぎない、自力で解決する、そういうマインドを持てるようになったのさ。
さあ、君もAliExpressで中国のブランドに詳しくなろう。
海外通販初心者がやりがちな過ちとして、まず中国サイトで欧米の有名ブランドを漁ろうとする(偽物です、最悪捕まるぞ)。
同一商品でも他店より異様に安すぎるものを買おうとする(値付けミスや記述ミスの兆候があるものを漁る人間は、偽の追跡番号くらったりトラブル率が跳ね上がる)。
ショップの評価や実績をよく見て、扱う商材に統一感がないショップの利用を避けることでだいたいのトラブルは未然に避けられるんだ。
そして、この判別スキルは……残念ながら、AliExpress未満の治安のECサイトと成り果てた今のAmazonでこそ役立つスキルになっているワケだな。
AliExpressは運営が厳しいから、露骨な詐欺ショップはそれほど遭遇しないが、最近のAmazonはあきらかに詐欺の出店者が最安でトップ候補になっていたりする。
よーく見れば販売・発送元が妙な名前で「新規出店者」記述があるからすぐ分かるんだが、今までのAmazonへの信頼感から確認を怠る人が多すぎて、カモになるんだろうな。
https://blog.nicovideo.jp/niconews/205143.html?ref=premium_renewal_info#pc
手順5の完了でプレミアム会員から一般会員になるところ、取り返しのつかないボタンである。
手順6で即座に狙ったボタンを押すのに失敗した場合のリカバリ手順が書かれていない。上のボタンを押してしまったり、ブラウザが急にシャットダウンしたり、用事を言いつけられたりして離席したりといったことが起きたら何が起こってしまうのか?
何時間以内、何日以内、同月以内といった期限で再登録すれば問題ないよといったことは文面上まだ読んでいないFAQを丹念に読まないと判別がつかないのだった。
https://anond.hatelabo.jp/20231201170245
いろんな増田日記を解説しているのだが、ふと気になったことがあった。
ほかのブクマカも言及していたが、デリヘル増田についてだ。あれはどうなんだろうと。
増田利用者でも一部の人しか知らないだろうけど、社会経済的な時事に関する話をした後で、デリヘルに行った小噺をするのが基本的な流れだった。
後は、それと同じような文体で私小説とか、単発ネタみたいな記事を投稿したりする。
私はデリヘル増田が書いた(と思われる)日記を4つブックマークしている。ほかに見つけたやつもたくさんあるけど、記憶の中に残ると信じてブクマしてない。
最近、増田で見たやつを以下に紹介する。もちろんデリヘル増田が書いている保証はない。自分の感覚だよ。
上の方から新しい。
https://anond.hatelabo.jp/20231129204909
https://anond.hatelabo.jp/20231013202510
税務官僚だった頃の思い出
https://anond.hatelabo.jp/20230926201301
https://anond.hatelabo.jp/20230429104146
https://anond.hatelabo.jp/20230603091707
文体が似ているからある程度判別可能だ。シロクマ先生が言うには、こういうのは文章の「魂」が似るらしい。
昔は、もう少しちゃんとしたやつを書いてたはずだ。以下のやつは全部ブクマしてる。
https://anond.hatelabo.jp/20211231220514
https://anond.hatelabo.jp/20210716220542
https://anond.hatelabo.jp/20210323163551
冒頭の日記では、増田日記でバズるためには得意分野で勝負すべきとか、釣りはあまりよくないと書いてあった。自らの魂の叫びを発するべきだとも。
私もそう思う。特に最後のやつは。全く同意する。その意味だと、デリヘル増田が作った作品にはテーマを感じない。なんだかとっ散らかってる感じがする。
たまにめっちゃ面白いのもあるが、憎悪クリエイト作品が多いのが気になる。河川の床に沈んだ砂金のようなものを掘ってる感じといえば言い過ぎか。
こういう仕事は割とあるんだがなかなかのヤバさだったので紹介したい
ちなみにサービスの内容は非常に良くてユーザーも万単位で付いているらしい
バックエンドはAWS EC2で動作しているがログインアカウントは共通化されていてパスワードを全員で共有している
ユーザーを追加しようとしたら「そのような勝手な行為はセキュリティ上許可されていません」とのこと
本番環境とStagingはインスタンスが分かれているが運用は同じ方法
Staging上で5人ぐらいが作業しているが、ホームの下にそれぞれのユーザーが自分の名前でディレクトリを作って作業している
バックエンド側のシステムは詳細は伏せるが、某システムで動いている
仮にNode.js系だとすると、package.jsonがあってnpm run installでインストールするのだが、普通にインストールしようとするとエラーになる
内容は依存関係で失敗しているのだが、本番も同じソースで動作している
動作させるにはnode_modulesをまるっとコピーして、とのこと
さっきの自分の名前のディレクトリ配下にコピーしてきて、適当なポート番号でサーバを立ち上げれば一応は動く
このため、新しいモジュールを入れようとすると依存関係で失敗するため、便利なモジュールがあってもインストールできないし
セキュリティアップデートも当てることはできない(現にバージョンがすごく古い)
ソースコードはGitHub管理されているがセーブポイント感覚でcommitされているのでコミットログを見ても何が起きているのかさっぱり分からない
おまけにPRも使わずにmainにマージしまくっていてわけがわからない
加えてソースコードはコメントアウトの嵐でどこに何が書いてあるのかさっぱりわからない
データベースはPostgreSQLだが山ほどテーブルがあるのに外部キー依存は入っていないしVIEWも作られていない
まぁ、他にもテーブルを見ていくとアンチパターンのオンパレードで、EAV、ジェイウォークあたりは確認できたしHTMLやSQLが格納されているテーブルも見つけた
ソース上でクエリを作ってAPIを作っているが、ザッと見ただけでもインジェクションし放題の状態になっていた
フロントエンドも詳細は伏せるが、いわゆるReact的なものを利用している
こちらは npm run installでインストールできるし npm run devでちゃんと動く
ただ前述の通りバックエンドはローカルで構築できないのでEC2を利用するしかなく、CORS対応のためのプロキシを自前で用意する必要があった
バックエンド同様にGitHub管理されているが、管理しているだけ
バックエンドは5人ぐらいが利用しているが、ソースコードを編集するのは実質1人なのでコンフリクトはほとんど起こさないらしいが
フロントエンドは5人ぐらいが編集するのでコンフリクトしまくっている
解消するときにデグレすることが日常茶飯事でその都度Hotfixしている
コードもコメントアウトだらけなのに加えて、不必要なコードが大量にあるので可読性が著しく低い
(難しい処理を読み解いて追いかけていったら最終的に使われていない、などが大量にある)
2000行ぐらいあるコードとかChatGPTに突っ込んだら20行ぐらいになる予感がある
また、DBがご覧の状態なので取得されるデータも全然抽象化できておらず、コードが膨れ上がっている
例えばProductの一覧データをサーバから取得して、ユーザーがクリックしたProductをCartに投入するのだが、投入する情報はProductではなく、CartItemにする必要があるし
OrderするときはOrderItemにしてAPIを叩く必要がある
ほとんど同じ情報なのだが微妙に変わっていたりKey名が違っていたりするのでそれぞれ変換する
他にも数え上げればキリがないが、コピペして少しだけ改変している部分などが大量にあってバグがあるのかどうかすら判別できない
DBにHTMLやSQLが入っていると言ったが、調べて見るとDBから取得したHTMLをそのまま埋め込んで表示していたりした
SQLについてはフロントエンド側でSQL生成しており、そのテキストをAPIに送り込んでサーバ側で実行して貰った上で格納とかしていたので
「ここにDROP TABLEとか書けばTABLE消えるんですか?」
と聞くと
とか言われたのでことの重大さを伝えたが、まだ対処できていないようだった
認証等はOAuth2を使っていたので大丈夫そうだったが、本当に大丈夫かどうかは自信がもてない
システム内容はゴミのような状態だがサービス的には良いので、幹部やプロダクトオーナーからは追加要望が山盛り来ている
開発チームが「稼働が足りない」という理由で断ったので「じゃぁ支援して」ということで自分のところに来たのだが
「申し訳ないが、そもそもそういうレベルに無いし、全て作り直しが必要」
と伝えてもどうやら伝わっていない様子
ちなみに元々の開発チームは過去にもこんな感じでサービス作ってたらしいが売れないので問題になってなかった様子
ぱっと見は動いているように見えるのが厄介なところ
正直逃げたいところではある