はてなキーワード: ビッグデータとは
普通に考えれば「画像データ」ならなんでもかんでも学習するわけじゃなくて
特定の集団により多く閲覧された=高く評価された画像を積極的に学習していくことになる
なんてことはわかりそうなもんだと思うんだが
AIイラスト学習なんかどう考えても単体で動かすもんじゃなくて、
何からも影響を受けない人間なんていないから、結局人間もスケールの大きいAIとそんなに変わらないんじゃないの、その人の人生が元データみたいな
偉い人の思いつきでDX予算が着いたらしく、流行りのビッグデータによるデータサイエンスやAIを駆使した販売促進システムの開発プロジェクトに巻き込まれてて月曜の出社が苦痛すぎて辛い。
詳細はぼかすが、店舗でのポイントカードの購買履歴に基づいてAIがリアルタイムで自動的に販売動向をチェックし、効果的な販促(アプリからのプロモーションとか)ができるシステムを作ろうとしてるんだけど、仕様を決めてる偉い人のセンスが壊滅的で盛大に炎上している。
何がヤバいかっていうと、元々のポイントカードの購買データがAIによる処理に向いていないと言うところだ。ポイントカードには年齢、性別、職業とかのデータが紐づいているけど、そのデータが登録時から更新されることはまれである。なんで素のデータをそのままAIに渡して処理するのは危険だったりする。
例を上げると、全国的に30代独身女性がアンパンマンのおもちゃ付きのお菓子を好んで買うというデータがあったとして、それは実態を表していない可能性が高いと言うことがあったりする。
人間の目でデータを分析して見ると彼女たちがポイントカードを作ったのは20代の独身の時で、今アンパンマンのおもちゃ付きのお菓子を買っているのは結婚して子供ができてその子供にねだられて買っている(=商品が刺さる層は小さい子供で母親が買っている)という仮説を容易に立てられるわけだけど、機械はそうじゃない。
なんで、こういうデータを扱うときは人力で生データを加工して使えるデータに補正しないといけないわけだけど、補正の手間って思っている以上に大変なのだ。例えばアンパンマンならまだ判別ルールを組み込みやすいが、実際に30代独身女性が自分用に買っている可能性が考えられる、すみっこぐらしのおまけ付きお菓子とかならどうするかとか悩ましい問題があって、人手と現場のノウハウが要求される泥臭い要素が結構あったりする。
だけど、口の回るコンサルやSIerに乗せられた偉い人は完全に自動でできると思ってるし、システムが稼働したら運用コストはサーバー管理費用程度だろうくらいに考えているんで、理想と現場の現実との板挟みでマジで辛い。実際にシステム構築する側からすれば、常に人力でのデータ加工が必要な筋が悪いシステムで、そんなシステム作ってもまともに運用できないと思ってるんだけど、俺の考え間違ってるかな?
景気予測が「勘と経験」だと書いた某エコノミストに対して、一部のマクロ経済学者たちが瞬間沸騰してブチ切れてたけど、反論のレベルが低いと思うな。
たとえば以下のツイートから始まる景気予測のツールの説明だけど、この手法で今後2年間の景気を予測してみてほしい。多分使い物にならないよ。
景気予測を勘でやってた元先生への贈る言葉がなぜか伸びたので、大学に来て学べるちゃんとした景気予測を説明する。多分、大枠で2つある。
1) 時系列データ分析 => forecasting
2) マクロモデルのシミュレーション
(1/n)— ballman (@katsuymd) May 31, 2022
景気予測というのは、経営戦略や投資戦略の意思決定をサポートするための材料を提供することが重要なんだ。
だから、「このモデルだとこういう結果になります」では役に立たないし、意思決定において重要な要素は短期的な「ショック」であることが多いからモデルの解として描写されないことが多いんだよね。
エコノミストはマクロモデルを使った予測値やシミュレーションくらいは大抵作ってるよ。でも、それだけでは役に立たないことを理解してるから、いかに現実に近づけていくかで苦労しているんだ。
一般的に識別しやすいショック(円安、資源価格上昇、利上げ)だったらモデルで分析はできるけど、たとえば中国のロックダウンの影響をどう考えるかな?
産業連関表を使えば良い?うんうん、気持ちはわかるよ。でも産業連関表と時系列モデルやマクロモデルを統合するのは簡単じゃないし、国際的な産業連関表はたまーにしか更新されないね。
モデルが役に立たない理由は大体想像できると思うけど、統計モデル等を用いて行う予測は、過去の構造を前提として未来を予測することしかできないんだよね。
でも、経済は変化し続けるし、特にコロナ前後の変化は大きすぎるから、過去の関係性をもとに予測を作ると、足元の経済動向がそもそもうまく描写できない。
この状態で足元で起こっていることが構造変化なのか、景気循環なのかを識別しながら景気予測を作っていくのがエコノミストの仕事なんだね。
そのためには統計モデルの変数として採用しにくい細かい経済統計の中身やビッグデータ、質的な変数なんかも加味して予測を作る必要がある。
それを大雑把に言うと、「勘と経験」という言葉になっちゃった部分があるんじゃないかな。
もちろん、これをすべて統計的に織り込んだモデルが作れるならば理想的だよね。
政策当局を中心にこうした取り組みを進めているのは知ってるよ。でも実用的な景気予測をそれだけで行うことが出来るレベルには達してないよね。
もし出来るというのならば早く「論文」で発表してほしいな。参考にするよ。
不思議なことに、日本ではマクロ経済学者がいわゆる職業エコノミストを馬鹿にすることが今回の事例のように一般的に行われているのよね。
でも実際にはやってることが違うことが多いから、下手に口出しするべきじゃないと思うよ。
逆に、月次や四半期で出てくる経済統計について、マクロ経済学者がとんちんかんなコメントをしていることも少なくないよ。仕方ないと思うよ、普段見てないんだから。
だから、もともと論文を書くことを仕事にしていない職業エコノミストが論文を書かないことを馬鹿にするべきじゃないよ。
こんなことはある程度理解はされていて、「勘と経験」という言葉が癪に障ったので瞬間沸騰してツイートしたのだろうとは思うよ。
でも実際にモデルが織り込めない経済環境を予測に活かしていくためには、ある程度の経験が必要になる局面も多いのは分かってもらえるんじゃないかな。
あと、異様に「勘」が鋭いエコノミストもいるよね。トップエコノミストは他の人が見つけていない重要な要素を見つけ出すセンスがずば抜けてる。これは「勘」としか表現できないと思うな。
ま、そんなに考えずにドタ勘だけで予測してるエコノミストもいるのは事実だし、元記事の人がどういう作業をしていたかはわからないけどね。
はてな、広告単価の下落で売上減少 営業利益は前年比38%減の2億円 2020年7月期決算
https://otakuindustry.biz/archives/100802
「はてなブックマーク」や「はてなブログ」などのサービスを展開している。
上記の結果、売上高は5億2134万円(前期比10.3%減)となった。
BtoB向けストック型ビジネスとして、「はてなブログMedia」を活用したオウンドメディアの構築及び運用支援サービスや、「はてなブログ」などを活用したネイティブ広告、バナー広告、タイアップ広告を展開している。
上記の結果、売上高は8億939万円(前期比5.0%減)となった。
受託サービスとして、顧客独自のネットワークサービスに関する企画、開発、運用の受託と、ビッグデータサービスとして、BtoB向けストック型ビジネスであるサーバー監視サービス「Mackerel(マカレル)」を展開している。
当期のWebマンガサービスに特化したマンガビューワ「GigaViewer」が、「MAGCOMI(サービス提供者:株式会社マッグガーデン)」「webアクション(サービス提供者:株式会社双葉社)」の2サービスに搭載された。
さすがに20年は言い過ぎだけど
7年ぐらい前からDigitalizationっていうのをやたら言うようになってた。
その辺からDigital Transformationっていう単語が出てきてAIの次はこれだ!みたいになった。
流れとしては
「ビッグデータ解析したら新しい営業ができるぞ!(Amazonのレコメンドが契機かな?)」
→「ビッグデータの解析無理・・・AIってのが使えるらしいぞ!(画像系を中心)」
→「そもそもデータになってないことが多いな・・・業務を全部デジタル化や!」
っていう感じ。
欧米だとデジタル化の意味がよく分かってるから「そもそも20年前からずっとやってた」っていうのが正しい。
その上で「Digitalization出来てない部分をDigitalにしよう」っていう感じなんだけど
日本はそもそも嘘っぱちのデジタル化しかしてないから世界について行けてない。
それをデジタル化するときにちゃんとシステム構築したのが欧米。
「これがデジタル化や!紙がいらんで!」
ってやっただけ。
そのせいでDXってなっても
とかやっててアホかと思うね。