「データマイニング」を含む日記

2024-06-27

■機械学習 er vs Web開発er vs 組み込み開発er 比較表【令和最新版】

anond:20240626103929

業務で機械学首（データマイニング）、Web（業務システム）、組み込み（産業インフラ設備）の経験があるので、分野ごとの相違点と発生しがちな軋轢を書いておく。

-	機械学習	Web開発	組み込み開発	発生する軋轢
コードの寿命	半年間	20年間	40年間	組み込み開発er「産業系の組み込みは発売から40年後にアップデートするケースもあるので、ドキュメントは、開発担当者が全員退職して誰も残っていなくても理解できるように書いてください！」
コードのアップデート頻度	試行錯誤しつつ随時	2週間に1回	半年～5年に1回	Web開発er「組み込みはどうしてそんなに時間がかかるの？アジャイルを導入してください。ウォーターフォールは硬直的でデメリットばかりですよ」
アップデートの提供方法	-（コードは少人数の同僚だけで使用）	サーバに自動デプロイ	技術者が現地訪問してアップデート	組み込み開発er「アジャイルだから最初は若干のバグを残して発売し後日アップデートするって？グローバルで既にXXX台受注しているけど、誰が現地に行くの？費用を負担する部署はどこ？」
開発者の属性	数理系の修士～博士、少数精鋭	専門学校～修士、文理混在、大人数	電気系、機械系、情報系の修士～博士	機械学習er「数式で表現できない知識は民芸品です。エンジニアを名乗っちゃダメでしょ」
関係部署	マーケティング・企画	顧客	ハード開発・工場	組み込み開発er「納期3カ月前なのにソフトが完成していないの？生産立ち上げを工場に相談していない！？スケジュールをゴールから逆算できなかったの？？今回は船便での輸送になるけど、それも計算に入れてあるよね？」
計算資源	潤沢	予算次第	貧弱	組み込み開発er「データマイニングやってたKさんがOSSを使うらしいけど、サイズが5MBあるんだぜ。5MB全部必要なのか聞いたら一部機能しか使わないんだって。で、他チームとの容量調整は丸投げされたの。感覚を破壊されるよな。」
3rd パーティライブラリ	OSS	OSS	買ってくる	組み込み開発er「OSSに不具合があったらどうやって修正して顧客にデリバーするつもりなんだろう？リスク移転の考えで、不具合の補償契約込みで買えばいいのに」
通信プロトコル・データフォーマット	生データが王様なので、生データに従う	最新のものを取り込む	実績重視	Web開発er「HTTPの実装がないの？TCPを直接使う！？暗号化や認証はS社の独自プロトコル？古いプロトコルを使い続けているから開発効率が低いんだよ」
電源OFFタイミング	任意にコントロール可能	定期メンテナンス	コントロール不可	組み込み開発er「ファームウェアアップデート中に電源OFFしたらどうなるの？ファイル書き込み中の電源OFFは？状態遷移図って知ってる？」
性能	出来高	顧客要件、常識、予算に従う	ミリ秒～マイクロ秒単位のタイムスライスで管理	Web開発er「性能改善でXX関数の10 ミリ秒を1ミリ秒以下に短縮するために2週間も試行錯誤したって？プロパ社員の人件費は7万円/日だから70万円を消費したね？AWSでEC2の性能を調整すれば2000円/月で解決だよ。損益分岐点は350カ月だけど顧客のこれまでのリプレース実績から判断してこのシステムはそこまで長期間使われない」
学会発表・特許	結構ある	ほぼなし	年1件の特許出願ノルマ	組み込み開発er「学会発表も特許出願もなく、何を開発したの？ドメイン知識をソフトウェアに翻訳してAWSでポチポチやっただけなの？開発行為ではなく作業だね」

分野ごとに要求される製品特性が異なるから、異分野に移ると文化摩擦が起きるという話だと思う。製品特性の違いを理解し自らの行動に反映できるようになるには、ベテランでも数年かかるケースがある。開発期間10年のテーマを経験したことがあるが、そうした場合だとワンサイクルを経験するのに10年かかるので。経験から学ぶのが愚者、歴史から学ぶのが賢者ともいうが…。

Permalink | 記事への反応(2) | 11:21

2024-01-26

■

https://t.co/EBcPvZU7I1
ん？読売のオンラインの規約変更が凄いな。最近の新聞協会のトーン的に生成AIへの学習禁止は心情は察するが、データマイニング、クローリング、スクレイピングあたりも営利性とか関係なく全面禁止。ようするに検索やSNSも含めてネットから消えますという宣言かな？ pic.twitter.com/sePkMDRRbW— Shuji Sado (佐渡秀治) コロナで背骨を骨折ニキ (@shujisado) January 25, 2024

確かに、これじゃ検索結果から消えることになりそうだが

Yahooとかとは個別にライセンス契約するってことなんだろうか

Permalink | 記事への反応(0) | 15:55

2023-03-21

■anond:20230321132049

その二つはAIによって失われる仕事です。

「人間関係の濃さで案件を取ってくる営業」はAIが発達した社会では成立しません。

何故なら「人間関係の濃さで取ってこられた案件」というのは「AIが適切に双方の利益を換算して取ってきた案件」よりも様々な面でパフォーマンスに劣るからです。

営業という仕事は需要と供給のマッチングであり、この作業において必要なのはデータマイニングの技術です。

その分野において人間はAIに圧倒的に劣っているので、あらゆる営業活動はAIに取って代わられます。

「書類に判子を押す部長」もAIが発達した社会では消滅する存在です。

日本人は責任というものを「失敗時に損害を補填する行為」だと考えがちですが、責任というのは本来会社から預けられた「業務上の責任能力」のことです。

「業務上の責任能力」とは、業務を行える能力なしには成立しません。

書類に判子を押すという行為に対して責任を負う場合は、「案件を進めていいかどうかの総合的な可否判断」の能力が問われます。

現在の会社組織ではその会社で長年過ごしてきた人間の経験則を当てにする事が多いので、ある種年功序列式に年長者であるものが判子を押す立場を与えられています。

ですがその経験則よりもAIによる分析能力が向上すれば、判子を押す行為、すなわち「可否決定の判断」をする権限はAIに預けられるでしょう。

組織の命令系統としての部長は残るかも知れませんが、それぞれのセクターにおける可否決定の判断を下すのはAIに委託されるようになると思われます。

よって「書類に判子を押す部長」という存在はAIが発達した社会には存在しません。

AIによって失われない仕事には以下のような特徴があります。

「生身の人間の肉体が必要」

「一個人としての権限が必要」

「生身の人間であることが必要」

「AIでないことが必要」

これらの条件に一つないしは複数当てはまる職業として以下のものがあります。

・婚姻当事者（専業主婦・偽装結婚の当事者・その他結婚を通して何らかの利益を得るための婚姻当事者）

・臓器提供者（ただし、再生医療技術が発達するまで）

・性風俗

・法的な身分の売買や利用（詐欺行為を働く際のID貸し借りや新規作成にかかわる行為など）

・自然回帰主義者としての活動

・AI 否定派を顧客とした商売（実際にはAIを使用しているのに顧客に嘘をつく場合の窓口業務も含む）

これらの職業はAIが発達した後も「法律上の権限がAIに与えられていない」「個人的な趣味嗜好によりAIでないものを求める」といった観点から労働提供者の需要が失われることがありません。

AIの発達を予測し備えておきたいのならこういった職業についての経験を積むのは有効かと思いますが。

ですがAIの発達速度から考えるにこれら以外の職業が完全に消滅するのには、今現在出生を終えた人類がその寿命を使い切るまでの時間がかかると思われます。

ただしこの予想は人類の医学が急速発展する場合を考えておりません。

そうなりますと、AI発達後も失われないこれらの職業に就くための準備を今からするのは有効だと思います。

個人的に私がオススメするのは「性風俗」と「自然回帰主義者としての活動」となります。

「性風俗」の場合は、枯れ専と呼ばれる人達の需要を満たす方法について今から学習を進めるのがオススメです。

「自然回帰主義者としての活動」の場合、機械文明否定派の新興宗教を立ち上げるのがオススメです。

参考になりましたでしょうか？

Permalink | 記事への反応(2) | 17:02

2022-12-19

■anond:20221219230325

地方の小学校のちゃらんぽらんな子でも小5までには検索エンジン、データマイニング、リレーショナルデータベースに関する論文とか雑誌は読破してるし、Oracleか Microsoftか Googleで夏休みに有給インターンは当たり前。それができてないとネグレクト疑われるな。それが最近の小学校。

Permalink | 記事への反応(0) | 23:06

2022-12-15

■anond:20221215123558

失敗の科学の好例である所の「生還した戦闘機の前翼と胴体に銃痕があったので、その部分に強化を施そうとした所、軍のデータマイニングおじさんに止められた」を思い出した。

伸びるんじゃないんだよね。

「縮む」んだよね。

確かに「伸ばす」って視点でチンポを科学して、中に骨入れてチンポソードでチンポスラッシュして戦うようになった動物もいるけど、人間の場合は「縮む」が正しいと思うよ。

金玉だって「広がる」じゃなくて「縮まる」がメインの機能だしね。

Permalink | 記事への反応(0) | 17:43

2022-12-01

■コンピューターサイエンスって何だよ？

最近コンピューターサイエンスがプログラマーに必要か否かみたいな話が上がっているが、そもそもコンピューターサイエンスって何だよ。どこまでの範囲をさしてんの？

って思ってググってみたらちゃんと定義されてた。

ググって出てきた情報を整理しただけなので詳しい人、補足・訂正よろしく！

情報源

CS2013

https://www.acm.org/binaries/content/assets/education/cs2013_web_final.pdf

CS2013はACM/IEEE-CSによるカリキュラム標準。

ACM(計算機協会)はコンピュータ分野全般の国際学会、IEEE-CSはIEEE(米国電気電子学会)の中にあるテクニカルソサエティ。

J07-CS

https://www.ipsj.or.jp/12kyoiku/J07/20090407/J07_Report-200902/4/J07-CS_report-20090120.pdf

J07-CSは一般社団法人情報処理学会がCC2001CSをベースにアレンジを加えたカリキュラム標準。今はCS2013を反映したJ17-CSがあるらしいけどその辺は良く分からん。

IPAの共通キャリアスキルフレームワークとの対応表もあり。

https://www.ipa.go.jp/files/000024060.pdf

知識体系

J07ーCS から抜粋。CS2013と比較するとナレッジエリアがあったり無かったり。

KA	ナレッジエリア	KU	ナレッジユニット	コアユニット	最低履修時間
DS	離散構造	DS1	関数, 関係, 集合	✔	6
DS	離散構造	DS2	論理	✔	6
DS	離散構造	DS3	グラフ	✔	4
DS	離散構造	DS4	証明技法	✔	8
DS	離散構造	DS5	数え上げと離散確率の基礎	✔	7
DS	離散構造	DS6	オートマトンと正規表現	✔	6
DS	離散構造	DS7	計算論概論	✔	4
DS	離散構造	DS8	計算論
PF	プログラミングの基礎	PF1	プログラミングの基本的構成要素	✔	9
PF	プログラミングの基礎	PF2	アルゴリズムと問題解決	✔	6
PF	プログラミングの基礎	PF3	基本データ構造	✔	14
PF	プログラミングの基礎	PF4	再起	✔	5
PF	プログラミングの基礎	PF5	イベント駆動プログラミング	✔	4
AL	アルゴリズムの基礎	AL1	アルゴリズムの解析の基礎	✔	4
AL	アルゴリズムの基礎	AL2	アルゴリズム設計手法	✔	8
AL	アルゴリズムの基礎	AL3	基本アルゴリズム	✔	8
AL	アルゴリズムの基礎	AL4	アルゴリズムの高度な解析
AL	アルゴリズムの基礎	AL5	高度なアルゴリズムの設計
AL	アルゴリズムの基礎	AL6	計算量クラスPとNP
AL	アルゴリズムの基礎	AL7	暗号アルゴリズム
AL	アルゴリズムの基礎	AL8	幾何アルゴリズム
AL	アルゴリズムの基礎	AL9	データ分析アルゴリズム
AL	アルゴリズムの基礎	AL10	並列・分散アルゴリズム
AR	アーキテクチャと構成	AR1	論理回路と論理システム	✔	6
AR	アーキテクチャと構成	AR2	データのマシンレベルでの表現	✔	2
AR	アーキテクチャと構成	AR3	アセンブリレベルのマシン構成	✔	7
AR	アーキテクチャと構成	AR4	メモリシステムの構成とアーキテクチャ	✔	5
AR	アーキテクチャと構成	AR5	インタフェースと通信	✔	3
AR	アーキテクチャと構成	AR6	機能的構成	✔	7
AR	アーキテクチャと構成	AR7	並列処理と様々なアーキテクチャ	✔	2
AR	アーキテクチャと構成	AR8	性能の向上
AR	アーキテクチャと構成	AR9	ネットワークと分散システムのためのアーキテクチャ
OS	オペレーティングシステム	OS1	オペレーティングシステムの概要	✔	1
OS	オペレーティングシステム	OS2	利用者から見たオペレーティングシステム	✔	1
OS	オペレーティングシステム	OS3	オペレーティングシステムの原理	✔	1
OS	オペレーティングシステム	OS4	プロセスの構造とスケジューリング	✔	3
OS	オペレーティングシステム	OS5	並行性	✔	4
OS	オペレーティングシステム	OS6	メモリ管理	✔	4
OS	オペレーティングシステム	OS7	入出力デバイス管理と入出力
OS	オペレーティングシステム	OS8	ファイルシステム	✔	2
OS	オペレーティングシステム	OS9	認証とアクセス制御	✔	1
OS	オペレーティングシステム	OS10	セキュリティと高信頼化
OS	オペレーティングシステム	OS11	リアルタイムシステムと組込みシステム
OS	オペレーティングシステム	OS12	並列分散処理のためのオペレーティングシステムの機能
OS	オペレーティングシステム	OS13	オペレーティングシステム構成法
OS	オペレーティングシステム	OS14	システム性能評価
NC	ネットワークコンピューティング	NC1	ネットワークコンピューティング入門	✔	2
NC	ネットワークコンピューティング	NC2	通信とネットワーク接続	✔	7
NC	ネットワークコンピューティング	NC3	ネットワークセキュリティ	✔	2
NC	ネットワークコンピューティング	NC4	クライアントサーバコンピューティングの例としてのウェブ	✔	3
NC	ネットワークコンピューティング	NC5	分散アプリケーションの構築
NC	ネットワークコンピューティング	NC6	ネットワーク管理
NC	ネットワークコンピューティング	NC7	ワイヤレスおよびモバイルコンピューティング
NC	ネットワークコンピューティング	NC8	マルチメディア情報の配信システム
PL	プログラミング言語	PL1	プログラミング言語の概要	✔	2
PL	プログラミング言語	PL2	仮想計算機	✔	1
PL	プログラミング言語	PL3	言語翻訳入門	✔	2
PL	プログラミング言語	PL4	宣言と型	✔	3
PL	プログラミング言語	PL5	抽象化メカニズム	✔	3
PL	プログラミング言語	PL6	オブジェクト指向言語	✔	6
PL	プログラミング言語	PL7	関数型言語
PL	プログラミング言語	PL8	論理型言語
PL	プログラミング言語	PL9	スクリプト言語
PL	プログラミング言語	PL10	言語翻訳システム
PL	プログラミング言語	PL11	型システム
PL	プログラミング言語	PL12	ブログラミング言語の意味論
PL	プログラミング言語	PL13	プログラミング言語の設計
HC	ヒューマンコンピュータインタラクション	HC1	ヒューマンコンピュータインタラクションの基礎	✔	6
HC	ヒューマンコンピュータインタラクション	HC2	簡単なグラフィカルユーザインタフェースの構築	✔	2
HC	ヒューマンコンピュータインタラクション	HC3	人間中心のソフトウェア評価
HC	ヒューマンコンピュータインタラクション	HC4	人間中心のソフトウェア開発
HC	ヒューマンコンピュータインタラクション	HC5	グラフィカルユーザインタフェースの設計
HC	ヒューマンコンピュータインタラクション	HC6	グラフィカルユーザインタフェースのプログラミング
HC	ヒューマンコンピュータインタラクション	HC7	マルチメディアシステムのHCI 的側面
HC	ヒューマンコンピュータインタラクション	HC8	協同作業とコミュニケーションのHCL的側面
MR	マルチメディア表現	MRI	情報のディジタル表現	✔	2
MR	マルチメディア表現	MR2	文字コード	✔	1
MR	マルチメディア表現	MR3	標本化。量子化、圧縮の原理とアルゴリズム
MR	マルチメディア表現	MR4	マルチメディア機器
MR	マルチメディア表現	MR5	オーサリング
GV	グラフィックスとビジュアル・コンピューティング	GV1	グラフィックスにおける基礎技術	✔	2
GV	グラフィックスとビジュアル・コンピューティング	GV2	グラフィック・システム	✔	1
GV	グラフィックスとビジュアル・コンピューティング	GV3	2次元画像の生成と加工
GV	グラフィックスとビジュアル・コンピューティング	GV4	モデリング
GV	グラフィックスとビジュアル・コンピューティング	GV5	レンダリング
GV	グラフィックスとビジュアル・コンピューティング	GV6	コンピュータ・アニメーション
GV	グラフィックスとビジュアル・コンピューティング	GV7	視覚化
GV	グラフィックスとビジュアル・コンピューティング	GV8	仮想現実(VR)
GV	グラフィックスとビジュアル・コンピューティング	GV9	コンピュータ・ビジョン
IS	インテリジェントシステム	IS1	インテリジェントシステムの基本的問題	✔	3
IS	インテリジェントシステム	IS2	探索および制約充足	✔	2
IS	インテリジェントシステム	IS3	知識表現および推論
IS	インテリジェントシステム	IS4	高度な探索
IS	インテリジェントシステム	IS5	高度な知識表現と推論
IS	インテリジェントシステム	IS6	エージェント
IS	インテリジェントシステム	IS7	自然言語処理
IS	インテリジェントシステム	IS8	機械学習とニューラルネット
IS	インテリジェントシステム	IS9	プランニングシステム
IS	インテリジェントシステム	IS10	ロボット工学
IM	情報管理	IMI	情報モデルとシステム	✔	2
IM	情報管理	IM2	データベースシステム	✔	2
IM	情報管理	IM3	データモデリング	✔	4
IM	情報管理	IM4	関係データベース	✔	3
IM	情報管理	IM5	データベース問合わせ	✔	3
IM	情報管理	IM6	関係データベース設計とデータ操作
IM	情報管理	IM7	トランザクション処理
IM	情報管理	IM8	分散データベース
IM	情報管理	IM9	データベースの物理設計
IM	情報管理	IM10	データマイニング
IM	情報管理	IM11	情報格納と情報検索
IM	情報管理	IM12	ハイパーテキストとハイパーメディア
IM	情報管理	IM13	マルチメディアデータベース
SP	社会的視点と情報倫理	SP1	コンピ Permalink \| 記事への反応(1) \| 19:20 ツイートシェア

2022-08-05

■[あとで読む]2022年 7月 はてブのあとで読む トップ30リスト

はてブのホットエントリ(総合)で月内に数多く[あとで読む]タグを集めたエントリ

406あとで/1267users 今どきのLinux 事情 | tokida | SpeakerDeck

322あとで/2603users 世の中には困ってる人を助ける制度がたくさんあるのに何が使えるかを教えてくれないっていう理不尽仕様なんだが、そんな世界をなんとかしようとしてる人たちがいて、そのためのWebページがこの前リリースされたってことを僕はフォロワーさんに知っておいて欲しいと思ったんよ | Togetter

317あとで/2362users 【保存版】リクルートやサイボウズといった大企業が新人研修用の資料を公開。→「学び直そう」「非エンジニアの方にも」 | Togetter

183あとで/975users ゼロトラスト移行のすゝめ：IPA 独立行政法人情報処理推進機構

170あとで/1167users 「チ。―地球の運動について―」感想。〜歪で不誠実で不愉快なこの傑作漫画について〜 - 銀河孤児亭

169あとで/1566users 大阪と京都で「ここ行っとけ、これ食っとけ」があったら教えて→で、続々と集まった情報がこちら | Togetter

160あとで/1265users 東京の水はどうやって飲めるようになってるのか？｜miyasaka｜note

157あとで/942users 青空怪談　〜青空文庫の怖い話50選〜｜みもねる｜note

156あとで/849users 今年もミクシィの22新卒技術研修の資料と動画を公開します！ | mixi developers

148あとで/827users 個人開発で即戦力になるツール・サイトまとめ - Qiita

147あとで/1283users 元Google データ科学者「人生をうまくやるコツってめちゃシンプルだよねー」 | パレオな男

144あとで/890users サブスクリプション型のビジネスなら見ておくべき5つの超重要チャート - Qiita

142あとで/1250users 「もはや昭和ではない」男女共同参画白書（令和4年版）が面白いからみんな読んでみて！今は子無し世帯がマジョリティ - 斗比主閲子の姑日記

137あとで/1036users 【保存版】交通事故に遭ったときにまずやること・避けてほしい行動マニュアル - 弁護士法人 AOがお届けする法律メディア｜Legal Forest

133あとで/838users 有名企業のエンジニア向け研修資料まとめ - Qiita

131あとで/1080users エクセルで複数のシートを集計する場合、シートを何枚追加しても数式修正が不要！大企業の経理が感動した神テクとは｜ウォーカープラス

130あとで/728users 【絶対に観るべき】英語のYoutube チャンネル集【プログラミング】 - Qiita

126あとで/853users 障害報告書を書こう！ - Qiita

126あとで/1331users これから家が燃える人向けnote～出火編～｜たぬき｜note

125あとで/712users 期限の制約なく無料で使えるクラウド「Free Tier」主要サービスまとめ。2022年版 | Publickey

117あとで/973users かに💸 on Twitter: "答えいいます。ぼくが創業するなら、①日本政策金融公庫の『創業の手引』見ながら創業計画立てて、②中企庁の『J-Net21』で補助金みつけて、③よろず支援拠点で創業補助金の申請手伝ってもらう。ちなみにここまで全部タダ。④創業後は"商工… https://t.co/LXadEmaqdx"

116あとで/1443users 俺も同じような立場になったことあるけど、解決策は一つしかない。転職だ.. | anond.hatelabo .jp

116あとで/1210users 統一教会と自民党のお付き合いについて補足するよ（ちょっとだけ追記） | anond.hatelabo .jp

109あとで/1113users 統一教会と安倍晋三・自民党 | anond.hatelabo .jp

107あとで/637users ゲーム感覚でプログラミング学べるサービス集 - Qiita

107あとで/872users 「なんで私をもっと評価してくれないの！？」という人向けに、私がやってる評価ハッキング手法を伝授します - 斗比主閲子の姑日記

106あとで/493users AWS 認定の無料模擬試験がさらに便利になりました！ | DevelopersIO

106あとで/758users 2022年のモダン CSS改 | tonkotsuboy_com | SpeakerDeck

105あとで/633users プロダクトマネジメントを学ぶための推しの書籍 | mizuman | SpeakerDeck

103あとで/598users データマイニング入門 | 森純一郎 | Utokyo Open Course Ware

103あとで/1054users 記者座談会　統一教会と自民の関係にメスを　反共右派として育てた為政者の罪 | 長周新聞

Qiita、noteはあるけれどZennが無かった。

増田からは旧統一教会情報のまとめが入った。

Permalink | 記事への反応(0) | 00:22

2022-05-18

■anond:20220518141412

今のところ日本ではWeb 需要はない

99%データマイニングの需要

海外は知らん

Permalink | 記事への反応(0) | 14:16

2022-01-23

■OA化→IT化→電子化→ビッグデータ...

業務にコンピューターを導入して自動化、効率化しよう、って1970年代から、OA化、IT化、電子化とずーーーっと言ってきたよね。

業務にデータを活用して意思決定を高度化しよう、って1980年代から人工知能→データマイニング→人工知能→ビッグデータ→データサイエンス→AIとずーーーっと言ってきたよね。(細かい「エキスパートシステム」とか「AIの冬」とかは省略)

そして今、また新しい流行り言葉としてDXに飛びついているよね。

その時間の大半をビジネスパーソン (笑) として過ごして、そろそろ定年になる人たちがいなくなる途端に、「DX人材が不足！」「2025年の崖！」とかいう話になるのは変だよね。これまで40年以上、自分たちでOA化だのなんだの言ってきたんだから、それを実現していれば、今さら「DXが急務」とか人材不足とかならないはずじゃん。

DXについてご立派に語る識者や経営者は、「なぜ自分たちはOA化に失敗したのか」「なぜ自分たちはIT化できなかったのか」をまず振り返って欲しいよね。そのうえで、「自分たちは無能だったから実現できなかったけど、次の世代の人たちは優秀だからDXを実現できる」とか言うならまだわかるけど。

Permalink | 記事への反応(0) | 13:06

2021-11-02

■anond:20211101150842

大学院卒の若者がメーカーに就職して工場研修に行くとこうなるわけだ。

「なんやお勉強ばっかしとった生っ白いのが来よったけど、統計学だのデータマイニングだのエーアイだの賢そうなこと言っても、旋盤も使えん坊っちゃんはここじゃ何もできんぞ」

これ。世の中の大多数を占める普通の人々（ただし生活や家族を優先して変化することを止めると決断した中年以降）は

インテリが嫌い
小難しい言葉や横文字を使ってくる奴は俺らを馬鹿にしてる感じがして嫌い
良い大学出てるような奴は近寄りがたいし見下されてる感じがするから嫌い
俺らの生活の言葉で喋らん奴は俺らのことなんてどうでもいいと考えてるに違いないから嫌い
高そうな服（スーツ）来てキラついた腕時計とかしちゃってる奴はいけ好かない都会のエリートだから嫌い
いっつもシャツにアイロンが掛かってて髪がしっかりセットされてるような奴は信用ならんのじゃ
etc（何がetcじゃボケ。日本語喋らんかコラ）

大阪は特にそういう文化的傾向が強いよね。信州とか東北とかも似たようなもんだと思うけど、人口で差があるから目立たないのだろう。

Permalink | 記事への反応(1) | 19:01

2020-11-18

■サクナヒメ、スパイ ファミリー、AKB、今年の流行語、理由のわからないブームの理由を考えるのは無駄 である

そもそも論として「ブームですよ＋興味ある話題＋周りで話が出来る人がいる」の３つが揃えばそれでもう満貫（麻雀の点数。勝負手として十分と考えていいライン）。

メンタンピンドラドラ（麻雀の役。メンは門前、タンはタンヤオ、ピンは平和（ピンフ）、どれも頻出の役かつ同時に成立することが多い。ドラはおまけポイント。）みたいなもんね。

つうかブームさえでかけりゃそれだけでもう勝手に回りが盛り上げてくれるし、話ができる人も増える。

麻雀で言えばドラが３つあるからなんでもいいからリーチかければワンチャン跳ねる（跳満を意味しており、満貫の一個上の状態。勝利にぐっと近づくので無理して推してもいいライン）状態。

だから企業ってのは平気でステマとかするんだけど、アナ雪みたいなよっぽどのバカじゃない限りはステマってブームに火が点いたらもう分からんのよね。

大火事になったあとでは最初の火元なんて素人目には分からなくなるのと一緒。

タイトルに挙げたもののうちどれがステマでどれがダイマでどれが奇跡的なブームなのかはもう誰にも分からない。

でもとりあえずはやってさえいれば、その時点でもうある程度勝ってしまう、買ってしまう。

つまり、理由を考えるだけ無駄。

ブームの理由を考えるってのは、私はクソほど暇ですその暇を趣味や自己研鑽に使う気もなく人にくだらん話をして承認欲求を満たせないかちょっとした執筆料でも乞食できないかばかり考えているゴミクズと宣言しているようなもの。

だから、無視していい。

つまんねーテンプレ反論が来る前に一つだけ釘を差しておくと、大量のブーム情報を集めてデータマイニングを行う行為が意味を成すことはあるよ。ただし、どういうデータを集めるかも加工するかもそれなりの工夫がいるけどね。

Permalink | 記事への反応(0) | 18:25

2020-05-25

■anond:20200525021541

quora

受動的じゃなくて能動的に情報取りに行くなら

マスメディア汚染されてない本当のトレンドを知りたい→google trends

リアルタイム検索したい→twitter 検索

もし増田がプログラマなら教えてgooとか普通のサイトをクロールしてデータマイニングするのおすすめ

爆サイで乱交パーティーが盛んなのは北海道と富山でカーセックスなら茨城と岡山とか

流行りもの無視するならwikipedia読むのが本当はいちばん面白い

例えば東欧の旧共産圏の国家は経済が比較的好調だとか

チェコが共産圏だった時に密告合戦でキリスト教徒が無神論者になっていったって話とか

https://ja.wikipedia.org/wiki/%E3%83%81%E3%82%A7%E3%82%B3#%E5%85%B1%E7%94%A3%E4%B8%BB%E7%BE%A9%E6%94%BF%E6%A8%A9%E3%81%A8%E3%81%9D%E3%81%AE%E5%B4%A9%E5%A3%8A%E5%BE%8C

Permalink | 記事への反応(0) | 23:34

2019-11-10

■指導 教員が信用できないので研究やめたい

大学院の指導教員のゼミ指導があんまりにもずさんで，ほとほと困っている．

一応理系の専攻なんだけど実験は誰もしてなくて，

代わりに各指導教員はなんかしら専門知識を身に着けている（ということになっている）．

で，うちの教員の場合それが「アンケート設計」と「統計処理」なんだけど，

アンケートの設計も統計処理もその解釈も，まー適当なんだよね．

質問項目は恣意的な内容ばっかりで，

「地球では1901-2010年の約100年の間に19cm海面が上昇しました．これは地球温暖化が原因です．これを踏まえてあなたは，レジ袋を貰わずにマイバッグで買い物しようと思いますか？」

「タバコの副流煙には、主流煙よりもずっと多くの有害物質が含まれています．これを踏まえて，あなたは分煙に協力しようと思いますか？」

みたいな聞き方を平気でする．

アンケート結果に対する統計処理も杜撰で，

重回帰分析ひとつ取っても標準化係数とその有意確率しか見ない．

決定係数がどんなに低くても気にも留めない．

決定係数が負の分析結果を掲載した論文が査読通っちゃったところなんかも見た．

分散分析なんかも頻繁にやるのにゼミ中"交互作用"って言葉を一度も聞いたことがない．

「ニューラルネットワークは分析の仕組みがブラックボックスだから信用できないんですよね」だって？いやいやあんたt検定の仕組みも説明できないんじゃないんですか？

「アンケートの打ち込み終わったなら，○○分析と××分析と△△分析，全部1日で終わりますね」？そりゃ多重共線性のケアとか決定係数とか気にしないあんたの適当な回帰分析なら1日で終わるでしょうけど？

そんな適当な分析で相関を作り出して，

自分たちに都合の良い解釈をして

「良い結果出ましたね！」とか抜かしたりする始末．

その教員とはB4 からの付き合いで，最初は指導内容に違和感なかったんだけど

他所の研究室の話とか，真面目にデータマイニングやってる先生の話とか聞いて，

最近になって自分のところの研究をちっとも信用できなくなってしまった．

こんな教員でも「結果」さえ残してしまえば出世できてしまうのが研究職というものらしく，

去年，准教授から教授に昇進している．今まさにノっている教授，というわけである．こちらとしては非常に面白くない．

あの人が学術的にやっていることといえば，ゼミで学生が「作り出した」相関を世に公表していることくらいなのに．

そんなこんなでこの人の下で研究なんてまっぴらごめんなんだけど，

もうM1の11月なんだよなあ．

大学院最初からやり直すのも，こんな理由で1年分納めた学費がおじゃんになるのは嫌だし，

かといって思い切って退学してしまうのも将来性がなさすぎる．

Permalink | 記事への反応(3) | 21:21

2019-09-04

■仕事の失敗って大部分が時間不足によるものだよな

職場でヒヤリ・ハットのデータマイニングみたいなのやっとるんやがな、仕事のミスの要因がほぼほぼ時間不足なんやわ。

時間があればやれた作業を削った結果、ミスが起こって死ぬ。

このパターンばかりだな。

つまりな、ミスが起こった時に考えるべきは「これぐらいのミスなら今まで通り工数を削ったままで行くかどうか」の判断なんや。

リカバリーはまあしないといかんけど、経営サイドが一番じっくり考えるべき所はそこなんよな。

っていう報告を上げたらボッコボコにされたわ。

アホか。

データは嘘つかんのにな

Permalink | 記事への反応(1) | 20:35

2018-06-30

■anond:20180630224542

だから、そのデータマイニングで、嫌な広告をつけるようなのが当たり前になってきたから、俺は使わん。

なお、adblockは当然、エロ系はそれ自体必ず別のブラウザをつかるようにしてるし、トラッキングもカットするのを入れた。

ターゲッティング広告って、あれはこいつに売り込みたいってやつにダイレクトに広告出しに来るってことは、

陰謀論や、ゴリ押しで物を売りたいってやつに悪用されるのは当然だよなと思ってる。

すでにスマートスピーカーで検索もしてないが、家庭内で話してた内容のものの特定の者の広告が出るのが気味が悪いといいうニュースはみかける。

ああいう噂が立っている以上気味悪がって広がらないんじゃないかと思う。

検索ならまだ能動的だから注意できるが、家庭内で無意識に話したことでも弱み狙われるわけだから。

そもそも、そのデータマイニングによるターゲッティング広告ってそのうち霊感商法や詐欺師に狙われるようになると思う。

悩み事を持ってそうなやつに霊感商法の広告をいっぱい出すようにしてね。

Permalink | 記事への反応(1) | 22:51

■anond:20180630223521

増田の位置情報を絶えずインターネットにばらまくスマホを所持しながら何言ってるんだ？

情報が抜かれるかどうかは些事なんだよ。その抜かれた情報をどういう価値ある情報にするかが「データマイニング」として仕事になるくらいには

世に情報は溢れてる。

増田がどこに住んでいて今何を考えて今どんなAVを見てシコってるかなんていう情報は、もしインターネット中にばらまかれていたとしてもノイズでゴミにしか過ぎない。

なぜなら増田はゴミだから。

しかし、ゴミである増田でもインターネットからXvideoの情報を引っ張ってくることには価値があると感じているわけだろう？

情報価値の非対称化なわけだな。

その情報価値非対称な環境だからこそ増田やゴミな人々たちがそういうスマートデバイスを使えるってことなのだよ。

Permalink | 記事への反応(2) | 22:45

2018-06-23

■id:Dursan やばすぎない？

http://b.hatena.ne.jp/entry/366247316/comment/Dursan

「無能な人が優秀な人を排除する論理に使われないよう祈る」　どうも自分を有能だと思ってる無能が多いようで。ちゃんと本文読んでこの答えは出ないだろ？

まさにこういう「自分を有能だと思ってる無能」みたいな、言葉で人を刺して平気でいられる人こそが、元記事の「まわりをつついて殺す」タイプなんだと認識した。

自覚してないって怖いし、こういうタイプには関わりたくないよなー。

id:Dursan 杉山征直氏(すべて御本人がWeb上に開示している情報です)

https://twitter.com/Dursan

https://www.wantedly.com/users/18298847

https://jp.linkedin.com/in/%E5%BE%81%E7%9B%B4-%E6%9D%89%E5%B1%B1-a9232b35

http://dursan.biz/

だーさんです。東京練馬、江古田在住のおさーんです。アイコンは鳥だけど容姿はメガネクマ。いろいろオープンな方たちとの雑談やネットプロモーションのお話なんか結構してます。特撮、SF、お笑い、グルメも大好物です。お気軽に突っ込んでください。 ※URLをPeing（質問箱）に変更しますた

杉山征直
Web Director －求職中
日本東京都 23 区内インターネット
現職
求職中
過去のポジション
シンギ株式会社, 株式会社フォックスデザイン, クレアコム
学歴
Rikkyo University
ウェブサイト
個人 Web サイト
407人
のコンタクト
キャリアサマリ
発達障害があります（ADHD/ASD）特性のため注意力のクセがすごいですが、ほぼ健常者とため張って働けます。手帳もありますので、障害者雇用義務でお悩みの企業ではお買い得かと思います。
障害者雇用でわからない点についてのアドバイスもある程度は出来ますので気軽にお声がけください。
■　略歴
消費者行動、データベースマーケティングを大学院まで学び、データベースマーケティングのスキルをWeb マーケティングで活かすよう制作・ECサイト管理を含めキャリアを積んで参りましたが、前職までは前記スキルを活かすためにWeb 制作の技術を磨いてまいりました。
■　得意分野
・アクセス解析ツールを使ったサイトの分析・改善案・プロモーション施策の作成
・アクセスログのデータマイニング
・ウェブサイト、スマートフォンアプリ作成のディレクション
・ HTML5 コーディング、簡単な画像修正
■　自己PR
Webにおける制作、広告・プロモーションに関係する職種はSEO アナリスト以外すべて経験しており、それらを総合した企画、運用を行うことを得意としております。
具体的にはお客様のご要望をオリエンテーションで伺い、それをまとめて様々な調査をし、最適なご提案を纏めて制作を管理できます。プロモーション開始後も分析、対策立案、実施できます。

Permalink | 記事への反応(3) | 17:13

2018-05-24

■

　最近、ショッピングモールやスーパーはデータマイニングに余念がない。これはAIの基盤とも言えるもので、顧客の記録や選択を追跡し、それぞれに合わせた商品を勧めるために用いられる。

　全米小売大手「ターゲット」では、この技法を応用して、高校生の少女の買い物履歴から妊娠の有無を予測しようと試みた。

　それが裏目に出たようで、ある父親は娘の妊娠などつゆ知らず、彼女宛のメールに乳幼児製品のクーポンが送信されてきたとターゲットに苦情を申し立てた。「娘はまだ高校生だ。ベビー用品が必要なはずなどない！」と。

　ところが最終的に、父親が謝罪することになる。ターゲットの予測が正しかったからだ。少女は妊娠していた。AIは父親以上に娘のことを知っていたわけだ。

Permalink | 記事への反応(0) | 19:12

2017-09-16

■株式会社はてなの株主 構成 から見るはてなの実態

今戯れに時価総額と持ち株比率から換算した資産表作った

近藤淳也 66.33% 4482581400円　○

（株）はてな 6.59% 445352200円

毛利裕二 5.98% 404128400円

梅田望夫 4.30% 290594000円

栗栖義臣（社長） 2.61% 176383800円　○

大西康裕 1.97% 133132600円　○

伊藤直也 1.79% 120968200円　○

田中慎樹 1.41% 95287800円

田中慎司 1.30% 87854000円　○

小林直樹 1.15% 77717000円

お金の額面はともかくの話なんだけど、

○をつけたのは、はてなのコードを書いたことがあると"思われる人"。「名前プログラミング」で検索して有意な結果が出た人に○つけた。各株主の詳細知りたい人は適当にググって

で、さらに

はてなの年収は524万円が平均年収です。（有価証券報告書調べ）

http://heikinnenshu.jp/joho/hatena.html

あると好ましい知識／経験

スクリプト言語（主に Perl/PHP/Python/Ruby/JavaScript）によるアプリケーション、ライブラリ開発の経験

ScalaやGoにおけるアプリケーション、ライブラリ開発の経験

iPhoneアプリ、もしくはAndroidアプリの開発経験

UNIX系OS、RDBMS （特に Linux、MySQL）についての基礎知識

オブジェクト指向プログラミングの基礎知識

コンピュータサイエンス（アルゴリズムとデータ構造、分散技術、自然言語処理技術、機械学習、データマイニング、型理論）に関する基礎知識

ネットワーク技術（HTTP、DNS、TCP/IPなど）についての基礎知識

大学卒／275,000円〜

http://hatenacorp.jp/recruit/fresh/application-engineer-entry

って、エンジニア待遇悪すぎじゃない？

この毛利裕二という人の持ち株の資産を新卒の給料(計算だるかったから計算からボーナス抜いたけど、手取り分で考えたらボーナス分くらいは消えるだろう)で稼ぐとしたら122年かかるし、梅田望夫という人は88年かかる。本当にこの人たちにはそれほどの価値(上にあげた新卒に求めるやたらと高いスペック)分の価値があるのか？いや、価値があると思ったから株をあてがったんだろうけど...

まぁなんていうか...、はてなのエンジニアのみなさんお疲れ様です...業務がんばってください

完全に外様の俺から言えるのは"エンジニアに"もっと給料たくさん払った方がいいんじゃないかということだけです

Permalink | 記事への反応(0) | 19:25

2017-05-27

■http://anond.hatelabo.jp/20170527131917

情報系でも、その辺の慣習は分野によってまちまち。情報処理学会だと、おっしゃるような物理学会の仕組みと同じように、大会参加者と会員だけが論文を見られる仕組みになっている。

ただ、情報系でも人工知能系は、日本だけでなく国際的にも、AAAIやIJCAIといったトップ査読付き国際会議が、採択論文を全部無料で見られるようにする方針を取っている。日本の人工知能学会だけ変えようとしても、「何でわざわざ国際的な流れに逆行するようなことをするのか」という人は当然出るだろう。

国際的な情勢も、分野によってまちまち。人工知能に近いところで言えば、KDD（知識発見のトップ査読付き国際会議）やICDM（データマイニングの査読付きトップ国際会議）は、採択論文を見られないようにしている。

これは、他の情報系はACMという国際学会のSpecial Interest Groupとして活動しているが、人工知能系はAAAIという別学会になっていることも絡んでいると思う。

Permalink | 記事への反応(0) | 15:42

■僕の見た情報系の研究室のWeb データ利用（例の論文に対する反応）

PixivのR-18 小説をデータとして使った論文が炎上している

現在は議論が収束してきて倫理的に問題があった可能性があるという話になっている雰囲気がある

二次創作小説を研究目的で引用することは研究倫理に反するか

立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース

この論文の件で著作権的に「引用するときは許可を求めろ」「データ分析に使うときは許可を求めろ」という話がたくさんTwitterに書かれているのを見かけた．通常の研究のデータ利用でそうなるのか？と疑問に思ったので，過去に学生として情報系の研究室に所属していた時の自分の経験と理解について書く．法律について詳しいわけではないのでこういう雰囲気でやられているのか程度のものだと思ってもらいたい．法的な誤りが含まれていたら指摘していただけると嬉しい．

研究利用するときに許可を求めるか

データマイニング等の分野ではWeb上のデータをあつめ研究目的で使うのが普通になっている．

僕個人の経験の話になってしまうが，Web上に公開されている情報を研究に利用するときに許可を取っている機会を見たことはほとんどないし，Web上のテキストをクロールして使っている論文でデータセットの作成に関してそういったことに言及しているものもあまり見たことがない．英語論文でも論文自体にそういったことが書かれているのを見ない．つまり Webサービス上のユーザーの投稿を研究に利用する場合でも，Webサービス・ユーザーどちらからも許可を取らないのが日常的だった．

もちろんデータセットを作ることが目的である研究，作ったデータを再配布する場合においては許可を求めているのを見かける．

通常はユーザーの情報は匿名化したりするものではあるが．

僕の理解では，公開情報を使ってデータの分析をする場合はデータを再配布しない限り著作権的に問題はなく当然著者の許可はいらないものだと考えている．

伝わらないたとえ話をすると，データを研究に使うのは本の感想を書くようなもので本の中身を転載・再配布したら問題になるがその本について感想や意見，分析を述べるだけなら著作権的には問題にならないと認識している．

今回問題になったPixivのような会員登録が必要なWebサービスの場合に公開情報にふくまれるのかはグレーゾーンかとも思われるが，自分の意見としては誰でも登録できる会員数2000万人以上のサービスの会員全員が見ることができるデータなので公開情報に準ずるものだと考えている．

規約によって引用は制限されるのか？

「規約で転載が禁止されているから引用も禁止である」という話もTwitterで見かけたが，規約中で引用が禁じられていない以上引用は可能であるはずだと思われる．

仮に引用が規約で禁止されていた場合には話が多少変わってきて，規約と法律でどちらが優先されるかは議論の余地がありそう．究極的な結論を出すには司法の判断が必要になる可能性がある(法律に詳しい人の意見を聞きたい)

今回の場合にはR-18のコンテンツを全年齢の場で引用していたのでその点がどうかという意見はわかる．

もちろん引用する場合は出典を明示して無断で行う．ただしデータセットとして使ったWeb テキストからの用例としてごく短い抜粋などについて出典を明示するのはほとんどみない．

倫理 委員会を研究のときに通すのか？

ちなみに「人間を対象とした研究の時は倫理委員会を通せ」という話も見かけたが情報系でそういったものを通すので自分が見かけたことがあるのは，被験者に何か作業をしてもらいその人間の状態を計測するような研究ぐらいで，Web テキストを使った研究については見たことがない．

終わりに

もちろん僕が経験した研究室や大学，分野の話なので場所が変わればルールも変わるだろう．

今回の論文の件で法律に詳しい方が詳細な解説をしてくださったり，研究利用する側に法的な問題があるのであればそれが周知されると嬉しい．

追記機械学習のモデルの配布はどうなのか？

ブックマークコメントにPaintsChainerはどうなの？という話があったので追記します．

私見では機械学習で学習されたモデルの配布は元のデータを過剰に再現するようなものでない限り問題ないと思われます

以下の法律事務所のブログにいくつか記事があるので参考になるかもしれません．

http://storialaw.jp/blog/2718:title

http://storialaw.jp/blog/2761:title

Permalink | 記事への反応(0) | 12:09

2016-09-29

■http://anond.hatelabo.jp/20160928053429

　典型的な老害だなぁ、と思いつつ同じ老害として参戦するよ。（笑）

なんでかって批評とか感想こそ努力しないで『俺強』できる行為そのものだと思うしさ、『俺強』って（確か）ゲームのチートとかバランス崩壊から生まれた言葉じゃん？　匿名で自分の作品を公開して問い掛けるでもなく、（web上の）有名人の新聞のインタビュー、しかも前編だけを見て印象批評だから自分も印象を述べる、って「ナニソレ？」って話じゃん。

　ゲームだよね、これ。

それっぽい言葉を使ってはいるけどデータ無視で、しかもそういうデータ解析を拒否して語ってる以上、「川上クンはこう言ってるけどボクの知ってるのはこうだから違うし、当たってる部分もあるかしんないけどムッとした。ニコ動みたいに面白いの作れ、オマエ会長じゃん。（ボクお客様だし）」ってだけの話なんだよね。出版側が購買者の解析や傾向なんか出す筈ないんだけどさ。ｗ

　メタ批評やめろって話なんだけど、印象論の延長線上にある主観と出版側代表への問い掛けである以上、異論を感じて語りたかったら内容に関してはメタにならざるを得ない。生み出されるのはジャンプヒーローよろしく地球最強の神とそれを超えた主人公と実は神を統べる世界の王と更にそれを超えた主人公と世界の王の上にいる大王の上に神がいて、そいつは破壊神と対なんだけど実は宇宙は１２コあって――、みたいな作者でさえ匙を投げたくなるようなセカイ。

　権威付けなんてそんなモノであって、昔話で町一番→国一番→世界で一番おいしい店なんて看板掲げた店主の話があったと思うけどアレと同じだよね。どうして自分の店が流行らないのかライバル店に見に行ってみたら、大事なのは謳い文句じゃなくて身近さと誠実さと飾らなさ、それに店主に共感できるかどうかだったって話。だってジビエを知らなくても馬刺しがあるし、パスタがなくても焼うどんがあるし、ホースラディッシュより山葵があるんだもん。

　もう批評家が権威を持つ時代は来ないよ？

村人を教育した処で小さな批評家が増えるだけで、行き着く先はデータマイニングと巨大資本と同調圧力に基づいたゴリ押しか、小さな身内だけのセカイ。リアルに戦争でも起こしてリセットすれば別だろうけど、毎年何冊出てるかも知らないラノベを全部読んでる人なんてどこにいるの？　居たとして、そういう人の感想を誰が求めてるの？　って話でしょうよ。

　汎化と特化はセカイの特質のどこに注目するかであって、物語の普遍的な構造に違いなんかない。

特化したセカイの多様性は小さな身内を汎化された大きな世界に埋没させ、画一化されたセカイは小さな身内の中で特化される。

　それだけの話だと"思う"よ？（笑）

取り敢えずベテランＩＤさんは、はてな村の身近な人と自分の過去を語るところから始めたらどうかな？　きっとラノベより面白いものが動き出すと思うから。

Permalink | 記事への反応(0) | 09:39

2016-04-22

■前略、はてな様。（後編）

http://anond.hatelabo.jp/20160422184218

↑これの続き。

-----------------------------------------

こういうことを書き捨てていくと老害がいなくなっただけだって思われるかもしれないんですけど、このセグメント問題ってのはサービス運営の側に立って考えるととても難しいものじゃないかって考えているんですよ。

これについてはきっと中の人も葛藤があるだろうなーってのは思います。なんだかんだ生え抜きの技術者がいるだろうし、自分の知っているユーザー層とは違うサービスになりつつあるという思いがある人はいるんじゃないかな、と想像します。でも、ビジネスとして、商売として考えるならば、敷居を下げて、大衆的な（むしろ衆愚的な）話題のコミュニティであっても、ライトユーザーに拡大できて、キチンと定額課金と広告料を取っていかなければならない。短期的に見れば、これはむしろ最重要課題です。

散々書きましたが、個人の思いを割りきって仕事人間の立場として考えるならば、はてなブログPROの月1,000円（2年契約でも600円）っていうモデルはよく踏み切ったなーって思ってるんです。ネット系ベンチャーのご多分に漏れず、マネタイズで苦労してたはずですからね。

自分でいじれる人にとっては、システムの機能だけ見ればこの有料サービスはほぼ魅力がないです。安いホスティングのレン鯖やクラウドにWordpressを入れたほうが安いし、写真なんてGoogle Photo だって Flickr だって使えるのに。実際のところは、「好きなアフィリエイトが設定できる」「あれやこれやを堂々とやれる『市民権』を得られる」というメリットが大きいですよね。はてなのユーザコミュニティを活用できて、ブクマとスターが近くて、初心者でも扱える。つまり、あの界隈って、ネットサービスのビジネスモデルとしては私のような厄介なユーザーよりずっと適切なターゲットユーザーなんですよね。

でもね。でも。あくまでも「短期的」は「短期的」でしかないんですよ。

運営している人も絶対わかってると思うんですけど、サービスにはコアが必要なんですよ。ストーリーがあって、そこから生まれたコアユーザーがいて、インフルエンサーになって規模を大きくしていく。特に、はてなみたいなコミュニティは、ユーザーによって育てられてきたサービスでしょう。

古い考えかもしれませんが、ブランドっていうのは一朝一夕ではないんですよ。「ブランドは作れる」なんていう広告代理店の言葉もありますけど、勘違いしちゃいけないのは、その作るってのは買ってすぐできるっていうことではないっていうことですよね。理念があって、コアユーザーがいて、クチコミで広がっていくものでしょ？だから、仮にイメージの転換が急務だったとしても、ユーザー層がガラッと入れ替わっちゃうと、後が続かないんじゃないかなって思うんです。

※お小遣い稼ぎ目的のブロガーについて。

私自身も仕事で広告出稿したりすることもあります。ECをやってるんで、検索流入や、導線や、コンバージョンも気になります。

だから、アフィリエイトを貼ってくれるようなブロガーさんとはお仕事的にはパートナーだったり、お客さんだったりとありがたい存在でもあります。誤解のないようにはっきりさせておきますと、私はアフィリエイト広告自体は（PV稼ぎのモラル問題とかは別として）全然否定していないです。PVが増えて嬉しい気持ちだってわかりますよ。自分だって嬉しいから。

でも、ネットコミュニティを扱ってきた人間の端くれとしてつくづく実感しているのは、人は思いのこもった言葉で動く、コピペじゃ人は動かない、ってことだったりもします。

本当に好きなものを好きだからとブログを書きたい人は、ポイントがつこうがつくまいが、アフィが貼れようが貼れまいが、とても面白い記事を書いてたくさんの人を連れてきます。上手い下手はありますが、全てではないです。逆に……って、書かなくてもこれは言わずもがな。

アフィで炎上芸をやって、PVガー流入ガーって言う人を見るとちょっと寂しくなります。それが社会の現実だからしゃーない、っていうのもわかるんですけど、世の中には本気で知ってもらいたいと思う情報を見てもらうためにタイトルを一文字変えるとかバナーをA/Bテストするとか、本気でサイトを便利にしたいと思ってボタンを1ピクセルずらすとか何ミリ秒レスポンスを早く返すとかやってる人がたくさんいるわけじゃないですか。どうせなら、そこに乗っかるコンテンツも良いものであって欲しいじゃないですか。

そんな業者やオタクの言うこと知るか、って言ってきた人もいるんだけど、でも、本気で自分が作ったサービスや、あるいは自分が書いた記事で便利に使ってもらいたい、喜んでもらいたいと思っている人間としても、あるいはユーザーとして本当に面白いコンテンツにめぐりあいたい、って思っている人間としても、皆にとってそれぞれ満足できる「界隈」があるといいな、って思うのです。データマイニングを駆使した個人別最適化によってコンテンツが出しわけられているのでも良いのですが、はてなのような個性のあるWebサービスは、できればユーザーが体験を共有できる「オープンなはてな村」であってほしいものです。

最近はじめてブログを書こうと思った学生だって、ITにそれほど強くなくて、お友達とブログを書きたい、ついでにお小遣いももらえたらラッキー、っていう純粋な気持ちでやっている主婦だって、古参から「最近の奴らは……」なんて言われて恐縮する必要なんてないと思うし、共存できると思うんですよ。

ただ、アフィリエイトだけが目的で確信的にやってる層は同じ「素敵ですね！ありがとうございます！」でも、なんとなくわかっちゃうんですよね。そういう記事ばかりが眼に入るようになると、正直ちょっとうんざりします。

また脱線しましたけど何を言いたいかっていうと、要するに、「長期的に見た場合」としては、コアユーザーとサービスの特色がキチンと育っていて、他のユーザーの共益を阻害しない、っていう状態じゃなきゃいけないんじゃないか、っていうことですね。

この特色付けにしても、はてなブログはもうちょっとうまくやれたんじゃないかなあ、って余計なお世話なことを思ったりするところはあります。もっとも、まったく小洒落ていて気が利いた広告戦略やマーケティングとかできるようなキラキラな会社じゃなくて、それとは真逆の非モテ野郎どもだった（勝手な想像）、っていうところがはてなの好きなイメージだったわけではあるのですが。

※ほら、何年か前に、2chで「Webサービスを擬人化したったwww」っていうネタ流行ったじゃないですか。hagexさんがまとめてたと思いますが。あれのね、はてなの擬人化イラスト、皮肉じゃなくてわりと悪くないんじゃね？って思ってたわけです。ミサワがドヤ顔してるやつ。少なくとも、mixi モバゲーがウェーイしてるのとかよりかずっといいですよ。

同じ大衆化の道を辿るにしても変なミニマリスト界隈とか、アフィ軍団とかに捕まるくらいなら、もっと有益なカルチャーを形成できる仕掛けってなんとかならなかったものかなあって。いや、外野が1秒で思いつくこんなことはいくらでも考えつく人がいるだろうし、プラットフォームとコンテンツの話は別だろとも思うし、既にブログMediaで提供されているみんなのごはんとか気に入って見てるんですけど、ジャンルはともかくとして、そういう書き手を集める営業はやっぱキラキラ系のところのほうが上手いんですかねぇ。

お前誰だよ、なんでそんな熱く語ってんだよ、と誰しもに思われると思うんですが、実際のところ私は自分用にブクマを使っていただけのユーザーですし、ブログサイトを作っていじる側が中心だった人間なもんで、自分自身が上げたコンテンツはそれほど無いです。すみません。

最近ちょっとだけはてなブログを個人用日記に使っていたんですけど、今改めてMTでもWPでもないブログポータルを使ってみたらどんな感じでどんなことを思うんだろう、ってことに興味を持ったためです。この文章は、その結果として書いています。

はてなブログ自体は便利で書きやすくてとっても気に入ってます。βテストの時はカテゴリすらなく本当にシンプルで大丈夫か？って思いましたが、特に GoogleフォトやTwitterなどの外部サービスからの貼り付けが気に入っています。確実にダイアリーより使いやすいです。今後もますますの発展をお祈り申し上げますです。

なんだかんだ書きましたけど、要するにですね、私は単なる無名ユーザーですけど、こういう熱心なファンもいるんですよってことなんです。今までたくさんの発見と感動をもらったことに本気で感謝してます。興味深い！参考になる！感謝！とかそういうのではなくて。

距離を置く、と書きましたが、自分の情報クリップの習慣として、はてブ⇒Evernote 連携の流れが便利で染み付きまくっているので、引き続き淡々とブクマは利用させていただきたいと思います。今まったくお金を落としていないことに罪悪感すら感じていますので、お礼の気持ちを込めてちょっとスターでも買って、ホソボソやっていきたいなと思います。

互助会問題がなんとかなったら、またひっそり戻ってきます。

古参物書きも、ギークも、ステキ主婦も、手斧軍団も、お小遣い稼ぎの人も、みんながワイワイ楽しくヒャッハーできるやさしい世界ができるといいですね。

応援していますので。

草々んじゃーね。

Permalink | 記事への反応(2) | 18:44

2016-04-15

■イケてる 人工知能 研究者の見つけ方

ちまたでは人工知能がブームだ

多くの企業が人工知能を使ったサービスをやりたいと思っていることだろう

しかし大体の企業は人工知能研究者なんか抱えていないのでアカデミックにいる研究者にリーチしてくるはずだ

ではどういう研究者にリーチすればいいんだろうか？

今だと新聞にも人工知能や機械学習の研究者へのインタビュー記事が良く掲載されている

そういう研究者にリーチすればいいんだろうか？

答えはノーだ

新聞のインタビューに出てくるのは「昔すごかったけど今はあんまりなタイプ」か「研究派閥がすごいタイプ」のどちらかだ

現役でバリバリやっている研究者を見つけるには業績が一番てっとりばやい

特に人工知能を含むコンピュータ科学の分野では国際会議(カンファレンス)が重要視されている

なかでもトップカンファレンスはものすごくレベルが高くグーグルやマイクロソフトリサーチなどITの巨人たちが切磋琢磨している世界だ

分野ごとのトップカンファレンスは大体以下のような感じだと思う

AI：AAAI, IJICAI
機械学習：NIPS, ICML, *AISTATS
データマイニング：KDD, WSDM, *ICDM
コンピュータビジョン：CVPR, *ICCV
データベース：VLDB, SIGMOD, *ICDE
自然言語処理：ACL, *EMNLPなど

(*がついているものは第一線からすこし落ちる印象)

若手に限らず日本でトップカンファレンスに通せている人は多くはない

上の会議に2本以上通せている人がいたらその人はホンモノだ

※細かことをいうと著者順も重要だがそれは省略

Permalink | 記事への反応(0) | 19:56

2015-10-15

■ニートだったけどハロワに相談行ってみた

なんかさぁ相談しても浮ついた話しかしてもらえなかったなぁ。

まあ図星付いてる所はあったんだけどさ。

俺が志望通りビルメンになって仕事に意欲を持てるかって言われたら、飲食とか介護よりはまだマシなだけでノーだし。

あくまで元ニートでもなんとなく食っていけそうな仕事はこれぐらいかなで選んだだけだし。

機械いじりは好きな方だけど、万が一便所掃除で人生終えるハメにになる可能性もあるわけで、生涯便所マンの道は流石にまだ早いなって自分でも何となく思ってるし。

俺がこう思ってるという事は会社の側もそういう事考えて「こいつそのうち辞めるんじゃね」と内定出さなかったり教育おろそかにしそうだもんなぁ。

かといって今からなれる仕事ってのもなぁ。

プログラミングの世界に飛び込むか？

せっかく大卒を捨ててまで逃げ出したあの世界にまた戻るってのものなぁ。

卒検や授業のおかげでどういう失敗をしやすいかを知っているとはいえ、正解の方法を知らないわけで。

失敗の方法なんて無数にあるから結局正解を知ってるかどうかが力になるわけで。

１つ言えるのは能力以上の仕事を受けると皆が不幸になるのがプログラミング業界で、低い能力の仕事なら外人にでもやらせればいいって事。

まあ顧客のニーズに合わせてパーツコピペでささっとHP作るタイプの仕事とかは能力低い日本人にも仕事来そうだけどさ。

まあでも結局はさ、この業界でやってくなら能力が十分に高くないと結局自分が不幸になるんだよね。

ミス起こしまくりのソシャゲも運営していけてるし、あちこちのサイトに不満な所がたくさんあるし、って所に目を向ければ一応形になっていれば仕事したことになるんだろうってのはおぼろげに理解出来なくはないんだけどさ。

結局それはいつか直さなきゃいけないからその分は自分が残業で取り返す必要があるわけでして。

やっぱブラックだろうなぁこの業界。

突然顧客が問題起こして呼び出しとかありそう。

でもビルメンもそこは大きく変わらないのかも。

夜中に呼び出されない仕事ってなんだろう。

社会の前線で戦ってる仕事は無理だろうな。

後方での補給支援にあたるような仕事、それも物書きみたいな緊急性の薄い奴。

工場での製造業とかだと急な発注やクレームありそうだしなあ。

ああでもそういうのは他の人と協力してけば良いのか

でも人余らせておける工場とかないしやっぱいざとなったら残業祭りだろうなぁ。

俺本当に何がしたいんだろう。

電気系の仕事はしてみたいけど、自分に能力や才能が十二分にあるとは思えないし、かといってそれ以外の仕事なら大丈夫って気もしない。

興味がちゃんと有る分野すら無いもんなぁ。

ニートしてる間もちょっとアニメ見てちょっとゲームやって後はシコってふたばや２ちゃんねる行ってるだけで毎日過ぎてったわ。

なんにも特化してないし、かといって基本的な能力もない。

活躍してる一億人の皆さんの純粋なまでの下位互換だよ。

存在意義ヤバイよ。

まあでもコミュニケーション能力は社交性の面では低いけど仕事ってことならある程度やれるし最低限の能力は有るか。

仕事と割りきらないと人付き合い上手く出来ないってのはまずいけど0じゃなきゃ後は積み上げてきゃどうにかなるべ。

しかしなんかいい仕事ないものかな。

複雑な仕事は脳みそのスペック的に厳しいのかなぁ、でもなあくりえいちびてぃーへの憧れは捨てきれんよなぁ男の子だもん。

単純作業は単純作業で楽しいけど、マルチタスクになった途端ストレスが倍々ゲームになるから仕事だと意外ときつかったり。

結局あれって没頭出来てるから脳汁出て楽しいわけで、それにウォッチドッグタイマみたいな要素が加わると集中力を適度に減らす必要が出てきて面白くなるのよ。

でもそれが仕事なのよってのが世の中なのよ。

じゃあ俺何しようかな本当。

程よく楽で、勤務時間にメリハリがついて、単純作業なら完全に没頭可能で、そうでないならセンスやアイディアを発揮できてそこまで知識が問われないような仕事。

あと飲み会参加必須みたいな感じじゃない奴ね。

たとえば営業職も今はデータマイニングの時代らしいけどまだまだキャバクラ接待ゴルフでジャンマーっぽいから無理よねー。

Permalink | 記事への反応(5) | 01:12

「データマイニング」を含む日記

■機械学習er vs Web開発er vs 組み込み開発er 比較表【令和最新版】

■コンピューターサイエンスって何だよ？

情報源

CS2013

J07-CS

知識体系

■[あとで読む]2022年7月はてブのあとで読むトップ30リスト

■OA化→IT化→電子化→ビッグデータ...

■サクナヒメ、スパイファミリー、AKB、今年の流行語、理由のわからないブームの理由を考えるのは無駄である

■指導教員が信用できないので研究やめたい

■仕事の失敗って大部分が時間不足によるものだよな

■id:Dursan やばすぎない？

■株式会社はてなの株主構成から見るはてなの実態

■僕の見た情報系の研究室のWebデータ利用（例の論文に対する反応）

研究利用するときに許可を求めるか

規約によって引用は制限されるのか？

倫理委員会を研究のときに通すのか？

終わりに

追記 機械学習のモデルの配布はどうなのか？

■前略、はてな様。（後編）

■イケてる人工知能研究者の見つけ方

■ニートだったけどハロワに相談行ってみた

■機械学習 er vs Web開発er vs 組み込み開発er 比較表【令和最新版】

■[あとで読む]2022年 7月はてブのあとで読むトップ30リスト

■僕の見た情報系の研究室のWeb データ利用（例の論文に対する反応）

追記機械学習のモデルの配布はどうなのか？