はてなキーワード: データマイニングとは
業務で機械学首(データマイニング)、Web(業務システム)、組み込み(産業インフラ設備)の経験があるので、分野ごとの相違点と発生しがちな軋轢を書いておく。
- | 機械学習 | Web開発 | 組み込み開発 | 発生する軋轢 |
コードの寿命 | 半年間 | 20年間 | 40年間 | 組み込み開発er「産業系の組み込みは発売から40年後にアップデートするケースもあるので、ドキュメントは、開発担当者が全員退職して誰も残っていなくても理解できるように書いてください!」 |
コードのアップデート頻度 | 試行錯誤しつつ随時 | 2週間に1回 | 半年~5年に1回 | Web開発er「組み込みはどうしてそんなに時間がかかるの?アジャイルを導入してください。ウォーターフォールは硬直的でデメリットばかりですよ」 |
アップデートの提供方法 | -(コードは少人数の同僚だけで使用) | サーバに自動デプロイ | 技術者が現地訪問してアップデート | 組み込み開発er「アジャイルだから最初は若干のバグを残して発売し後日アップデートするって?グローバルで既にXXX台受注しているけど、誰が現地に行くの?費用を負担する部署はどこ?」 |
開発者の属性 | 数理系の修士~博士、少数精鋭 | 専門学校~修士、文理混在、大人数 | 電気系、機械系、情報系の修士~博士 | 機械学習er「数式で表現できない知識は民芸品です。エンジニアを名乗っちゃダメでしょ」 |
関係部署 | マーケティング・企画 | 顧客 | ハード開発・工場 | 組み込み開発er「納期3カ月前なのにソフトが完成していないの?生産立ち上げを工場に相談していない!?スケジュールをゴールから逆算できなかったの??今回は船便での輸送になるけど、それも計算に入れてあるよね?」 |
計算資源 | 潤沢 | 予算次第 | 貧弱 | 組み込み開発er「データマイニングやってたKさんがOSSを使うらしいけど、サイズが5MBあるんだぜ。5MB全部必要なのか聞いたら一部機能しか使わないんだって。で、他チームとの容量調整は丸投げされたの。感覚を破壊されるよな。」 |
3rdパーティライブラリ | OSS | OSS | 買ってくる | 組み込み開発er「OSSに不具合があったらどうやって修正して顧客にデリバーするつもりなんだろう?リスク移転の考えで、不具合の補償契約込みで買えばいいのに」 |
通信プロトコル・データフォーマット | 生データが王様なので、生データに従う | 最新のものを取り込む | 実績重視 | Web開発er「HTTPの実装がないの?TCPを直接使う!?暗号化や認証はS社の独自プロトコル?古いプロトコルを使い続けているから開発効率が低いんだよ」 |
電源OFFタイミング | 任意にコントロール可能 | 定期メンテナンス | コントロール不可 | 組み込み開発er「ファームウェアアップデート中に電源OFFしたらどうなるの?ファイル書き込み中の電源OFFは?状態遷移図って知ってる?」 |
性能 | 出来高 | 顧客要件、常識、予算に従う | ミリ秒~マイクロ秒単位のタイムスライスで管理 | Web開発er「性能改善でXX関数の10ミリ秒を1ミリ秒以下に短縮するために2週間も試行錯誤したって?プロパ社員の人件費は7万円/日だから70万円を消費したね?AWSでEC2の性能を調整すれば2000円/月で解決だよ。損益分岐点は350カ月だけど顧客のこれまでのリプレース実績から判断してこのシステムはそこまで長期間使われない」 |
学会発表・特許 | 結構ある | ほぼなし | 年1件の特許出願ノルマ | 組み込み開発er「学会発表も特許出願もなく、何を開発したの?ドメイン知識をソフトウェアに翻訳してAWSでポチポチやっただけなの?開発行為ではなく作業だね」 |
分野ごとに要求される製品特性が異なるから、異分野に移ると文化摩擦が起きるという話だと思う。製品特性の違いを理解し自らの行動に反映できるようになるには、ベテランでも数年かかるケースがある。開発期間10年のテーマを経験したことがあるが、そうした場合だとワンサイクルを経験するのに10年かかるので。経験から学ぶのが愚者、歴史から学ぶのが賢者ともいうが…。
「人間関係の濃さで案件を取ってくる営業」はAIが発達した社会では成立しません。
何故なら「人間関係の濃さで取ってこられた案件」というのは「AIが適切に双方の利益を換算して取ってきた案件」よりも様々な面でパフォーマンスに劣るからです。
営業という仕事は需要と供給のマッチングであり、この作業において必要なのはデータマイニングの技術です。
その分野において人間はAIに圧倒的に劣っているので、あらゆる営業活動はAIに取って代わられます。
「書類に判子を押す部長」もAIが発達した社会では消滅する存在です。
日本人は責任というものを「失敗時に損害を補填する行為」だと考えがちですが、責任というのは本来会社から預けられた「業務上の責任能力」のことです。
「業務上の責任能力」とは、業務を行える能力なしには成立しません。
書類に判子を押すという行為に対して責任を負う場合は、「案件を進めていいかどうかの総合的な可否判断」の能力が問われます。
現在の会社組織ではその会社で長年過ごしてきた人間の経験則を当てにする事が多いので、ある種年功序列式に年長者であるものが判子を押す立場を与えられています。
ですがその経験則よりもAIによる分析能力が向上すれば、判子を押す行為、すなわち「可否決定の判断」をする権限はAIに預けられるでしょう。
組織の命令系統としての部長は残るかも知れませんが、それぞれのセクターにおける可否決定の判断を下すのはAIに委託されるようになると思われます。
よって「書類に判子を押す部長」という存在はAIが発達した社会には存在しません。
これらの条件に一つないしは複数当てはまる職業として以下のものがあります。
・婚姻当事者(専業主婦・偽装結婚の当事者・その他結婚を通して何らかの利益を得るための婚姻当事者)
・性風俗
・法的な身分の売買や利用(詐欺行為を働く際のID貸し借りや新規作成にかかわる行為など)
・AI否定派を顧客とした商売(実際にはAIを使用しているのに顧客に嘘をつく場合の窓口業務も含む)
これらの職業はAIが発達した後も「法律上の権限がAIに与えられていない」「個人的な趣味嗜好によりAIでないものを求める」といった観点から労働提供者の需要が失われることがありません。
AIの発達を予測し備えておきたいのならこういった職業についての経験を積むのは有効かと思いますが。
ですがAIの発達速度から考えるにこれら以外の職業が完全に消滅するのには、今現在出生を終えた人類がその寿命を使い切るまでの時間がかかると思われます。
ただしこの予想は人類の医学が急速発展する場合を考えておりません。
そうなりますと、AI発達後も失われないこれらの職業に就くための準備を今からするのは有効だと思います。
個人的に私がオススメするのは「性風俗」と「自然回帰主義者としての活動」となります。
「性風俗」の場合は、枯れ専と呼ばれる人達の需要を満たす方法について今から学習を進めるのがオススメです。
「自然回帰主義者としての活動」の場合、機械文明否定派の新興宗教を立ち上げるのがオススメです。
参考になりましたでしょうか?
最近コンピューターサイエンスがプログラマーに必要か否かみたいな話が上がっているが、そもそもコンピューターサイエンスって何だよ。どこまでの範囲をさしてんの?
ググって出てきた情報を整理しただけなので詳しい人、補足・訂正よろしく!
https://www.acm.org/binaries/content/assets/education/cs2013_web_final.pdf
CS2013はACM/IEEE-CSによるカリキュラム標準。
ACM(計算機協会)はコンピュータ分野全般の国際学会、IEEE-CSはIEEE(米国電気電子学会)の中にあるテクニカルソサエティ。
https://www.ipsj.or.jp/12kyoiku/J07/20090407/J07_Report-200902/4/J07-CS_report-20090120.pdf
J07-CSは一般社団法人情報処理学会がCC2001CSをベースにアレンジを加えたカリキュラム標準。今はCS2013を反映したJ17-CSがあるらしいけどその辺は良く分からん。
https://www.ipa.go.jp/files/000024060.pdf
J07ーCSから抜粋。CS2013と比較するとナレッジエリアがあったり無かったり。
はてブのホットエントリ(総合)で月内に数多く[あとで読む]タグを集めたエントリ
406あとで/1267users 今どきのLinux事情 | tokida | SpeakerDeck
322あとで/2603users 世の中には困ってる人を助ける制度がたくさんあるのに何が使えるかを教えてくれないっていう理不尽仕様なんだが、そんな世界をなんとかしようとしてる人たちがいて、そのためのWebページがこの前リリースされたってことを僕はフォロワーさんに知っておいて欲しいと思ったんよ | Togetter
317あとで/2362users 【保存版】リクルートやサイボウズといった大企業が新人研修用の資料を公開。→「学び直そう」「非エンジニアの方にも」 | Togetter
183あとで/975users ゼロトラスト移行のすゝめ:IPA 独立行政法人 情報処理推進機構
170あとで/1167users 「チ。―地球の運動について―」感想。〜歪で不誠実で不愉快なこの傑作漫画について〜 - 銀河孤児亭
169あとで/1566users 大阪と京都で「ここ行っとけ、これ食っとけ」があったら教えて→で、続々と集まった情報がこちら | Togetter
160あとで/1265users 東京の水はどうやって飲めるようになってるのか?|miyasaka|note
157あとで/942users 青空怪談 〜青空文庫の怖い話50選〜|みもねる|note
156あとで/849users 今年もミクシィの22新卒技術研修の資料と動画を公開します! | mixi developers
148あとで/827users 個人開発で即戦力になるツール・サイトまとめ - Qiita
147あとで/1283users 元Googleデータ科学者「人生をうまくやるコツってめちゃシンプルだよねー」 | パレオな男
144あとで/890users サブスクリプション型のビジネスなら見ておくべき5つの超重要チャート - Qiita
142あとで/1250users 「もはや昭和ではない」男女共同参画白書(令和4年版)が面白いからみんな読んでみて! 今は子無し世帯がマジョリティ - 斗比主閲子の姑日記
137あとで/1036users 【保存版】交通事故に遭ったときにまずやること・避けてほしい行動マニュアル - 弁護士法人AOがお届けする法律メディア|Legal Forest
133あとで/838users 有名企業のエンジニア向け研修資料まとめ - Qiita
131あとで/1080users エクセルで複数のシートを集計する場合、シートを何枚追加しても数式修正が不要!大企業の経理が感動した神テクとは|ウォーカープラス
130あとで/728users 【絶対に観るべき】英語のYoutubeチャンネル集【プログラミング】 - Qiita
126あとで/853users 障害報告書を書こう! - Qiita
126あとで/1331users これから家が燃える人向けnote~出火編~|たぬき|note
125あとで/712users 期限の制約なく無料で使えるクラウド「Free Tier」主要サービスまとめ。2022年版 | Publickey
117あとで/973users かに💸 on Twitter: "答えいいます。ぼくが創業するなら、①日本政策金融公庫の『創業の手引』見ながら創業計画立てて、②中企庁の『J-Net21』で補助金みつけて、③よろず支援拠点で創業補助金の申請手伝ってもらう。ちなみにここまで全部タダ。④創業後は"商工… https://t.co/LXadEmaqdx"
116あとで/1443users 俺も同じような立場になったことあるけど、解決策は一つしかない。転職だ.. | anond.hatelabo.jp
116あとで/1210users 統一教会と自民党のお付き合いについて補足するよ(ちょっとだけ追記) | anond.hatelabo.jp
109あとで/1113users 統一教会と安倍晋三・自民党 | anond.hatelabo.jp
107あとで/637users ゲーム感覚でプログラミング学べるサービス集 - Qiita
107あとで/872users 「なんで私をもっと評価してくれないの!?」という人向けに、私がやってる評価ハッキング手法を伝授します - 斗比主閲子の姑日記
106あとで/493users AWS認定の無料模擬試験がさらに便利になりました! | DevelopersIO
106あとで/758users 2022年のモダンCSS改 | tonkotsuboy_com | SpeakerDeck
105あとで/633users プロダクトマネジメントを学ぶための推しの書籍 | mizuman | SpeakerDeck
103あとで/598users データマイニング入門 | 森 純一郎 | Utokyo Open Course Ware
103あとで/1054users 記者座談会 統一教会と自民の関係にメスを 反共右派として育てた為政者の罪 | 長周新聞
業務にコンピューターを導入して自動化、効率化しよう、って1970年代から、OA化、IT化、電子化とずーーーっと言ってきたよね。
業務にデータを活用して意思決定を高度化しよう、って1980年代から人工知能→データマイニング→人工知能→ビッグデータ→データサイエンス→AIとずーーーっと言ってきたよね。(細かい「エキスパートシステム」とか「AIの冬」とかは省略)
そして今、また新しい流行り言葉としてDXに飛びついているよね。
その時間の大半をビジネスパーソン (笑) として過ごして、そろそろ定年になる人たちがいなくなる途端に、「DX人材が不足!」「2025年の崖!」とかいう話になるのは変だよね。これまで40年以上、自分たちでOA化だのなんだの言ってきたんだから、それを実現していれば、今さら「DXが急務」とか人材不足とかならないはずじゃん。
DXについてご立派に語る識者や経営者は、「なぜ自分たちはOA化に失敗したのか」「なぜ自分たちはIT化できなかったのか」をまず振り返って欲しいよね。そのうえで、「自分たちは無能だったから実現できなかったけど、次の世代の人たちは優秀だからDXを実現できる」とか言うならまだわかるけど。
大学院卒の若者がメーカーに就職して工場研修に行くとこうなるわけだ。
「なんやお勉強ばっかしとった生っ白いのが来よったけど、統計学だのデータマイニングだのエーアイだの賢そうなこと言っても、旋盤も使えん坊っちゃんはここじゃ何もできんぞ」
これ。世の中の大多数を占める普通の人々(ただし生活や家族を優先して変化することを止めると決断した中年以降)は
大阪は特にそういう文化的傾向が強いよね。信州とか東北とかも似たようなもんだと思うけど、人口で差があるから目立たないのだろう。
そもそも論として「ブームですよ+興味ある話題+周りで話が出来る人がいる」の3つが揃えばそれでもう満貫(麻雀の点数。勝負手として十分と考えていいライン)。
メンタンピンドラドラ(麻雀の役。メンは門前、タンはタンヤオ、ピンは平和(ピンフ)、どれも頻出の役かつ同時に成立することが多い。ドラはおまけポイント。)みたいなもんね。
つうかブームさえでかけりゃそれだけでもう勝手に回りが盛り上げてくれるし、話ができる人も増える。
麻雀で言えばドラが3つあるからなんでもいいからリーチかければワンチャン跳ねる(跳満を意味しており、満貫の一個上の状態。勝利にぐっと近づくので無理して推してもいいライン)状態。
だから企業ってのは平気でステマとかするんだけど、アナ雪みたいなよっぽどのバカじゃない限りはステマってブームに火が点いたらもう分からんのよね。
大火事になったあとでは最初の火元なんて素人目には分からなくなるのと一緒。
タイトルに挙げたもののうちどれがステマでどれがダイマでどれが奇跡的なブームなのかはもう誰にも分からない。
でもとりあえずはやってさえいれば、その時点でもうある程度勝ってしまう、買ってしまう。
ブームの理由を考えるってのは、私はクソほど暇ですその暇を趣味や自己研鑽に使う気もなく人にくだらん話をして承認欲求を満たせないかちょっとした執筆料でも乞食できないかばかり考えているゴミクズと宣言しているようなもの。
つまんねーテンプレ反論が来る前に一つだけ釘を差しておくと、大量のブーム情報を集めてデータマイニングを行う行為が意味を成すことはあるよ。ただし、どういうデータを集めるかも加工するかもそれなりの工夫がいるけどね。
大学院の指導教員のゼミ指導があんまりにもずさんで,ほとほと困っている.
代わりに各指導教員はなんかしら専門知識を身に着けている(ということになっている).
で,うちの教員の場合それが「アンケート設計」と「統計処理」なんだけど,
アンケートの設計も統計処理もその解釈も,まー適当なんだよね.
「地球では1901-2010年の約100年の間に19cm海面が上昇しました.これは地球温暖化が原因です.これを踏まえてあなたは,レジ袋を貰わずにマイバッグで買い物しようと思いますか?」
「タバコの副流煙には、主流煙よりもずっと多くの有害物質が含まれています.これを踏まえて,あなたは分煙に協力しようと思いますか?」
みたいな聞き方を平気でする.
重回帰分析ひとつ取っても標準化係数とその有意確率しか見ない.
決定係数がどんなに低くても気にも留めない.
決定係数が負の分析結果を掲載した論文が査読通っちゃったところなんかも見た.
分散分析なんかも頻繁にやるのにゼミ中"交互作用"って言葉を一度も聞いたことがない.
「ニューラルネットワークは分析の仕組みがブラックボックスだから信用できないんですよね」だって?いやいやあんたt検定の仕組みも説明できないんじゃないんですか?
「アンケートの打ち込み終わったなら,○○分析と××分析と△△分析,全部1日で終わりますね」?そりゃ多重共線性のケアとか決定係数とか気にしないあんたの適当な回帰分析なら1日で終わるでしょうけど?
「良い結果出ましたね!」とか抜かしたりする始末.
その教員とはB4からの付き合いで,最初は指導内容に違和感なかったんだけど
他所の研究室の話とか,真面目にデータマイニングやってる先生の話とか聞いて,
最近になって自分のところの研究をちっとも信用できなくなってしまった.
こんな教員でも「結果」さえ残してしまえば出世できてしまうのが研究職というものらしく,
去年,准教授から教授に昇進している.今まさにノっている教授,というわけである.こちらとしては非常に面白くない.
あの人が学術的にやっていることといえば,ゼミで学生が「作り出した」相関を世に公表していることくらいなのに.
そんなこんなでこの人の下で研究なんてまっぴらごめんなんだけど,
大学院最初からやり直すのも,こんな理由で1年分納めた学費がおじゃんになるのは嫌だし,
かといって思い切って退学してしまうのも将来性がなさすぎる.
だから、そのデータマイニングで、嫌な広告をつけるようなのが当たり前になってきたから、俺は使わん。
なお、adblockは当然、エロ系はそれ自体必ず別のブラウザをつかるようにしてるし、トラッキングもカットするのを入れた。
ターゲッティング広告って、あれはこいつに売り込みたいってやつにダイレクトに広告出しに来るってことは、
陰謀論や、ゴリ押しで物を売りたいってやつに悪用されるのは当然だよなと思ってる。
すでにスマートスピーカーで検索もしてないが、家庭内で話してた内容のものの特定の者の広告が出るのが気味が悪いといいうニュースはみかける。
ああいう噂が立っている以上気味悪がって広がらないんじゃないかと思う。
検索ならまだ能動的だから注意できるが、家庭内で無意識に話したことでも弱み狙われるわけだから。
http://b.hatena.ne.jp/entry/366247316/comment/Dursan
「無能な人が優秀な人を排除する論理に使われないよう祈る」 どうも自分を有能だと思ってる無能が多いようで。ちゃんと本文読んでこの答えは出ないだろ?
まさにこういう「自分を有能だと思ってる無能」みたいな、言葉で人を刺して平気でいられる人こそが、元記事の「まわりをつついて殺す」タイプなんだと認識した。
自覚してないって怖いし、こういうタイプには関わりたくないよなー。
id:Dursan 杉山征直氏(すべて御本人がWeb上に開示している情報です)
https://www.wantedly.com/users/18298847
https://jp.linkedin.com/in/%E5%BE%81%E7%9B%B4-%E6%9D%89%E5%B1%B1-a9232b35
だーさんです。東京練馬、江古田在住のおさーんです。 アイコンは鳥だけど容姿はメガネクマ。 いろいろオープンな方たちとの雑談やネットプロモーションのお話なんか結構してます。 特撮、SF、お笑い、グルメも大好物です。 お気軽に突っ込んでください。 ※URLをPeing(質問箱)に変更しますた
杉山 征直
現職
求職中
Rikkyo University
407人
発達障害があります(ADHD/ASD)特性のため注意力のクセがすごいですが、ほぼ健常者とため張って働けます。手帳もありますので、障害者雇用義務でお悩みの企業ではお買い得かと思います。
障害者雇用でわからない点についてのアドバイスもある程度は出来ますので気軽にお声がけください。
■ 略歴
消費者行動、データベースマーケティングを大学院まで学び、データベースマーケティングのスキルをWebマーケティングで活かすよう制作・ECサイト管理を含めキャリアを積んで参りましたが、前職までは前記スキルを活かすためにWeb制作の技術を磨いてまいりました。
■ 得意分野
・ アクセス解析ツールを使ったサイトの分析・改善案・プロモーション施策の作成
■ 自己PR
Webにおける制作、広告・プロモーションに関係する職種はSEOアナリスト以外すべて経験しており、それらを総合した企画、運用を行うことを得意としております。
具体的にはお客様のご要望をオリエンテーションで伺い、それをまとめて様々な調査をし、最適なご提案を纏めて制作を管理できます。プロモーション開始後も分析、対策立案、実施できます。
最近、ショッピングモールやスーパーはデータマイニングに余念がない。これはAIの基盤とも言えるもので、顧客の記録や選択を追跡し、それぞれに合わせた商品を勧めるために用いられる。
全米小売大手「ターゲット」では、この技法を応用して、高校生の少女の買い物履歴から妊娠の有無を予測しようと試みた。
それが裏目に出たようで、ある父親は娘の妊娠などつゆ知らず、彼女宛のメールに乳幼児製品のクーポンが送信されてきたとターゲットに苦情を申し立てた。「娘はまだ高校生だ。ベビー用品が必要なはずなどない!」と。
ところが最終的に、父親が謝罪することになる。ターゲットの予測が正しかったからだ。少女は妊娠していた。AIは父親以上に娘のことを知っていたわけだ。
(株)はてな 6.59% 445352200円
毛利 裕二 5.98% 404128400円
梅田 望夫 4.30% 290594000円
伊藤 直也 1.79% 120968200円 ○
田中 慎司 1.30% 87854000円 ○
小林 直樹 1.15% 77717000円
お金の額面はともかくの話なんだけど、
○をつけたのは、はてなのコードを書いたことがあると"思われる人"。「名前 プログラミング」で検索して有意な結果が出た人に○つけた。各株主の詳細知りたい人は適当にググって
で、さらに
はてなの年収は524万円が平均年収です。(有価証券報告書調べ)
http://heikinnenshu.jp/joho/hatena.html
スクリプト言語(主に Perl/PHP/Python/Ruby/JavaScript)によるアプリケーション、ライブラリ開発の経験
ScalaやGoにおけるアプリケーション、ライブラリ開発の経験
iPhoneアプリ、もしくはAndroidアプリの開発経験
UNIX系OS、RDBMS (特に Linux、MySQL)についての基礎知識
コンピュータサイエンス(アルゴリズムとデータ構造、分散技術、自然言語処理技術、機械学習、データマイニング、型理論)に関する基礎知識
ネットワーク技術(HTTP、DNS、TCP/IPなど)についての基礎知識
大学卒/275,000円〜
http://hatenacorp.jp/recruit/fresh/application-engineer-entry
この毛利 裕二という人の持ち株の資産を新卒の給料(計算だるかったから計算からボーナス抜いたけど、手取り分で考えたらボーナス分くらいは消えるだろう)で稼ぐとしたら122年かかるし、梅田 望夫という人は88年かかる。本当にこの人たちにはそれほどの価値(上にあげた新卒に求めるやたらと高いスペック)分の価値があるのか?いや、価値があると思ったから株をあてがったんだろうけど...
情報系でも、その辺の慣習は分野によってまちまち。情報処理学会だと、おっしゃるような物理学会の仕組みと同じように、大会参加者と会員だけが論文を見られる仕組みになっている。
ただ、情報系でも人工知能系は、日本だけでなく国際的にも、AAAIやIJCAIといったトップ査読付き国際会議が、採択論文を全部無料で見られるようにする方針を取っている。日本の人工知能学会だけ変えようとしても、「何でわざわざ国際的な流れに逆行するようなことをするのか」という人は当然出るだろう。
国際的な情勢も、分野によってまちまち。人工知能に近いところで言えば、KDD(知識発見のトップ査読付き国際会議)やICDM(データマイニングの査読付きトップ国際会議)は、採択論文を見られないようにしている。
これは、他の情報系はACMという国際学会のSpecial Interest Groupとして活動しているが、人工知能系はAAAIという別学会になっていることも絡んでいると思う。
PixivのR-18小説をデータとして使った論文が炎上している
現在は議論が収束してきて倫理的に問題があった可能性があるという話になっている雰囲気がある
立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース
この論文の件で著作権的に「引用するときは許可を求めろ」「データ分析に使うときは許可を求めろ」という話がたくさんTwitterに書かれているのを見かけた.通常の研究のデータ利用でそうなるのか?と疑問に思ったので,過去に学生として情報系の研究室に所属していた時の自分の経験と理解について書く.法律について詳しいわけではないのでこういう雰囲気でやられているのか程度のものだと思ってもらいたい.法的な誤りが含まれていたら指摘していただけると嬉しい.
データマイニング等の分野ではWeb上のデータをあつめ研究目的で使うのが普通になっている.
僕個人の経験の話になってしまうが,Web上に公開されている情報を研究に利用するときに許可を取っている機会を見たことはほとんどないし,Web上のテキストをクロールして使っている論文でデータセットの作成に関してそういったことに言及しているものもあまり見たことがない.英語論文でも論文自体にそういったことが書かれているのを見ない.つまりWebサービス上のユーザーの投稿を研究に利用する場合でも,Webサービス・ユーザーどちらからも許可を取らないのが日常的だった.
もちろんデータセットを作ることが目的である研究,作ったデータを再配布する場合においては許可を求めているのを見かける.
僕の理解では,公開情報を使ってデータの分析をする場合はデータを再配布しない限り著作権的に問題はなく当然著者の許可はいらないものだと考えている.
伝わらないたとえ話をすると,データを研究に使うのは本の感想を書くようなもので本の中身を転載・再配布したら問題になるがその本について感想や意見,分析を述べるだけなら著作権的には問題にならないと認識している.
今回問題になったPixivのような会員登録が必要なWebサービスの場合に公開情報にふくまれるのかはグレーゾーンかとも思われるが,自分の意見としては誰でも登録できる会員数2000万人以上のサービスの会員全員が見ることができるデータなので公開情報に準ずるものだと考えている.
「規約で転載が禁止されているから引用も禁止である」という話もTwitterで見かけたが,規約中で引用が禁じられていない以上引用は可能であるはずだと思われる.
仮に引用が規約で禁止されていた場合には話が多少変わってきて,規約と法律でどちらが優先されるかは議論の余地がありそう.究極的な結論を出すには司法の判断が必要になる可能性がある(法律に詳しい人の意見を聞きたい)
今回の場合にはR-18のコンテンツを全年齢の場で引用していたのでその点がどうかという意見はわかる.
もちろん引用する場合は出典を明示して無断で行う.ただしデータセットとして使ったWebテキストからの用例としてごく短い抜粋などについて出典を明示するのはほとんどみない.
ちなみに「人間を対象とした研究の時は倫理委員会を通せ」という話も見かけたが情報系でそういったものを通すので自分が見かけたことがあるのは,被験者に何か作業をしてもらいその人間の状態を計測するような研究ぐらいで,Webテキストを使った研究については見たことがない.
もちろん僕が経験した研究室や大学,分野の話なので場所が変わればルールも変わるだろう.
今回の論文の件で法律に詳しい方が詳細な解説をしてくださったり,研究利用する側に法的な問題があるのであればそれが周知されると嬉しい.
ブックマークコメントにPaintsChainerはどうなの?という話があったので追記します.
私見では機械学習で学習されたモデルの配布は元のデータを過剰に再現するようなものでない限り問題ないと思われます
以下の法律事務所のブログにいくつか記事があるので参考になるかもしれません.
典型的な老害だなぁ、と思いつつ同じ老害として参戦するよ。(笑)
なんでかって批評とか感想こそ努力しないで『俺強』できる行為そのものだと思うしさ、『俺強』って(確か)ゲームのチートとかバランス崩壊から生まれた言葉じゃん? 匿名で自分の作品を公開して問い掛けるでもなく、(web上の)有名人の新聞のインタビュー、しかも前編だけを見て印象批評だから自分も印象を述べる、って「ナニソレ?」って話じゃん。
ゲームだよね、これ。
それっぽい言葉を使ってはいるけどデータ無視で、しかもそういうデータ解析を拒否して語ってる以上、「川上クンはこう言ってるけどボクの知ってるのはこうだから違うし、当たってる部分もあるかしんないけどムッとした。ニコ動みたいに面白いの作れ、オマエ会長じゃん。(ボクお客様だし)」ってだけの話なんだよね。出版側が購買者の解析や傾向なんか出す筈ないんだけどさ。w
メタ批評やめろって話なんだけど、印象論の延長線上にある主観と出版側代表への問い掛けである以上、異論を感じて語りたかったら内容に関してはメタにならざるを得ない。生み出されるのはジャンプヒーローよろしく地球最強の神とそれを超えた主人公と実は神を統べる世界の王と更にそれを超えた主人公と世界の王の上にいる大王の上に神がいて、そいつは破壊神と対なんだけど実は宇宙は12コあって――、みたいな作者でさえ匙を投げたくなるようなセカイ。
権威付けなんてそんなモノであって、昔話で町一番→国一番→世界で一番おいしい店なんて看板掲げた店主の話があったと思うけどアレと同じだよね。どうして自分の店が流行らないのかライバル店に見に行ってみたら、大事なのは謳い文句じゃなくて身近さと誠実さと飾らなさ、それに店主に共感できるかどうかだったって話。だってジビエを知らなくても馬刺しがあるし、パスタがなくても焼うどんがあるし、ホースラディッシュより山葵があるんだもん。
村人を教育した処で小さな批評家が増えるだけで、行き着く先はデータマイニングと巨大資本と同調圧力に基づいたゴリ押しか、小さな身内だけのセカイ。リアルに戦争でも起こしてリセットすれば別だろうけど、毎年何冊出てるかも知らないラノベを全部読んでる人なんてどこにいるの? 居たとして、そういう人の感想を誰が求めてるの? って話でしょうよ。
汎化と特化はセカイの特質のどこに注目するかであって、物語の普遍的な構造に違いなんかない。
特化したセカイの多様性は小さな身内を汎化された大きな世界に埋没させ、画一化されたセカイは小さな身内の中で特化される。
それだけの話だと"思う"よ?(笑)
取り敢えずベテランIDさんは、はてな村の身近な人と自分の過去を語るところから始めたらどうかな? きっとラノベより面白いものが動き出すと思うから。
http://anond.hatelabo.jp/20160422184218
↑これの続き。
-----------------------------------------
こういうことを書き捨てていくと老害がいなくなっただけだって思われるかもしれないんですけど、このセグメント問題ってのはサービス運営の側に立って考えるととても難しいものじゃないかって考えているんですよ。
これについてはきっと中の人も葛藤があるだろうなーってのは思います。なんだかんだ生え抜きの技術者がいるだろうし、自分の知っているユーザー層とは違うサービスになりつつあるという思いがある人はいるんじゃないかな、と想像します。でも、ビジネスとして、商売として考えるならば、敷居を下げて、大衆的な(むしろ衆愚的な)話題のコミュニティであっても、ライトユーザーに拡大できて、キチンと定額課金と広告料を取っていかなければならない。短期的に見れば、これはむしろ最重要課題です。
散々書きましたが、個人の思いを割りきって仕事人間の立場として考えるならば、はてなブログPROの月1,000円(2年契約でも600円)っていうモデルはよく踏み切ったなーって思ってるんです。ネット系ベンチャーのご多分に漏れず、マネタイズで苦労してたはずですからね。
自分でいじれる人にとっては、システムの機能だけ見ればこの有料サービスはほぼ魅力がないです。安いホスティングのレン鯖やクラウドにWordpressを入れたほうが安いし、写真なんてGoogle PhotoだってFlickrだって使えるのに。実際のところは、「好きなアフィリエイトが設定できる」「あれやこれやを堂々とやれる『市民権』を得られる」というメリットが大きいですよね。はてなのユーザコミュニティを活用できて、ブクマとスターが近くて、初心者でも扱える。つまり、あの界隈って、ネットサービスのビジネスモデルとしては私のような厄介なユーザーよりずっと適切なターゲットユーザーなんですよね。
でもね。でも。あくまでも「短期的」は「短期的」でしかないんですよ。
運営している人も絶対わかってると思うんですけど、サービスにはコアが必要なんですよ。ストーリーがあって、そこから生まれたコアユーザーがいて、インフルエンサーになって規模を大きくしていく。特に、はてなみたいなコミュニティは、ユーザーによって育てられてきたサービスでしょう。
古い考えかもしれませんが、ブランドっていうのは一朝一夕ではないんですよ。「ブランドは作れる」なんていう広告代理店の言葉もありますけど、勘違いしちゃいけないのは、その作るってのは買ってすぐできるっていうことではないっていうことですよね。理念があって、コアユーザーがいて、クチコミで広がっていくものでしょ?だから、仮にイメージの転換が急務だったとしても、ユーザー層がガラッと入れ替わっちゃうと、後が続かないんじゃないかなって思うんです。
私自身も仕事で広告出稿したりすることもあります。ECをやってるんで、検索流入や、導線や、コンバージョンも気になります。
だから、アフィリエイトを貼ってくれるようなブロガーさんとはお仕事的にはパートナーだったり、お客さんだったりとありがたい存在でもあります。誤解のないようにはっきりさせておきますと、私はアフィリエイト広告自体は(PV稼ぎのモラル問題とかは別として)全然否定していないです。PVが増えて嬉しい気持ちだってわかりますよ。自分だって嬉しいから。
でも、ネットコミュニティを扱ってきた人間の端くれとしてつくづく実感しているのは、人は思いのこもった言葉で動く、コピペじゃ人は動かない、ってことだったりもします。
本当に好きなものを好きだからとブログを書きたい人は、ポイントがつこうがつくまいが、アフィが貼れようが貼れまいが、とても面白い記事を書いてたくさんの人を連れてきます。上手い下手はありますが、全てではないです。逆に……って、書かなくてもこれは言わずもがな。
アフィで炎上芸をやって、PVガー流入ガーって言う人を見るとちょっと寂しくなります。それが社会の現実だからしゃーない、っていうのもわかるんですけど、世の中には本気で知ってもらいたいと思う情報を見てもらうためにタイトルを一文字変えるとかバナーをA/Bテストするとか、本気でサイトを便利にしたいと思ってボタンを1ピクセルずらすとか何ミリ秒レスポンスを早く返すとかやってる人がたくさんいるわけじゃないですか。どうせなら、そこに乗っかるコンテンツも良いものであって欲しいじゃないですか。
そんな業者やオタクの言うこと知るか、って言ってきた人もいるんだけど、でも、本気で自分が作ったサービスや、あるいは自分が書いた記事で便利に使ってもらいたい、喜んでもらいたいと思っている人間としても、あるいはユーザーとして本当に面白いコンテンツにめぐりあいたい、って思っている人間としても、皆にとってそれぞれ満足できる「界隈」があるといいな、って思うのです。データマイニングを駆使した個人別最適化によってコンテンツが出しわけられているのでも良いのですが、はてなのような個性のあるWebサービスは、できればユーザーが体験を共有できる「オープンなはてな村」であってほしいものです。
最近はじめてブログを書こうと思った学生だって、ITにそれほど強くなくて、お友達とブログを書きたい、ついでにお小遣いももらえたらラッキー、っていう純粋な気持ちでやっている主婦だって、古参から「最近の奴らは……」なんて言われて恐縮する必要なんてないと思うし、共存できると思うんですよ。
ただ、アフィリエイトだけが目的で確信的にやってる層は同じ「素敵ですね!ありがとうございます!」でも、なんとなくわかっちゃうんですよね。そういう記事ばかりが眼に入るようになると、正直ちょっとうんざりします。
また脱線しましたけど何を言いたいかっていうと、要するに、「長期的に見た場合」としては、コアユーザーとサービスの特色がキチンと育っていて、他のユーザーの共益を阻害しない、っていう状態じゃなきゃいけないんじゃないか、っていうことですね。
この特色付けにしても、はてなブログはもうちょっとうまくやれたんじゃないかなあ、って余計なお世話なことを思ったりするところはあります。もっとも、まったく小洒落ていて気が利いた広告戦略やマーケティングとかできるようなキラキラな会社じゃなくて、それとは真逆の非モテ野郎どもだった(勝手な想像)、っていうところがはてなの好きなイメージだったわけではあるのですが。
※ほら、何年か前に、2chで「Webサービスを擬人化したったwww」っていうネタ流行ったじゃないですか。hagexさんがまとめてたと思いますが。あれのね、はてなの擬人化イラスト、皮肉じゃなくてわりと悪くないんじゃね?って思ってたわけです。ミサワがドヤ顔してるやつ。少なくとも、mixiモバゲーがウェーイしてるのとかよりかずっといいですよ。
同じ大衆化の道を辿るにしても変なミニマリスト界隈とか、アフィ軍団とかに捕まるくらいなら、もっと有益なカルチャーを形成できる仕掛けってなんとかならなかったものかなあって。いや、外野が1秒で思いつくこんなことはいくらでも考えつく人がいるだろうし、プラットフォームとコンテンツの話は別だろとも思うし、既にブログMediaで提供されているみんなのごはんとか気に入って見てるんですけど、ジャンルはともかくとして、そういう書き手を集める営業はやっぱキラキラ系のところのほうが上手いんですかねぇ。
お前誰だよ、なんでそんな熱く語ってんだよ、と誰しもに思われると思うんですが、実際のところ私は自分用にブクマを使っていただけのユーザーですし、ブログサイトを作っていじる側が中心だった人間なもんで、自分自身が上げたコンテンツはそれほど無いです。すみません。
最近ちょっとだけはてなブログを個人用日記に使っていたんですけど、今改めてMTでもWPでもないブログポータルを使ってみたらどんな感じでどんなことを思うんだろう、ってことに興味を持ったためです。この文章は、その結果として書いています。
はてなブログ自体は便利で書きやすくてとっても気に入ってます。βテストの時はカテゴリすらなく本当にシンプルで大丈夫か?って思いましたが、特にGoogleフォトやTwitterなどの外部サービスからの貼り付けが気に入っています。確実にダイアリーより使いやすいです。今後もますますの発展をお祈り申し上げますです。
なんだかんだ書きましたけど、要するにですね、私は単なる無名ユーザーですけど、こういう熱心なファンもいるんですよってことなんです。今までたくさんの発見と感動をもらったことに本気で感謝してます。興味深い!参考になる!感謝!とかそういうのではなくて。
距離を置く、と書きましたが、自分の情報クリップの習慣として、はてブ⇒Evernote連携の流れが便利で染み付きまくっているので、引き続き淡々とブクマは利用させていただきたいと思います。今まったくお金を落としていないことに罪悪感すら感じていますので、お礼の気持ちを込めてちょっとスターでも買って、ホソボソやっていきたいなと思います。
古参物書きも、ギークも、ステキ主婦も、手斧軍団も、お小遣い稼ぎの人も、みんながワイワイ楽しくヒャッハーできるやさしい世界ができるといいですね。
草々んじゃーね。
多くの企業が人工知能を使ったサービスをやりたいと思っていることだろう
しかし大体の企業は人工知能研究者なんか抱えていないのでアカデミックにいる研究者にリーチしてくるはずだ
今だと新聞にも人工知能や機械学習の研究者へのインタビュー記事が良く掲載されている
答えはノーだ
新聞のインタビューに出てくるのは「昔すごかったけど今はあんまりなタイプ」か「研究派閥がすごいタイプ」のどちらかだ
現役でバリバリやっている研究者を見つけるには業績が一番てっとりばやい
特に人工知能を含むコンピュータ科学の分野では国際会議(カンファレンス)が重要視されている
なかでもトップカンファレンスはものすごくレベルが高くグーグルやマイクロソフトリサーチなどITの巨人たちが切磋琢磨している世界だ
分野ごとのトップカンファレンスは大体以下のような感じだと思う
若手に限らず日本でトップカンファレンスに通せている人は多くはない
※細かことをいうと著者順も重要だがそれは省略
まあ図星付いてる所はあったんだけどさ。
俺が志望通りビルメンになって仕事に意欲を持てるかって言われたら、飲食とか介護よりはまだマシなだけでノーだし。
あくまで元ニートでもなんとなく食っていけそうな仕事はこれぐらいかなで選んだだけだし。
機械いじりは好きな方だけど、万が一便所掃除で人生終えるハメにになる可能性もあるわけで、生涯便所マンの道は流石にまだ早いなって自分でも何となく思ってるし。
俺がこう思ってるという事は会社の側もそういう事考えて「こいつそのうち辞めるんじゃね」と内定出さなかったり教育おろそかにしそうだもんなぁ。
せっかく大卒を捨ててまで逃げ出したあの世界にまた戻るってのものなぁ。
卒検や授業のおかげでどういう失敗をしやすいかを知っているとはいえ、正解の方法を知らないわけで。
失敗の方法なんて無数にあるから結局正解を知ってるかどうかが力になるわけで。
1つ言えるのは能力以上の仕事を受けると皆が不幸になるのがプログラミング業界で、低い能力の仕事なら外人にでもやらせればいいって事。
まあ顧客のニーズに合わせてパーツコピペでささっとHP作るタイプの仕事とかは能力低い日本人にも仕事来そうだけどさ。
まあでも結局はさ、この業界でやってくなら能力が十分に高くないと結局自分が不幸になるんだよね。
ミス起こしまくりのソシャゲも運営していけてるし、あちこちのサイトに不満な所がたくさんあるし、って所に目を向ければ一応形になっていれば仕事したことになるんだろうってのはおぼろげに理解出来なくはないんだけどさ。
結局それはいつか直さなきゃいけないからその分は自分が残業で取り返す必要があるわけでして。
でもビルメンもそこは大きく変わらないのかも。
夜中に呼び出されない仕事ってなんだろう。
後方での補給支援にあたるような仕事、それも物書きみたいな緊急性の薄い奴。
ああでもそういうのは他の人と協力してけば良いのか
でも人余らせておける工場とかないしやっぱいざとなったら残業祭りだろうなぁ。
俺本当に何がしたいんだろう。
電気系の仕事はしてみたいけど、自分に能力や才能が十二分にあるとは思えないし、かといってそれ以外の仕事なら大丈夫って気もしない。
興味がちゃんと有る分野すら無いもんなぁ。
ニートしてる間もちょっとアニメ見てちょっとゲームやって後はシコってふたばや2ちゃんねる行ってるだけで毎日過ぎてったわ。
まあでもコミュニケーション能力は社交性の面では低いけど仕事ってことならある程度やれるし最低限の能力は有るか。
仕事と割りきらないと人付き合い上手く出来ないってのはまずいけど0じゃなきゃ後は積み上げてきゃどうにかなるべ。
複雑な仕事は脳みそのスペック的に厳しいのかなぁ、でもなあくりえいちびてぃーへの憧れは捨てきれんよなぁ男の子だもん。
単純作業は単純作業で楽しいけど、マルチタスクになった途端ストレスが倍々ゲームになるから仕事だと意外ときつかったり。
結局あれって没頭出来てるから脳汁出て楽しいわけで、それにウォッチドッグタイマみたいな要素が加わると集中力を適度に減らす必要が出てきて面白くなるのよ。
でもそれが仕事なのよってのが世の中なのよ。
じゃあ俺何しようかな本当。
程よく楽で、勤務時間にメリハリがついて、単純作業なら完全に没頭可能で、そうでないならセンスやアイディアを発揮できてそこまで知識が問われないような仕事。