2020-12-23

ソースを送らないレコメンド方法、及びSmooz炎上理由考察

ソースを送らないレコメンド

あれを一番簡単に実現するのはソース送信だけどそれは無しとして他の方法模索してみる。ちなみに解は出てない。

※想定問答 Q「サーバサイドでやれ」 A「石油王連れてきて」

レコメンド対象キーワードを絞る

レコメンド対象にしたいキーワード辞書アプリに同梱してマッチした単語だけ送る。

本文丸ごとでは無いんで多少は忌避感下がるけど、いつ・誰が・どのURLでそのキーワードブラウザで見たかは伝わっちゃう。

パーソナライズ不要なら「誰が」も落とせるけどそれだと精度出なかったからあの仕組みにしたんだろうしねぇ…

あと本当に本文だけ使ったレコメンド目的ならURL不要だけどwww.muji.com→オサレみたいな特徴を加えたかったのかな。

--

クライアント側でレコメンドまでやる

機械学習かじった程度なんで理解が間違ってたらすまんけど、

最近iOS(CoreML)にもAndroid(NNAPI)にも機械学習機能あるようで、

ネイティブアプリなんだからその辺触れるんだしクライアント側で完結しちゃえば?という発想。

レコメンド先のコンテンツ丸ごとスマホに持つわけにはいかんから

コンテンツID?カテゴリ?的なものを出すとこまでやって中身はサーバに取りに行くんで本当にクライアントだけで閉じるわけじゃ無い。

パーソナライズ観点で一人一人特注のモデル作って配るとかはしんどそうだけど、

ある程度セグメント切った層ごとに事前にモデル作るぐらいなら何とかなるんでは。

ああでもレコメンド対象が日々増えるWeb記事だとモデル頻繁に更新するからデプロイが辛いか

スペックもりもりのサーバでやる推薦が現代スマホそもそも代替出来るのかはわからん

エッジAIなる名目で各社頑張ってて目的の一つはセキュリティから、今は無理でも将来に期待?

--

特徴ベクトルだけ送る

分類にしろ推薦にしろデータのものダイレクトに結果に変換するんじゃ無くて一度単なる数値の配列(特徴ベクトル)に変換して、

そのあとモデルに突っ込んだら中でこねこねヘイお待ち!と出てくるんだよね?

その特徴ベクトルに変換のとこだけクライアントでやってそれ送れば?という発想。

スペック問題はあるけどレコメンド全部やるよりはマシだよねと淡い期待を抱いている。

特徴ベクトルから元のデータに戻せるとアウトだけど可能なのかね。

文字列を数値にしててかつ情報量が落ちて結果が1対1にならないから、完全な復元は無理だと思うけどどうだろう。

ありとあらゆるキーワードを事前に変換しといて結果から逆引きすれば変換元候補を出すくらいはできるんかな。

--

Smoozは何故燃えたか

いろいろ考えたけどソースのものじゃ無くてもそれに近い情報はどうやっても送るんだから

コールセンター電話すると自動音声で「サービス品質向上のために通話を録音します」的なアナウンス流れたりするのと同じで、

おすすめ機能ってこういう情報送ります的な説明アプリ内ですべきでそれ無しにやっちゃダメだったんでしょう。

アプリの実物触る前に終わったので実際には説明してたんならごめんなさい。

--

もちろん規約にもちゃんと書くべきだろう。例えばこんな風に。

楽天ウェブ検索楽天スーパーブラウザ利用規約

https://toolbar.rakuten.co.jp/mobile/rule.html

利用者が本アプリを利用した場合利用者は、第6項の定めに従い、これを停止しない限り、本アプリデバイスインストールされているブラウザの全てのウェブ閲覧履歴httphttps含む。以下本条において同じ。)で始まる閲覧ページURLアクセス日時(分秒)、表示されたウェブページのHTMLソースクッキー情報Cookie), ウェブサイト閲覧履歴リファラ, ユーザー使用しているOSアプリバージョン位置情報をいい、以下「ウェブ閲覧履歴取得情報取得情報」といいます。)が当社によって取得されることに同意するものします。

当社が取得するウェブ閲覧履歴取得情報には、ウェブページのURLを含み、当該ウェブページのセキュリティ環境によってはURLIDパスワード等の非公開、又は機密性の高い情報が含まれることがあります。よって、機密性が高い情報、または機密性が高い可能性のある情報を閲覧する環境において本アプリを利用される場合には十分にご留意ください。

ソースどころか脆弱性無い限り聖域のクッキーまで取る豪快さを見習おう。

--

ちなみにフェアじゃないので一応書いておくと「楽天ウェブ検索 規約」でググると出てくるこっちのブラウザ拡張機能版は微妙に内容が違ってクッキーは入ってない。

上のアプリ版はアプリストアの説明URLが書いてある。なんでアプリブラウザ拡張機能で2種類あるのかは分からん

拡張機能じゃ取れないから? でもサイトごとのクッキー編集する拡張とかあったような・・・

楽天ウェブ検索利用規約

https://toolbar.rakuten.co.jp/intro/rule/

2. 利用者が本機能を利用した場合利用者は、第6項の定めに従い、これを停止しない限り、本機能インストールされたブラウザの全てのウェブ閲覧履歴httphttps含む。以下本条において同じ。)で始まる閲覧ページURLアクセス日時(分秒)、表示されたウェブページのHTMLソースをいい、以下「ウェブ閲覧履歴」といいます。)が当社によって取得されることに同意するものします。

3. 当社が取得するウェブ閲覧履歴には、ウェブページのURLを含み、当該ウェブページのセキュリティ環境によってはURLIDパスワード等の非公開、又は機密性の高い情報が含まれることがあります。よって、機密性が高い情報、または機密性が高い可能性のある情報を閲覧する環境において本機能を利用される場合には十分にご留意ください。

あとこの規約についても先日malaさんが突っ込んでいるので第一発見者ではないです。

https://twitter.com/bulkneets/status/1339435587015639041

--

ソースどころかクッキーまで取ってますと堂々と書いてるほうが燃えずに、

はっきりとは書かずに取ってたほうが燃えてるの、

表面上は正直は美徳という状態なのでなんとも微妙

やらないと思ってたやつがやる・やると思ってたやつがやる、どっちもやってるけど燃えるの大抵前の方なの、

多分ヤンキー捨て猫効果みたいなもんで(俺用語だけどわかれください)

人間合理的に動く前提とか幻想です感があって本当に辛い。

  • へー楽天そんなことしてんだな さすが楽天堂々としてるわ

  • アキネイターみたいに何度か問答繰り返せばそれなりの精度で推定出来るんじゃないの サーバーからQを出してクライアントがY/Nで答える感じでさ

  • 堂々とした泥棒ってようは居直…

  • ブラウザからぶっこ抜いてユーザ本人にゴリ押しすることでアフィで儲ける以外のモデルを採用すれば

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん