はてなキーワード: Chainerとは
anond:20120303220901を見て何となく調べてみたくなった。デイリーのホットエントリに入っているものだけだから抜けがあると思う。
482あとで/3046users 【永久保存版】「お金がもらえる・戻ってくる制度や手当」をまとめてみた→リプ欄にも続々情報が集まって有能「行政がやるべきことを無償で…神」 - Togetter
372あとで/2421users 【永久保存版】Gitのあらゆるトラブルが解決する神ノウハウ集を翻訳した - LABOT 機械学習ブログ
329あとで/1559users 初心者が無料で勉強できる良教材いろいろまとめ - orangeitems’s diary
271あとで/1298users すべての新米フロントエンドエンジニアに読んでほしい50の資料 - Qiita
258あとで/2327users お金の話について|ヨッピー|note
256あとで/1804users 認知バイアス一覧で社会心理学入門
254あとで/2207users YouTubeで500万再生された腹筋を割るトレーニングを1ヶ月続けてみた結果がヤバい
253あとで/3101users 重大事故の時にどうするか?|miyasaka|note
250あとで/1791users 「めんどくさい」の正体を脳科学者に聞く | Lidea(リディア) by LION
247あとで/1628users 中国だけで2100万部、話題性と本物のおもしろさを兼ね揃えたバケモノ級の中国SF──『三体』 - 基本読書
233あとで/1304users インフラエンジニアに便利な負荷計測コマンド【基礎編】 - はてな村定点観測所
231あとで/1831users 東京から1泊2日で行けるおすすめ温泉チャートを作りました - いつか住みたい三軒茶屋
227あとで/1304users 睡眠の質を高めるための方法(総まとめ編)
225あとで/1188users リクルートテクノロジーズ エンジニアコース新人研修の内容を公開します!(2019年度版) | リクルートテクノロジーズ メンバーズブログ
219あとで/1672users 四川料理のスゴイ人が猛プッシュする「肉味噌ストック」を大量に作り置きして毎日の献立を天国にする方法 - メシ通 | ホットペッパーグルメ
211あとで/1630users 「皆がこれ読んでたら読んでたら世の中もっと良くなるのに」本
210あとで/1024users この記事の元の本編は削除しました。|樫田光 | Hikaru Kashida|note
202あとで/1465users 5年間蓄積したシャツの襟首汚れも抹殺する魔のアイテム「アタックプロEX石けん」がめっちゃ便利 - Togetter
187あとで/1018users 【スクレイピングツール】面倒な情報収集はGoogle Spreadsheetにやらせよう! | DAINOTE
185あとで/1241users 国は何に、誰にカネを使っているのか 政府の全事業の予算をチェックするデータベースを作った人たちがいる
[あとで読む]が全体に占める比率で見たときに高いのはIT系のようだ。
86あとで/233users CI/CDの原則とデザインパターン (整理会)/20190722-jaws-ug-arch-pipeline-principle - Speaker Deck
80あとで/243users たのしいOSSコードリーディング:Let's read "cookies"🍪 - Speaker Deck
75あとで/236users 【やる気を出したい人必見】科学的に証明されたやる気を出す方法5選 怠惰な自分とは今日でおさらば - ホワイト心理学って何?
103あとで/340users なぜテストを書くの?(または書かないの?) 〜テストコードの7つの役割〜 / #tamarubykaigi01 - Speaker Deck
122あとで/407users これからVueを勉強しようと思っている人への道しるべ(勉強方法)を書く - Qiita
451あとで/3146users 海外で7年働いて、今でもやっぱりメチャ使っている英語の補助ツール3選|__shinji__|note
261あとで/1368users あのGoogleアナリティクス実践本が全文無料公開!インターネット最高 | DevelopersIO
258あとで/1339users 333枚のスライドで「インターネットはこれからどうなるのか」を示した貴重なレポート「Internet Trends 2019」 - GIGAZINE
258あとで/1069users ソフトウェアアーキテクチャの歴史 - tasuwo's notes
242あとで/1396users プログラマーを30年間やってきた経験から学んだことまとめ - GIGAZINE
235あとで/1609users どうやって校閲記者は調べているか | 毎日ことば
234あとで/2027users 調べものリンク集 | 毎日ことば
186あとで/849users tmk.nom on Twitter: "すげーリポジトリ見つけた。Webサービスのシステム設計が学べる。日本語もある。システム設計ってどうやって学ぶのが効率いいんだろうって思ってたけど、コイツを出発点にするのはアリな気がする。 https://t.co/1YMBP9UMHo"
184あとで/1174users 1時間で出来る!最強のWordPress環境構築(永久無料) - Qiita
182あとで/810users ウェブサイトが表示されるまでにブラウザはどういった仕事を行っているのか? - GIGAZINE
180あとで/916users 「Linuxのしくみ」をもっと早く読んでおけばよかったと後悔した - ばーろぐわにる
176あとで/1442users イエメン情勢
170あとで/875users 2019年前半の「JavaScriptをちゃんとやるための地図」
169あとで/828users 新メンバーが多い大型プロジェクトでの不確実性との戦い方 - Quipper Product Team Blog
167あとで/996users 楽しく読める!お金の基礎知識おすすめ本|深津 貴之 (fladdict)|note
166あとで/954users 「君、今日からクラウド担当ね」 未経験者が1人で始めた、ファミマのAWS移行の舞台裏 (1/2) - ITmedia NEWS
163あとで/1251users クレジットカードの偽決済画面が稼働していたサーバーについて調べてみた - piyolog
160あとで/726users Dockerfile を書くためのベストプラクティス解説編
158あとで/997users マイクロサービスにおける決済トランザクション管理 - Mercari Engineering Blog
158あとで/756users Visual Studio Codeのうれしい機能を使いこなして、初心者を最速で脱出する!《VSCode実践入門》 - エンジニアHub|若手Webエンジニアのキャリアを考える!
追記、2019年1月まで遡る(長くて2月までしか表示されない)
421あとで/2838users The Elements of Styleの全訳
376あとで/2277users 総務省 ICTスキル総合習得プログラム
334あとで/3018users 簡単・初心者向けの資産形成 (長期投資)
276あとで/2328users プログラマだったら当然知ってるよね?という知識一覧 | anopara
273あとで/1314users マネジメントで悩むすべてのエンジニアが見るべき完全無料テキスト「Google re:Work」 | DevelopersIO
234あとで/1641users 拝啓、お客様。Webサイト制作のコストはここにかかります。 | 東京上野のWeb制作会社LIG
232あとで/1044users 数時間で完全理解!わりとゴツいKubernetesハンズオン!! - Qiita
225あとで/1095users AWSをこれから始める学生への圧倒的なインプット - Speaker Deck
207あとで/1046users 東大松尾研究室監修のエンジニア向け教育プログラム「DL4US」の演習コンテンツが無償公開 | Ledge.ai
204あとで/1453users ダサい英語しか書けない人はこの本を読むといい→多くの人がポチった結果Amazonの売り上げランキング上位に入り著者が喜ぶ「これがTwitter効果か」 - Togetter
194あとで/2105users WEB特集 潜入取材!フォロワー3万人買ってみた | NHKニュース
192あとで/1829users まず楽天銀行と楽天証券に口座を作りなさい。 それから楽天カードも作りな..
184あとで/1440users 松岡修造「根拠や理論に裏打ちされていない根性論が一番嫌い」【滝川クリステル対談】
182あとで/2364users 66歳男性が風呂場で涙… 友人もいない老後を憂う相談者に鴻上尚史が指摘した、人間関係で絶対に言ってはいけない言葉 (1/6) 〈dot.〉|AERA dot. (アエラドット)
175あとで/928users AWSアカウントを作ったら最初にやるべきこと ~令和元年版~ | DevelopersIO
174あとで/1854users あなたの知らない「詐欺グラフ」の世界(随時更新中)|けんけん|note
173あとで/1316users 「マクドナルドの店内BGM」のディープさに感動して“中の人”に直撃したら本当にスゴかった話 | BUSINESS INSIDER JAPAN
171あとで/1490users 患者向け医療情報サイト総まとめ|病気になったらググる前に見てください | 外科医の視点
171あとで/777users 君には1時間でGitについて知ってもらう(with VSCode) - Qiita
170あとで/1339users 「バカうま」「キャベツ1玉なくなった」 “ジェネリック叙々苑サラダのたれ”を小説家が開発、その作り方とは? - ねとらぼ
495あとで/2948users これだけ守れば見やすくなるデザインの基礎 - Speaker Deck
460あとで/2809users 「お金を払ってセキュリティを学ぶ」のは平成で終わり? ある無料教本が神レベルで優れている件 (1/3) - ITmedia エンタープライズ
315あとで/1908users Google、無償の『デジタルスキルトレーニング』を国内1000万人に提供 - Engadget 日本版
290あとで/2306users Excelで一番「え、そんなことできるの!?」って裏技書いたやつが優勝 BIPブログ
282あとで/1723users 仕事と給与と評価の関係 - Speaker Deck
266あとで/3312users 平成31年度東京大学学部入学式 祝辞 | 東京大学 (上野千鶴子 - 認定NPO法人 ウィメンズ アクション ネットワーク理事長)
264あとで/1840users 騙されたと思ってやってみて!! ストレッチのプロが教える 肩、腰、腕周りのストレッチまとめ「痛くてちぎれる」「生活の質が3段階上がる」 - Togetter
260あとで/1570users フォント選びに迷ったら見返したい、おすすめ定番フォント31選まとめ (欧文編)|原田 佳樹 Harada Yoshiki|note
248あとで/1419users ディープラーニング入門:Chainer チュートリアル
244あとで/1800users 「という」と「こと」を減らすだけで、文章はぐっと読みやすくなる|Ryo Yoshitake | THE GUILD|note
233あとで/1839users 無料で“Google 翻訳”より高精度! “みらい翻訳”のお試し翻訳が便利 - やじうまの杜 - 窓の杜
217あとで/1266users AWSマンガ 全話を読む| AWS
184あとで/2627users 平成30年度卒業式総長告辞 | 東京大学
184あとで/1044users 「機械学習はデータ集めるのが一番大変・・・」⇛Googleが大量の機械学習用データベースを無料公開してた - Qiita
182あとで/1224users 優秀な人材がやめていくのは「計画のグレシャムの法則」に陥っているからだ:ITソリューション塾:オルタナティブ・ブログ
181あとで/1110users エンジニアが何か問題にぶつかったときにあるといい力を5個 - Mitsuyuki.Shiiba
177あとで/1205users プログラミングの変数・メソッドの命名でよく使う英単語を整理(備忘) - "BOKU"のITな日常
169あとで/754users 読書のアウトプットは書評がおすすめです。書評の書き方をお話しします。 - とある士業の知的な日常
168あとで/1515users 【photoshop】風景写真をイラスト・アニメ風に加工する | briccolog|東京都渋谷区のウェブ制作会社ブリコルール
166あとで/689users 不確実性と上手く付き合う意思決定の手法 - Speaker Deck
166あとで/1103users 簡単過ぎる!GoogleスプレッドシートからPWAアプリを開発できる「Glide」を使ってみた! - paiza開発日誌
166あとで/896users 履歴を持つデータの設計 - Speaker Deck
213あとで/1599users こうしてGoogleに入社した(kumagi編) - Software Transactional Memo
210あとで/966users 入門 Docker
196あとで/1162users 配色はセンスじゃない、UIデザインで色をかんたんにキメるメソッド|Taiki IKEDA|note
196あとで/3940users ある日突然自分の建物を他人がショベルカーで破壊しても「建造物損壊」にはならないのか? - GIGAZINE
192あとで/2393users アメリカに住んで初めてわかった「最大級」の違い - メソッド屋のブログ
186あとで/1645users イチローの引退会見を文字起こししてみた - 俺の遺言を聴いてほしい
183あとで/1767users 学生がアパートの大家と全力でバトルして敷金を全額取り返した話 - ゴミログ
181あとで/2627users 平成30年度卒業式総長告辞 | 東京大学
180あとで/905users サーバーサイドエンジニアも知っておくべきフロントエンドの今 - Speaker Deck
178あとで/983users 一時期プログラミングのデザインパターンというものが大流行しましたが、現在ではどのように評価されているのでしょうか? - Quora
175あとで/955users プレゼン本に書いていない生々しい8つのプレゼン技術のご紹介(前編)|Yasuhiro Yoshizawa|note
175あとで/1523users シンプルにオススメの本教えて(ただし自身の立場から)
172あとで/1292users 筋トレしない人も「鶏むね肉とブロッコリーのレンチンチーズ蒸し」を食べるのが大正義な3つの理由【筋肉料理人】 - メシ通 | ホットペッパーグルメ
166あとで/1669users Google退職します|eqsan|note
164あとで/833users [書評] アウトプット大全 を一ヶ月試してみて毎日のアウトプット力が着実に向上し始めた - My External Storage
163あとで/943users 未経験から7日間でコーダーとして現場投入させるまでのカリキュラムを忘れないようにメモっとく - Qiita
160あとで/973users なぜ作ったゲームが面白くならないのか?基礎にして奥義「フロー理論」|かえるD|note
159あとで/1009users まだExcelで消耗してるの?Pythonによる自動集計ガイド 基礎編 - Qiita
156あとで/1327users 横浜市「RPAの有効性検証の成果について」を読んで、仕事とは何かを思い知らされる - orangeitems’s diary
354あとで/2868users 家族が亡くなった後の「手続き地獄」早わかりカレンダー | マネーポストWEB
296あとで/1575users プログラマの採用面接で聞かれる、データ構造とアルゴリズムに関する50以上の質問 | POSTD
220あとで/1135users コンテナ技術入門 - 仮想化との違いを知り、要素技術を触って学ぼう - エンジニアHub|若手Webエンジニアのキャリアを考える!
210あとで/1199users 配色はセンスじゃない、UIデザインで色をかんたんにキメるメソッド|Taiki Ikeda|note
179あとで/1589users アメリカで流行ってるサービス: 俺と周りの場合
179あとで/1378users 「婚前交渉禁止」の家庭で育った戸田真琴は、なぜ【AV女優】になったのか?|転職サファリ
173あとで/1407users 「21時以降でもやっている都内のおすすめ喫茶店教えてください」→超有益な情報集まりまくる - Togetter
172あとで/1832users 平成最後のキッチン革命「酒蒸し法」 :: デイリーポータルZ
170あとで/1322users とある厨房で実演→オムライスのあの卵の作り方をバイトさんに教えている動画が話題に「これやりたかったやつ!」 - Togetter
168あとで/1971users 「4歳の娘が可愛くない」とSOSを出す母親に、鴻上尚史がまず最初に聞いたこと (1/4) 〈dot.〉|AERA dot. (アエラドット)
165あとで/1885users Googleの社員食堂に感じた、格差社会のリアル。 | Books&Apps
153あとで/2005users アメリカでは仕事をいきなりクビになることがあると聞きますが、そのクビになった人が持っていた仕事はきちんと他の人に引き継がれるのでしょうか? - Quora
153あとで/1021users 電子工作を趣味にすると何ができるようになるか(+電子工作のはじめかた) - nomolkのブログ
152あとで/1760users 経済制裁下のイランに行った|Yu Okada|note
151あとで/822users なぜコンピュータを学ばなければならないのか 21世紀の君主論
149あとで/580users Firebase、そろそろ触っとかないとやばいんかな?と思っているあなたのための超基本Firebaseの勉強に役立つサイトまとめ - かとのぼダイアリー
149あとで/1663users Googleに転職していきなり3ヶ月の育休を貰った - Software Transactional Memo
148あとで/1580users 紙の辞書の方が単語などを覚えやすいというのは本当なのですか? - 最近... - Yahoo!知恵袋
143あとで/1218users たくさん獲るのをやめたら、儲かって休みも増えた。佐渡のエビ漁に見えた希望 | Gyoppy!(ギョッピー) - 海から、魚から、ハ
そこらの大学生が、マジで普通に2週間くらいでAIで動くロボットとか作る。
パソコンのレベルが上がったのか、プログラミング技術が上がったのか、遠隔で操作できるスパコンができたからか。
兎に角、当たり前なんだよね。
もうね、マジで。
シンギュラリティーとか言ってたのを笑ってたけど。
これまでその分野保っていたものが、一気にAI一発で抜かれまくってる工学の分野がガンガン作られている。
凄すぎ。
tensorflowとkerasで、ガンガン画像認識して自動化して。
あとぶん回すだけ。
ツイッターでのデータ解析エンジニアは、「ビッグデータは情報の整理がー」とか言ってて、どーもビッグデータで大量の学習をしなきゃいけないらしいが。
工学の場合、細胞や車の写真なら無限にとれるし、なんでもござれでゴリゴリ計算終わる。
つええ。
http://aiweeklynews.com/archives/49678692.html
・Excelはがっつり使える
・Pythonのnumpyやpandasでデータの処理ができる
例えばですが、pythonを自分のパソコンに環境構築して、「Hello,world!」と表示できるようになったら、面接に申し込んで、「少しはpythonできます」と言ってみるのも一つの方法かもしれません。
実際に見分け方がわからなくてこれに引っかかって採用してしまう場合もあるんだろうな、とも思う。
自分がこの手の人材(エンジニア)を採用する場合にどうやって質問をすれば見極められるのかエンジニアの採用にも関わっている身としてを考えてみた。
AI人材という呼称自体がぞわぞわするけど、一旦そこは我慢する。
まず採用を行う前に、AI人材を取って何をしてもらいたいのかをチームないし採用意思決定者としっかり確認する。
など、あとは案件ベースなのか自社開発なのかそれぞれ必要となる能力がオーバーラップしつつも異なっているため。
バックグラウンドを確認する。実務や研究の経験の話が出てくるのがメジャーだと思うが、エンジニアとしてのバックグラウンドがあれば独学勢でも野良kagglerなどレベルの高い人はいるので実務経験に絞らなくても良いと思う
機械学習全般の基本的なところから確認していく。質問としてはこんな感じだと思う
・過学習ってなんでしょうか
イメージとしては非エンジニア職でも必要になる「この辺りの言葉が通じないと絶対困ったことになる」一般常識を確認する感じ。
画像や映像の認識などディープラーニング系の業務が多い想定の場合
から始まって
・どうやって訓練したのですか?
・どうしてそのような構成にしたのですか?
と突っ込んでいく。
確認したいことはディープラーニング「しか」できない人かではないかという点。
ある程度統計やベイズ法周りの知識が無いと詰むため。逆にディープラーニングが不要な業務ならこっち一本でも可。
・勾配降下法について説明してください
・畳み込みニューラルネットワークについて仕組みを説明してください
盲目的にライブラリを使ってるだけでないかという点を確認したい。
SVMを入力に適用するだけならsklearnで5行書くだけで誰でも出来る。手法の背景や対象データの特性をきちんと考えて使っているかを見たい。
・kaggleのコンペに参加したことはあるか
・メダルの取得状況
kaggleに参加した経験があればnoteからその人の手付きを直接評価できるし、メダルという他メンバからも客観的に評価できる定量指標もある。
学習意欲とか普段の姿勢を確認したい。もしかするとここが一番重要かも。
・普段何を参考に勉強しているか / 論文を読む習慣があるか(最近読んだ論文があれば教えてください)
・今興味のあること
門外漢からするとこんな風に聞こえてる。(所々適当に書いてるし書いてる内容は嘘デタラメ)
「gulpでbowerしてsassをgruntでビルドすれば、cssがストリーミング形式でデタッチされるから便利だよ。それにgulpはCoffeScriptとかtypescriptみたいな流行りのサードパーティも従来のJSみたいに変換してくれるしウォータフォールじゃなくてアジャイル的なプロジェクトでも使いやすい。スクラッチから書かなくてもいい感じにアジャストしてくれるよ。あと、OSSとしてgit上に上がってるんだけど、DLなんかもAWSと連携させてWebGLとTensorflowやらchainerやらと組み合わせればブラウザでDQNとかA3CとかDCGANも動かせるスクリプトがリリースされてた、バックエンドではDNNを走らせてフロントで表示する分をNode.jsでカスタマイズしたりタスクランナーでプロセスをマネージメントできるからもはやjsでtensorflowを含めたpythonのラッパーみたいな感じで使えて便利。最近ではbluemixがBitcoinのマインングをサポートしていてブラウザ上でウォレットからマイニングのセットアップまでできるんだって、ブロックチェーンの仕組みを拡張して社内のタスクマネージャーとかNAS上のデータを分散してサーバーに保存できるみたいなこともあるんだって。」
https://togetter.com/li/1113766
https://matome.naver.jp/odai/2149564479015738601
この問題、確かに出典を明記するべきではなかったし配慮が足りなかったとは思うけど、
それぞれの論点については疑問な点も多い。各論点についてどこが問題でどこが問題でないのか個人的な整理をしておく。
・「未成年が見れないようにしてあるのに、引っ張り出してきて有害呼ばわりする」について
ここで言う「有害」あるいは「有害情報」というのは一種の専門用語で、
「主に青少年がその情報に接することによって健全な発達・育成を阻害する恐れが有ると考えられているコンテンツの総称」とある。
Wikipediaが信用ならないなら、「有害情報」「有害表現」で検索すれば、その意味で用いられている文章がたくさん見つかる。
つまり、「有害な」=「未成年に見せるのには不健全な」という意味が、特に情報フィルタリングの研究においては比較的一般に用いられてる。
そしてこの定義によれば、pixivに投稿されているR-18の小説やイラストは全て「有害表現」ということになるし、
別にこの文章は酷い、害だ、と揶揄する意味で有害だと言っているわけではない。
「ログインしなければ見れないような場所に置いてあるものを引っ張り出してきて有害呼ばわりする」ではなくて、
「"有害表現"だからログインしなければ見れないような場所に置いてある」。順序が逆。
誤解。
論文中にある通り、ランキングのTOP10を拾ったら8件がBLだったというだけで、残り2件はヘテロカプ。
BLを排除すべきだったとも思わないし、BLから選ぶべきだったとも思わない。
(じゃあなんでわざわざ「8件がBLで2件がNL」だなんて書いたのかという話ではあるが)
少しズレている。
たとえば文化人類学や民俗学のような研究であれば、研究対象の文化を破壊してしまうのは「鯨を研究していたら鯨を絶滅させてしまった」ようなもので、
ただ、この論文においてpixiv小説文化は「研究対象」というよりは「データセット」でしかない。
その場合でも倫理的に問題はあるだろうけど、民俗学のような特別な慎重さが求められるような分野と一緒にして考えるべきではない。
このように目立たせることがタブーな界隈であることが想定できた/すべきだった、とまで言うのは難しいように思う。
・「二次創作はグレーゾーンだから隠れてるのに、わざわざ目立たせるようなことをしたのは問題」について
これって「お前がチクんなかったらバレなかったのによー」って言ってるのと何が違うんですか。
一応公共の場に置かれている以上、十分に匿名化されていれば許諾は必要ないと思う。
たとえばchainerでイラストを自動着色するシステムがあるけど、あれの学習に使うデータ全部に許諾が必要かというとそうは思わない。
それは言い過ぎ。
その理屈で言えば肖像権なんてものはない。「仮面付けないで街を歩いている方が悪い」みたいな話になる。
いくらネットに投稿していると言っても、それが朝の全国ニュースで勝手に紹介されることまで想定しているわけではない。
・「再現性のために出典を明示するのは当然」について
そんなことはない。
これは別に素材Aに触媒Bを反応させたら素材Cができた、というような話ではない。
たとえば100人にアンケートを取ったとして、その100人の個人情報全部を載せる必要があるかと言えば、「必要はない」し「プライバシーの観点からも止めるべき」。
凄い今さら感があるが、Deep Learningのフレームワークのchainerの作者が日本人だと知って、開発者のサイト覗きに行ったら、すごく珍しい苗字で良く知ってる名前で、すぐに知人だと気づいた。
いやいやいやいや、どうして彼方と此方が陸続きだと言えるのだろう?
半信半疑の目には、大人びた雰囲気が加算されてたら小さめの実写アイコンじゃ全く分からなくて、プロフィールをつい探してしまった。修士卒業年2012年。浪人したから一年違いで、つまり動機だ。学部。どこだったかな。さらに辿ったら、中学、高校......54期生とあります。自分もそうです。本当にありがとうございました。
紛れもなく、一時期一緒に登校してたくらいには親しかった(と自分が思い込んでいた)元クラスメイトだった。
好きなテレビ番組のどんなSEなら今の心境にあうのか、みくりさんじゃあるまいし、俺には全く分からない。
まだ高校生だった頃、文転する前も彼がお昼休みに知人と黒板を囲んで議論していた内容はほとんど分からなくて追い付けない感じがあった。そして今、卒業から十年以上経過してニライカナイに行っちゃったんだなという自分勝手な寂寥感に襲われてる。
任天堂の岩田さんの同級生みたいにいつか語れる?そんな贅沢ができるほどにはまだ、自分の道は到達線には程遠い。言葉も出てこない。
Babelink
作った動機は、そっくりNAVIをつくった人と似ていて技術の勉強のためと今ある類似検索のサイトへの不満からです。
そっくりNAVI - 気になる子の顔写真で、似てるAVを検索できるサイトを作った
http://anond.hatelabo.jp/20160719033025#tb
ディープラーニングは最近流行りの技術で、一般的な物体の認識では人間に匹敵するか
今回は自分が持っている画像や有名人に似ているAV女優を探すという
極めて実用的な問題にその手法を試したいと思い、サイトをつくってみました。
■使ったライブラリなど
・PostgreSQL (データベース)
・flask (Web構築)
・dlib (顔検出)
・Awesomplete (入力補完)
ぼくは一応エンジニアのはしくれですが、pythonとか仕事でちゃんと使ったことないレベルです。
それでも3~4ヶ月程度である程度のサイトはつくれるので、みなさんも是非つくってみてください。
■課題
ディープラーニングでは非常に多くの画像を機械に学習させる必要があるのですが、
現状では学習のための画像がまだまだ足りていないので、あまりいい精度はでていません。
あとはディープラーニングで精度を高めるには、ハイスペックなGPUマシンが必要になるのですが、
そんなもの持っていないので精度をこれ以上あげるのは難しかったです。
そんなかんじで、まだまだ改良の余地はたくさんあるので、楽しみにしていてください。
■参考にしたサイト
http://anond.hatelabo.jp/20101203150748
京大で画像処理を学んだ僕が本気でエロWEBサービス作ったった
http://anond.hatelabo.jp/20130122180847
画像の収集はサーバー容量の問題もあり、していないので画像検索を気軽に試してみてください。
Babelink
ビッグデータ解析で統計が判る奴がほしい、AIに詳しい機械学習を使える奴が欲しい。
産業界とは言わなくても、一部の経営者が言うセリフっていつも同じだ。
一瞬でブームに乗って金を集めて仕事にしてしまえば、ブームが終わるまで稼げる。
だから、絶対にそういう経営者の言うことを聞いて、将来を決めてはいけない。
いま日本に圧倒的に足りないのは人工知能に詳しい人材 - shi3zの長文日記
人材が足りないとは言うが、じゃあ具体的にどの程度足りないのか(つまり需要の絶対数だ)は言わない
例えば、大雑把に大学生は50万人程度卒業する。就職希望者は38万人で、内定者数が35万人。
3万人の内定が無い学生が、全員AI(ディープラーニング)を学んだとして、活躍の場はあるか。
無い。
例えば、100社が同程度採用しているとしよう。3000人~5000人だ。
専門的な研究は難しいが、そこまでは必要ないと言う。学ぶのは簡単だと。
逆に言えば、簡単な学習すら現在雇っているエンジニアにさせる気は無いという意味だ。
ここが一番のポイントになる。
つまり、一部の経営者がほしいのは、オペレーターだ。ピペットドクター(ピペット土方)と同じ。
ある道具を上手に使える期間工が欲しいのであって、道具そのものの研究者は要らない。
そして、必要であっても雇っている労働者を習熟させる手間は惜しむ。
それが今後ずっと使えるか解らないから自分達で学習するのはもったいない。
だれでも学べる技術すら自分達の労働者には学習させない。そのコストをかけない。
つまり、新入社員に新しい技術を、アイデアと手数で一斉に形にする。
モノになるのは1つか2つあれば良い。モノにならなければ、切れば良い。
ダメだと思えば撤退する、損害が広がる前に見切ったほうが経営者としては有能だ。
当然その技術を扱う社員は、技術を持たない社員と同じに見える。
例えば、誤差逆伝播法について理解していて欲しいという言い方はしない。
Caffe、Pylearn2、Chainerいずれかのフレームワークが扱えて欲しい、と言う。
ツールが使えて欲しいのだ。CUDAのコーディングが出来る必要もないが、チューニングはして欲しい。
そうすると、ツールが廃れた時、そのツールが使える価値はゼロになる。
技術者の長年の課題ではある(技術の陳腐化は避けがたい)が、それだけを学ぶのは危険すぎる。
基礎を理解していればツールの習熟は早い。ツールだけしか使えなければ乗り換えは困難だ。
使えないより、使えるやつをオレは採る、と。
それはそうだろう。モノにならなきゃ切って当然と思ってるんだから。
興味があったりやってみたいならやれば良い。ただし、基礎を疎かにしてはいけない。
現在のディープラーニングによる画像処理は、言ってみれば特徴量抽出とマッチングだ。
原画像を変換しては特徴量を出し、組み合わせて覚えておいて、正解を探す。
正解を覚えさせる(結果の誤差をなくす)部分に1つアイデアが入ったことで一気に実用化が進んだし、できるとわかってからは研究も盛んにはなった。
機械学習をやってみようと思った時の入り口として、フレームワークは手軽だし良い時代だ。
それがなくなった時にどうするか、だ。