「アルゴリズム」を含む日記 RSS

はてなキーワード: アルゴリズムとは

2017-11-22

素人だけど量子コンピューターに感銘を受けたのでちょっと語らせて。

ジン模型って聞いたことある

物質性質研究するのに古くから使われている理論ね。

例えば碁盤の目の上に電子をずらっと並べて、スピンはどっちを向きますか?みたいな研究

スピンがよくわからないなら小さな磁石を考えてもいいよ。隣り合う磁石と反発しあって向きを変える様子を想像してみて。

高温ではみんなバラバラの方向を向いていたのに、ある温度になったらみんな向きをクルッと揃える。これが相転移

どんな方向を向くのかな?相転移の温度はいくつかな?みたいなのを調べるのに物理学者たちはイジン模型計算していたわけ。

ところでね、実は身近な問題もイジン模型で解けるんだ。

たとえば、巡回セールスマン問題。これは「佐川急便配達トラックはどのルートを通るのが最短か?」みたいな問題ね。こういうの最適化問題と呼ぶんだけど。

並んだ電子スピンの向きを計算することで佐川配達ルートがわかっちゃうのよ。すごいね。でも、スパコン使って時間と電力とたくさん消費するの。大変。アルゴリズムめっちゃ研究されているけど大変。

ここでものすごい発想の転換

何も計算しなくてもさ、実際に電子をずらっと並べてスピンがどっち向くか観測したらいいんじゃない

これが量子コンピューター

現実的にはそんなことできないので、実際に並んでいるのはちいさな回路(超電導閉回路)。

回路を電流が「左に回る」か「右に回る」かが、スピンが「上を向く」か「下を向く」かに対応しているの。(D-waveとかね)

この発想すごいよね。

もっと身近な話で例えてみる?

例えばさ、手に持ったボールちょっと投げてみてくれる。

放物線状に飛んだよね?

実はね、量子力学によるとボールはあらゆる軌道で飛ぶ可能性があるのよ。

で、それらの可能性を全部重ね合せると打ち消しあって(経路積分)、

エネルギー(正確には作用)の最も低い軌道だけを残して消えるように見えるの。

残った軌道がさっきボールの飛んだ放物線。

ここでさ、

単にボールを投げたのが、エネルギーについて最適化問題を解いたとも言えるわけ。

こんな感じの発想。すごいよね。

物理現象を解明するために計算するのではなくてさ、

計算をするのに物理現象に手を入れる(イジン模型の結合定数をいじったり外場いれたり)という発想がね、

ちょっと思いつかないな、考えた人すごいなって感銘を受けたんだよ。

誰かと共有したかったんだ。

読んでくれてありがとう

2017-11-21

不正がなかったことが検証できるガチャ

1. 予め0~99999のくじ番号のそれぞれについて、どの番号ならどの排出キャラなのかを定義して、それを公開する。

 

2. プレイヤー乱数シードを割り振る。乱数シードは連番など、割り振り方に意図が介在しないことが証明できる方法で割り振る。

(それはまさに『当たりテーブル』『外れテーブルであるため、割り振り方が恣意的であってはならない)

この情報は非公開だが、ガチャが引ける期間の終了後に公開される。

 

3. 0~99999のくじ番号をランダムに生成するためのアルゴリズム作成する。これには外れが続いた場合

当たりやすくするような仕組みを組み込んでもよい。

この情報は非公開だが、ガチャが引ける期間の終了後に公開される。

 

4. プレイヤーガチャを引くとき、割り振られた乱数シードとくじ引きアルゴリズムから

0~99999のくじ番号を生成する。

この番号は常にプレイヤーに公開される。

 

5. くじ番号と「1.」の定義からプレイヤーガチャ排出キャラを入手する。

 

6. ガチャが引ける期間の終了後に、「2.」と「3.」が公開される。

 

7. プレイヤーは「2.」と「3.」の情報からガチャ結果をシミュレーションし、

シミュレーション結果と、実際にガチャを引いたときの当たり番号の発生のしかたが一致していることをもって

不正がなかったことが検証できる。

 

メリット

正しい確率ガチャ排出されたことが証明できる。

 

デメリット

ガチャ結果から乱数シードとくじ引きアルゴリズムの内容を特定できれば、今後のガチャ結果を正確に予測できる。

(ただし現実的には、乱数の出方だけからくじ引きアルゴリズムの内容を特定するのは不可能である)

また、正しい確率ガチャ排出されたことが証明できることと、その結果に納得できるかは別問題である

2017-11-19

互助会対策でなにか変わったらしいけど

どういうときAmazon使うのか分からない 249 users

これとか、新着エントリに入らないのってどういうアルゴリズムなの

http://b.hatena.ne.jp/entrylist?url=https%3A%2F%2Fanond.hatelabo.jp%2F

2017-11-16

anond:20171116152745

ええと「AIには落ちこぼれがいない」ってのは、同じアルゴリズムで等しく学習させたプログラムを、同じ性能のハードに複製して利用すると、同じ性能になる、って意味だったの?

2017-11-03

anond:20171103120113

英語同時通訳や、自動翻訳でともかく、数学はありえないよ。

高度なアルゴリズムは内部で数学知識いるから。

さら理化学系も数学知識いるから。

同時通訳自動翻訳がうまく進まなかったら、やっぱり英語必要だよ。翻訳技術ができるか否かの話で共通語はもう英語から動かないでしょう。

2017-10-29

開発の難易度

プログラミングジャンル別の難易度があるよね?

僕も設計能力勉強してるが付け焼き刃。リミットがある中で試作を次々作ってるから、ところどころ厳密にせずにやり続けている。

結局、右も左もわからんような部分は、恥かいても構わんようなオレのような馬鹿が突っ走って、預けれる部分を切り出して、人に預ける

 

多分、あなたプロジェクトは、高度なアルゴリズム要求される難しいジャンルだと予想。

数学で例えるなら、

 

(A)は、Webサイトスマホアプリプログラミングだ。既存技術知識組合せれば十分に設計実装できる。コード量が多いと面倒だが、決して作れないわけではない。

(B)は、AIプログラミングとか。今までにないアルゴリズム等を捻り出さないと作れない。時間をかけても必ず実装できるというわけじゃない。キツイ

 

リーマン予想」の証明納期1週間でやってくれ、みたいな要求されたら無理ゲーだよねwww

 

俺も生活のためにITやってるだけ=難しい(B)じゃなくて、簡単な(A)を選んだからアドバイスできることは残念ながらないだろう。m(__)m

(今すぐ本業に戻ったら、プロテオミクスとかならできるかな~?)

2017-10-28

謎のスパムメールが来るようになった

昨晩から謎のスパムメールが5分に1通きっかり来るようになった。

朝鮮仕業か?

微妙日本語おかしい。しかもなぜか文章の語尾に謎の呪文が付いて来る。

>>

現在お仕事をされている方でも副業感覚ですぐに稼げてしまう!をねそてしねえるよほ

当社は独自アルゴリズムによる正確な分析を実現する事が出来ました。をねそてしねえるよほ

副業には興味があるけどお金がない少額から出来る副業はないのかそんな方にピッタリ!をねそてしねえるよほ

10000円を投資して損した場合と、100円を投資して損した場合とでは全く違いますよね!をねそてしねえるよほ

まずは100円から試してみませんか?をねそてしねえるよほ

そこで1か月で1000円になれば本当に副業としてスタートしましょう!をねそてしねえるよほ

<<

気持ち悪いしなんなんだこれ。

迷惑メールフォルダに入って来るからあいいが、やっぱり鬱陶しい。

どうすればいいんだ。

謎のスパムメールが来るようになった

昨晩から謎のスパムメールが5分に1通きっかり来るようになった。

朝鮮仕業か?

微妙日本語おかしい。しかもなぜか文章の語尾に謎の呪文が付いて来る。

>> 現在お仕事をされている方でも副業感覚ですぐに稼げてしまう!をねそてしねえるよほ

当社は独自アルゴリズムによる正確な分析を実現する事が出来ました。をねそてしねえるよほ

副業には興味があるけどお金がない少額から出来る副業はないのかそんな方にピッタリ!をねそてしねえるよほ

10000円を投資して損した場合と、100円を投資して損した場合とでは全く違いますよね!をねそてしねえるよほ

まずは100円から試してみませんか?をねそてしねえるよほ

そこで1か月で1000円になれば本当に副業としてスタートしましょう!をねそてしねえるよほ<<

気持ち悪いしなんなんだこれ。

迷惑メールフォルダに入って来るからあいいが、やっぱり鬱陶しい。

どうすればいいんだ。

2017-10-26

Bitcoin LOL

Bitcoin LOL | Make Bitcoin Funny Again!

Bitcoin LOL

Bitcoin LOLBitcoinから生えてきた新しい草です。 すべての人が採掘の楽しみを味わえるようにしようというのを大義名分としていますソースコードGithubで公開しています

GitHub - bitcoin-lol/bitcoin: Bitcoin Core integration/staging tree

プレマインなし!ICOなし!開発者が一切得をしない安心設計

Bitcoin LOLは494510番目のブロック以降Bitcoinからハードフォークすることで誕生します。 プレマインはありません。ICOしません。下手なことして捕まりたくないもんね。

Bitcoin LOLの特徴

調整されない難易度調整アルゴリズム

Bitcoin LOLLOL Difficulty Adjustmentというぶっこわれアルゴリズム採用しています

Implement LOL difficulty adjustment by karen-bitcoin · Pull Request #1 · bitcoin-lol/bitcoin · GitHub

これは「ハードフォーク以降、採掘難易度を常に最低値で固定する」というものです。 これによいくらマイナーが増えても難易度は一切上がらず、 すべての人に採掘のチャンスがあり続けることになります! さあ、芝刈り機で芝を刈るようにガンガン採掘しよう!

インフレ?reorg?何のことかな……。

申し訳程度のリプレイプロテクション

Bitcoin LOLには公開時からすでにリプレイプロテクション実装されています。 どこかの兄弟分とは大違いですね!

Implement opt-in replay protection by karen-bitcoin · Pull Request #2 · bitcoin-lol/bitcoin · GitHub

でもごめんなさい。このリプレイプロテクションちょっと面倒なんです。 オリジナルBitcoin自分自身の手で分離しないといけません。

やり方は……ソースコード読んで察してもらえませんか……? なんかこうトランザクション特殊情報を付加して送るとかそんな感じです。 いやだってこれが一番簡単そうだったから。それに例のあのやばいフォークもこれと同じ方式だし。 というかほぼコピペ。

とっっっても大事な注意事項!
本当に伝えたかたこ

Bitcoinフォークって、やろうと思えば私みたいなふざけたやつでもできるんですよ。 これがもし美辞麗句が素敵にレイアウトされたサイトだったらどうでしょう、 これは儲けるチャンスと思って飛びついてしまった方もいるんじゃないでしょうか?

2017年10月現在、残念ながらBitcoin世界は相次ぐハードフォークによって混沌としていますこの先生きのこるためにはどうすればいいでしょう? 今何が起こっていてこれから何が起こるのかを理解するのが一番ですが、 すべてを理解するのは難しいこともあるでしょう。 より安全資産Fiatや他の暗号通貨に移すことも選択肢としてありだと思います。 私が作ったお粗末なBitcoinもどきのようなものに騙されないように。 みなさんが楽しい暗号通貨ライフをおくれるようお祈りしています

Enjoy your life with your favorite cryptocurrencies!

2017-10-21

anond:20171021194138

APIの整備とかもAIにやらしてみればどうなんだ

どういうのが使いやすいかなんて、だいたい政治的に決まるだろ

アホなやつほどAI仕事がなくなるとか言ってるけど、それはどこから給料が発生しているかわかってないからそう言ってるだけ

プログラマが思っているよりも、ほとんどの仕事給料の発生源は「政治的」なもの

AIなんざ、プログラマー間でのどういうAPIがいいか、どういうアルゴリズム実装するかの「政治的な」調整もできないんだから、無理だよ

 そういう仕事は、他の非IT業の人たちがやってる仕事と同じ程度に複雑で簡単から

Twitterとか、人間をつなぐようなソフトウェアばかり繁栄しているのみてもそれがわかる

2017-10-18

はてブホッテントリPixivランキングTwitterトレンドも、何かあると運営操作を主張する奴が出てくるけど、だいたいものすごく単純なアルゴリズムしか想定していなくて、その想定通りの動きにならないか不正をやってるに違いない、という雑すぎる陰謀論しかないよな。

2017-10-12

Googleにデコイを食わせろ!

「よろしい、ならば戦争だ」

Google検索と戦う方法を紹介します。

デコイ

デコイ(英: decoy)は、狩猟で囮に使う鳥の模型。これが元来の意味である

デコイ英語: decoy、Military dummy、囮とも)は、敵を欺瞞して本物の目標と誤認させる目的で展開する装備の総称

ネガティブSEO

リバースSEO」や「ネガティブSEO」とも呼ばれる逆SEO

逆SEOとは、特定サイト検索順位を下落させること

Matt Cutts氏が指摘するように、順位を下げるために付けたリンクが、期待とは正反対順位を上げる手助けをしてしまうこともあり得なくはありませんね。

リンクされているサイトではなく、リンク元サイトスパムかどうか判断していることをGoogleゲイリー・イリェーシュ氏がMarketing Landポッドキャストで明らかにしています

この説明にもネガティブSEOの具体例をあげて解説していることからペンギンアップデートネガティブSEO対策に力を入れていることがうかがえます

方針

  1. ネガティブSEOではなく、ポジティブSEO採用する。
  2. ポジティブSEOデコイを大量に投下する。

あなたプログラマーではない場合(手動)

  1. あなた名前を付けたブログTwitterアカウントを作る。(例:はてな次郎のダイエット日記
  2. 質の良い情報必要なので、趣味や特技を活かしたテーマ記事を書く。(例:スムージーオリジナルレシピを紹介)
  3. 業界有名人積極的メッセージを送る。(例:料理家・平野レミさんのちくわストローで飲むティスムージーレシピ感想を送る) https://twitter.com/Remi_Hirano/status/759208574694359044

 

目的は「はてな次郎」の文字列自分管理して、インターネット上に増やすこと。

 

  1. ブログ記事動画にして、YouTubeにアップする。(YouTuberビデオブログ
  2. ブログ記事書籍にする。(例:Amazon KindleAmazonオンデマンド印刷本)
  3. 書籍オーディオブックにする。(例:Amazon Audible

 

目的は「はてな次郎」の文字列を爆発的に増やすこと。

 

セルフプロデュースセルフブランディングするのがポジティブSEO王道です。

現在、「はてな次郎」をGoogle検索したら1万件ヒットする場合セルフブランディングした情報が3万件ヒットするぐらいを目指してください。

はてな次郎」に関する誤情報が、検索結果の10ページ以下に沈めばとりあえず成功です。

あなたプログラマー場合自動

はてな次郎」という文字列インターネット上で増殖させる作業を、手動ではなく自動で行うことも可能です。

 

  1. クローラー」を作り、Web上のデータ収集する。
  2. AI自然言語処理データを加工する。
  3. 加工したデータをもとにポータルサイトを作る。

 

(例)有名人応援するファンサイトを作り、各ページのタイトルやヘッダーに「はてな次郎」の文字列を入れる。

  1. Amazon商品データスクレイピングして、本=著者、CD歌手DVD監督俳優人物データベース作成する。
  2. その人に関する情報スクレイピングする。(DBディアAPI、あのひと検索スパイシーを参考にする)
  3. 日本語英語日本語の往復翻訳をするなどして、オリジナルデータを少し改変する。
  4. 人物に関するデータから、その人物の三行紹介を作成する。(マルコフ連鎖圧縮新聞のような記事を生成する) http://pha.hateblo.jp/entry/20071124/1195904502
  5. 自分が好きな歌手女優なら、自分で紹介記事を書いても良いです。(手動の作業も加えてOK

 

このような方法で、100万ページ程度のWebサイト自動的に作れます

データや加工方法を変えて、さらWebサイトを作れば「はてな次郎」の文字列インターネット上に1億個以上投下することも可能です。

いいね工場

アメリカ大統領選挙ロシア情報操作を行っていたと言われている「ロシアゲート事件」を参考にして、SNSデコイをばらまくことも可能です。

  1. 安いスマートフォンSIMカードを大量に用意する。
  2. SNS操作する専用アプリを作る。(DeployGateやTranspoterPadのようなデプロイツールを利用)
  3. はてな次郎」の情報自分で作ったブログWebサイトSNSアカウントなど)を拡散したり、いいねを送る。

 

ユーザー陳情を受付けないGoogle傲慢ですね?

やりたい放題のGoogleをブッ飛ばすには、プログラミング有効です。

頑張ってください。

 

追記

記事仮名が変更されたので本記事仮名も変更しました。(はてな次郎)

 

補足:

はてな次郎」の文字列自分管理

自分が書いた投稿なら、必要に応じて(自分権限で)表示/非表示を切り替えられるので管理上都合が良い、という意味です。

Google人生破壊された

煽りタイトルだけど偽らざる本心なので。


何があったか一言でまとめると、

無関係他人炎上に巻き込まれ誹謗中傷された挙句、元ページを削除しても永遠にGoogle検索結果から消えない」

ということがありました。

最悪です。

Googleは全く対応してくれる気なさそうなので、万に一つでも増田話題になってくれれば何か違うかもしれないと思って書いてます

あと単純にWEBに詳しいはてな村の人たちの知恵を貸してほしい、マジで…。






経緯

1)無関係他人炎上に巻き込まれ

 同じ職場の似たような名前の別人(仮にはてな太郎とする)が悪事を働く

  →これってはてな次郎(これも仮名だけど俺の本名と思って読んで)じゃね?という感じで、俺が犯人ということにされる

  →誹謗中傷され、個人情報をあさられる

2)スレッド過去ログ倉庫に行くのを待つ(変に燃料追加したくなかったので)

3)無事過去ログ倉庫に送られたが、「はてな次郎」の検索結果にスレッドがヒットしてしま

 スレッドタイトルはこれも仮で悪いけど

 「一部上場企業連続レイプ犯がまぎれていた件www

 みたいな感じのゲスものだと思ってください。

4)弁護士に依頼して、該当スレッドから俺の本名はてな次郎)を削除してもらう

 この時点でかなり高額な費用がかかり、俺涙目

5)Googleキャッシュスニペットを削除する

 キャッシュキャッシュスニペット検索したとき

 ページタイトルの下に出てくる数行の説明みたいなやつです

 ※※ここ重要なところ※※

6)まだページタイトルだけは検索結果に出るが、しばらく待てば消えるだろうと思って放置

7)一年待つ

8)……消えねえええええええ(しか検索結果に1p目に表示される…)


何が困るって、該当スレッドからは「はてな次郎」っていう本名こそ消えてるんだけど、

知人が読んだら「これってはてな次郎じゃん」ってわかる内容なんだよね


特定されたくないからぼかすけど、

「このレイプ犯ってやつ、企画課の一番背高いやつじゃね?」みたいな感じで

想像してみ?自分本名ぐぐると1p目に

 「一部上場企業連続レイプ犯がまぎれていた件www」って出てくることを…

つらすぎ…


原因はおそらく、該当スレッドが、

Googleクローラーにとってめちゃくちゃ優先度が低いため、

何年待ってもクロールされず、インデックス更新が行われないこと。


平たく言うと、クローラーってロボットがいろんなページをくまなく探して、

そのページにどんな情報があるかをGoogleに報告して、

それを「インデックス」って読んで、検索結果に出るようにしてるっぽいんだけど、

クローラー全然来ないから、

「このページには はてな次郎 って情報がある」って誤ったインデックスが、

一年経っても更新されていない。

(か、そもそもGoogleインデックス更新システムバグってる)


から今俺にできるのは

該当ページがクロールされる可能性を少しでもあげること……。

2ch側に

「このページがクロールされるよう

ウェブマスターツールってのを使って対応してくれ」

って頼むことも考えたけど弁護士に「明らかに無理」って言われた)


以下、試してみたこと。

※※状況が複雑なのと、

まさかGoogle検索がそんなバカなはずがない」という正常化バイアスがあるせいで、

以下のようなアドバイスめっちゃしてもらうんだけど、

どれも効果なかったので一読してみてほしい


・ページ内に本名が実は残っていないか検索したら?ソースコード

 →CTRL+Fでくまなく探したけど残っていない

・どっかのページからはてな次郎」ってリンク張られてるんじゃないの?

 →そういう場合は「リンク貼られてます」って表示が出るらしいけどない

キャッシュスニペットを消すならここから消せるよ!

https://www.google.com/webmasters/tools/removals

 →キャッシュスニペットはもう消えてる。もう消えてる(二度目)

検索結果の一番下に出てくる「フィードバック送信から

検索結果おかしいよ!って送ればいいよ

 →何十回と試したけど効果なし

クロール巡回を促進できるページがあるよ!

https://www.google.com/webmasters/tools/submit-url

 →何十回と試したけど効果なし

  ていうかこのページがまともに機能してくれれば全部解決じゃんかよなんとかしろGoogle

Google名誉棄損だから消してくれっていいよ ここからできるよ

https://support.google.com/legal/contact/lr_legalother?product=websearch&uraw=

 →ここに最後の望みを託して依頼したんだけど、

  結果からいうとマジで不誠実な対応しかしてもらえませんでした。

  どれくらい不誠実かというと返信が全部コピペの上に、会話が噛み合わないの。

  あまりにもひどいから以下引用


俺、Google検索結果からの削除をお願いする

返信(長いので一部抜粋

このサイトに対して法的措置を講じられ、結果として問題の素材が削除された場合

その変更が Google検索結果に反映されるのはサイトの次回クロール後です。

ウェブマスターによる変更後、早急にキャッシュの削除をご希望場合は、

ウェブページ削除リクエスト ツールhttp://www.google.co.jp/webmasters/tools/removalsから

リクエスト送信していただきますようお願いいたします。

俺、「だからそれはもうやってるって。

それでもクロールされてないっぽいから依頼してるんだって

クロールしてくれ」

返信(一部抜粋

懸念はお察しいたしますが、Google では、

検索アルゴリズムを手動で上書きして、

対象URL がご指摘のキーワード検索結果に表示されないようにすることはありません。

Google では、ご要望のあったような形で特定キーワードに対する検索結果を変更することはしない方針です。

名前検索したときに表示されるサイトは、検索キーワードの中の単語の組み合わせ、

文書の内容、その他の数多くの要素に基づき、Google検索アルゴリズムによって関連性のある結果として選定されたものです。

ときには、検索キーワードとの関連性が最も高い結果であっても、検索キーワード内の単語のものを含まないこともあります

俺、「検索結果を恣意的に変更してくれって言ってるんじゃない、

該当ページをクロールしてくれ…頼むから…」

返信(一部抜粋

検索結果の情報サードパーティウェブページにはもう表示されていない場合は、

Googleキャッシュが徐々に更新され、最新のコンテンツ検索結果に反映されるようになります

俺 「だから一年待っても反映されないんだって!!!


という流れです。


いや言いたいことはわかるよ!?俺も社会人から

いちいちひとりひとりのユーザー要望に応えて

検索結果をいじったりできないっていうのはわかるよ!


でもさ!アフィブログとかのコピーサイト

サジェスト汚染とかはあっさり対応してもらえてるじゃん!

検索すればいくらでも例が出てくる)


アフィブログとかのコピーサイト問題よりも

俺の人生って軽いですか!?

上のメッセージでは省いているけど、

必要であれば顔写真付き身分証明書などの書類も提出できます

ってお願いしたんだよ!?!?!?


おそらく、

一年だと短いのでは、あともうちょっとだけ待てば?」

という反応があると思うんだけど、

Google検索フォーラムというところで過去事例を探したところ、

同じような苦しみ方をしている人がたくさんおり、

三年以上待っても消えないという人もいました


一例

https://productforums.google.com/forum/#!topic/websearch-ja/jR3-1mfWciA;context-place=starred

https://productforums.google.com/forum/#!topic/websearch-ja/42c3-xqvgn4;context-place=starred

https://productforums.google.com/forum/#!topic/webmaster-ja/Q5qv_7d8skw;context-place=starred

もっといっぱいある(マジで無数にある)けど

わかりやすいのだけ…


これだけ定期的に同じような苦しみ方をしている人間がいるので

Google問題を把握していないわけがないと思うのですが

なんら!一切の!対策はなし!!!!!!

俺の人生なんだと思ってんの!?ゴミだと!?


上記フォーラムで一番参考になったのはこれ↓

https://productforums.google.com/forum/#!topic/websearch-ja/ORA9iVvsa2g;context-place=starred

> 「2010年7月なので、既に3年以上経過してい」ようと、そのクソ中のクソサイト/ページがグーグル検索システムにとって1/9999京の価値もなければ、10年でも50年でも、1度も再クロールされず、したがってその不都合文言検索に出続けるでしょう — いま現在まさにそうであるように。


とのことです。

10年後も50年後もわけのわからない汚名を着続けるわけですね ははっワロス


以上のような流れでマジで死にたいくらい絶望してたんだけど、

人力検索はてなでは思ってた百倍くらい親身になって考えてくれてマジで感謝だった

お前らがいなかったらやばかった、本当ありがとう

http://q.hatena.ne.jp/1507301385

口調全然違うけど俺だ


以上が事の顛末になります

2chには何も期待してなかったけど、

まさかGoogleっていうちゃんとした大企業

こんなクソみたいな対応してくれないとは思わず

マジで絶望していました


願わくば少しでもこの増田がたくさんの人の目に触れて、

はてな村にいるスーパーハカーが知恵を授けてくれますように…

もしくはGoogle社員の目に届いてGoogle社員が猛省してくれますように


から頼む!!!!!みんなブクマしてくれ!!!!!!ください!!!!!!お願い!!!!!!!!



以下余談

・厳密にいうと、ページの中にはてな次郎の「はてな」だけは残ってるんだけど、

それって、「はてなって食べると美味しいの?」みたいな、俺の名前とは無関係文脈で、

一般名詞として使われているので、たぶん関係ないと思う…

そんな珍しい苗字じゃないしそこだけで検索1p目にヒットするのはおかしいと思う…

・たとえば、「富山 観光」って検索して、

富山温泉」のページがヒットするみたいな、

ページの中に「観光」っていう言葉はないけど当然連想されるよね~みたいなことだったら

まだ諦めもつくんだけど、そういうんじゃない

全然有名人じゃないし示唆されるような情報もない

っていうか俺の名前検索して俺本人(いや俺は犯人じゃないんだけど)がヒットするのそのページだけだし

だんだんGoogleそんな悪くないのかも?俺の被害妄想かも?」って気もしてきた

でも今マジでへこんでるのでブコメあんまり厳しく言われたら悲しすぎるのでそういう場合はやんわり注意してください…

でも俺かわいそうじゃない…?

※※追記

みんな本当にありがとう

林さんに迷惑という意見を見たのでひとまず名前だけ変更しま

2017-10-09

ブックオフオンラインに約300冊売ったので値段がついたものの内訳を載せとく

値段がついたのは約100冊のみ。合計で4000円ちょっとでした。やはりこの程度か感。

講義で使った教科書身バレにつながるのでタイトルを伏せてあります

知見としては、やっぱり専門書は高い。あと、自前で持ち込みできるならたぶんいくつかの店舗に分けて

少しずつ売ったほうが結果的はいい値段になりそう。

状態良い漫画本がたくさんあったのに軒並み値段がつかなかったのは、

たぶん宅配買取倉庫に送られる本の中に同じタイトルの本が腐るほどあるからだと思う。

店舗のほうがタイトル被りの可能性が低いから、その分よい値がつくんじゃないかなと。

あと、時間がある人はメルカリ使ったほうが間違いなく金になると思う。その手間分だけお金になるかはわからないけど。


以下、内訳。


さんかれあ(4) 漫画コミック 1点 ¥1

めだかボックス(6) 漫画コミック 1点 ¥1

ガールズ&パンツァー リトルアーミー(01) 漫画コミック 1点 ¥1

ガールズ&パンツァー リトルアーミー(02) 漫画コミック 1点 ¥1

デストロ246(7) 漫画コミック 1点 ¥1

ピンポン(1) 漫画コミック 1点 ¥5

ピンポン(3) 漫画コミック 1点 ¥5

ピンポン(5) 漫画コミック 1点 ¥150

ポケットモンスタースペシャル(1) 漫画コミック 1点 ¥5

ポケットモンスタースペシャル(3) 漫画コミック 1点 ¥5

夏目友人帳(1) 漫画コミック 1点 ¥1

夏目友人帳(2) 漫画コミック 1点 ¥1

夏目友人帳(3) 漫画コミック 1点 ¥1

夏目友人帳(4) 漫画コミック 1点 ¥1

夏目友人帳(5) 漫画コミック 1点 ¥1

夏目友人帳(6) 漫画コミック 1点 ¥1

刻刻(1) 漫画コミック 1点 ¥5

星を継ぐもの(1) 漫画コミック 1点 ¥5

星を継ぐもの(2) 漫画コミック 1点 ¥5

星を継ぐもの(3) 漫画コミック 1点 ¥50

星を継ぐもの(4) 漫画コミック 1点 ¥300

東方鈴奈庵 ~Forbidden Scrollery.(1) 漫画コミック 1点 ¥5

東方鈴奈庵 ~Forbidden Scrollery.(2) 漫画コミック 1点 ¥50

東方鈴奈庵 ~Forbidden Scrollery.(3) 漫画コミック 1点 ¥200

“文学少女”と飢え渇く幽霊 本・書籍 1点 ¥1

ICO 霧の城 本・書籍 1点 ¥1

TOEFL TEST必須英単語5600 本・書籍 1点 ¥300

TOEIC TESTレベル問題集 700点突破(リスニング編) 本・書籍 1点 ¥10

(某講義教科書) 本・書籍 1点 ¥50

TRICK Troisi`eme partie 本・書籍 1点 ¥1

TRICK 劇場版 本・書籍 1点 ¥1

TRICK新作スペシャル 本・書籍 1点 ¥1

Unity4プログラミングアセット活用テクニック 本・書籍 1点 ¥50

あかんべえ(上) 本・書籍 1点 ¥10

おそろし 三島変調百物語事始 本・書籍 1点 ¥5

ちはやと覚える百人一首ちはやふる公式和歌ガイドブック 本・書籍 1点 ¥190

(某講義教科書) 本・書籍 1点 ¥100

となり町戦争 本・書籍 1点 ¥1

アヒルと鴨のコインロッカー 本・書籍 1点 ¥5

イラストでめきめきわかる工業英検4級 本・書籍 1点 ¥260

キタミ式イラストIT塾 基本情報技術者(平成25年度) 本・書籍 1点 ¥5

ゲームの作り方 改訂版 Unityで覚える遊びのアルゴリズム 本・書籍 1点 ¥500

(某講義教科書) 本・書籍 1点 ¥50

テンペスト(上) 若夏の巻 本・書籍 1点 ¥5

トリック(2) 本・書籍 1点 ¥1

ハガキで作るよく飛ぶ飛行機 大人工作 本・書籍 1点 ¥20

ハリー・ポッターと不死鳥の騎士団 上下巻2冊セット 本・書籍 1点 ¥20

ビッグ・ファット・キャット世界一簡単英語の本 本・書籍 1点 ¥5

プチ哲学 本・書籍 1点 ¥1

ボーン・コレクター(下) 本・書籍 1点 ¥41

ボーン・コレクター(上) 本・書籍 1点 ¥10

悪魔が来りて笛を吹く 本・書籍 1点 ¥10

嘘つきみーくんと壊れたまーちゃん(3) 死の礎は生 本・書籍 1点 ¥1

応用情報技術者 パーフェクトラーニング 過去問題集(平成27年度 秋期) 本・書籍 1点 ¥20

化物語(下) 本・書籍 1点 ¥5

夏への扉 本・書籍 1点 ¥90

解夏 本・書籍 1点 ¥5

楽しい古事記 本・書籍 1点 ¥10

帰天城の謎 TRICK青春版 本・書籍 1点 ¥10

(某講義教科書) 本・書籍 1点 ¥700

犬神家の一族 本・書籍 1点 ¥10

後宮楽園球場(1) ハレムリーグベースボール 本・書籍 1点 ¥5

(某講義教科書) 本・書籍 1点 ¥10

今夜はだれも眠れない 本・書籍 1点 ¥30

殺人鬼 本・書籍 1点 ¥110

新TOEIC TEST 単語特急(3) 頻出語言い換え集 本・書籍 1点 ¥20

新TOEIC TEST 読解特急(2) スピード強化編 本・書籍 1点 ¥30

新TOEIC TEST 文法特急(1) 1駅1題 本・書籍 1点 ¥70

真・バトル奥義新書 勝てるポケモントレーナーに訊く 本・書籍 1点 ¥1

精霊の守り人 本・書籍 1点 ¥90

千里眼 The Start 本・書籍 1点 ¥1

千里眼 ファントムクォーター 本・書籍 1点 ¥5

千里眼 ミッドタウンタワーの迷宮 本・書籍 1点 ¥5

千里眼 堕天使メモリー 本・書籍 1点 ¥10

千里眼 美由紀の正体(下) 本・書籍 1点 ¥10

千里眼 美由紀の正体(上) 本・書籍 1点 ¥10

千里眼の教室 本・書籍 1点 ¥10

千里眼の水晶体 本・書籍 1点 ¥10

大学1・2年生のためのすぐわかる数学 本・書籍 1点 ¥10

(某講義教科書) 本・書籍 1点 ¥300

池袋ウエストゲートパーク 本・書籍 1点 ¥10

嶋浩一郎のアイデアのつくり方 本・書籍 1点 ¥5

半熟作家“文学少女”編集者 本・書籍 1点 ¥5

浜村渚の計算ノート 本・書籍 1点 ¥10

復讐ワイングラスに浮かぶ 本・書籍 1点 ¥1

分冊文庫版 姑獲鳥の夏(下) 本・書籍 1点 ¥10

分冊文庫版 姑獲鳥の夏(上) 本・書籍 1点 ¥10

分冊文庫版 魍魎の匣(下) 本・書籍 1点 ¥1

分冊文庫版 魍魎の匣(上) 本・書籍 1点 ¥1

分冊文庫版 魍魎の匣(中) 本・書籍 1点 ¥1

文明の衝突と21世紀の日本 本・書籍 1点 ¥1

変態王子と笑わない猫。(6) 本・書籍 1点 ¥10

僕は友達が少ない(特装版)(6) 本・書籍 1点 ¥1

毎日1分TOEIC TEST英単語860点クリア 本・書籍 1点 ¥5

名問の森 物理 改訂版電磁気・熱・原子】 本・書籍 1点 ¥5

模倣犯(1) 本・書籍 1点 ¥5

予知夢 本・書籍 1点 ¥10

(某講義教科書) 本・書籍 1点 ¥5

その他本・書籍バーコード無し・商品データ無し等) 本・書籍 1点 ¥5

2017-10-03

エンジニアが売りて市場って言うから転職活動してみた

「得意な言語はなに?なんで得意だと言える?」

「こういう問題解決する為にどんなアルゴリズムが考えられる?」

「次に来ると思ってる技術はなに?その理由は?」

ぐえー 死んだンゴ

2017-09-29

TechCrunch JPタイトルから hiwa 氏の翻訳か否かを深層学習推定する

追記 (9月30日 22:00)

最近タイトルを読むだけで hiwa 氏が翻訳したものかどうかがわかるようになってきた。

例えば、「死んだはずのBlackBerryがソフトウェア企業として蘇生、業績も株価も好調」というタイトルは「死んだはずの」という挑発的な言葉遣いは hiwa 氏だろう(そしてそのような文句は元記事にはないだろう)と推測したり(確認してみると元記事タイトルは "BlackBerry, yes BlackBerry, is making a comeback as a software company" であり、「死んだはずの」や「業績も株価好調」といった文言は含まれていない)、「GoogleがAmazonのEcho ShowからYouTubeを突然取り去る、サービス規約への違反だそうだ」というタイトルでは「〜〜〜、〜〜〜」という独特な文の接続や、文末の「だそうだ」という物言いから氏であろうと推測している。

私が推測できるのだからアルゴリズムでも可能ではないだろうか? そう考え、機械学習の中でも特に深層学習を用いて推定可能である検証した。

タスク

タイトル文字列(本文情報は用いない)からその記事翻訳者が hiwa 氏であるか ( = 1) そうでないか ( = 0) を学習予測する二値分類問題

学習データ

TechCrunch Japan記事データ 11,993 件。うち 3,781 件が hiwa 氏が翻訳したものである

手法

入力文は vanillaMeCab [1] を用いて分かち書きを行い、それぞれの単語は「日本語 Wikipedia エンティティベクトル」[2] を用いて 200 次元に埋め込んだ。語彙数は 17,272 だった。

予測モデルは 32 次元の LSTM [3]。dropout 率は 0.5。文の最大長は 120 単語zero-padding を行い、バッチサイズ 32 の Adam [4] で最適化した。

LSTM の実装には keras 公式に用意されたもの [5] を参考にした。

結果

精度 0.85, 再現率 0.80, f値 0.82 とまずまずの精度で予測可能であることがわかった。

ちなみに、 CNN による推定では 精度 0.84, 再現率 0.80, f値 0.82 という同等の結果を得た。

結論

機械学習を用いることで、記事を開く前に hiwa 氏が翻訳したものであるか否かがまずまずの精度で分類できることがわかった。深層学習はすごい。

参考文献

[1] MeCab: Yet Another Part-of-Speech and Morphological Analyzer

[2] Long Short-Term Memory

[3] 日本語 Wikipedia エンティティベクトル

[4] [1412.6980] Adam: A Method for Stochastic Optimization

[5] keras/imdb_lstm.py at master · fchollet/keras · GitHub

anond:20170929030622

アルゴリズムっつーか、何秒間隔で重み付けするかで結果は変わるだろ。

増田過疎ってるから短い間隔で統計出したら増田トレンドにチャングが入っててもおかしくない、みたいな

Yahoo リアルタイム

ランキングとか人気ツィートに異常に韓国ネタが多いんだけど

あれのアルゴリズムってどうなってんの?

今1位になってるチャングとかい韓国アイドルの犬なんか

ツイッターでは全然トレンドに入っているように見えないのに不自然すぎる

2017-09-20

残業しなくなったら仕事が減った話

残業を減らせば業務効率が上がる」という言葉をよく聞くので実践してみた。

業務効率は確かに上がった。

「定時に帰る」ということが頭にあるので、

からやると中途半端になる仕事に手を出さなくなった。(結局残業になるから)

結局、翌日にガッツリやれば想定より短い時間で終わることが多かった。

自由時間が増えたかPythonを始めた。

競技プログラミングというものに手を出してみた。

アルゴリズム勉強をしてみた。

夢中で勉強した。楽しかった。



今月、明らかに任される仕事が減っている。

「定時に帰るから大きい仕事を任せづらい」と思われている気がする。

(チームで対応する案件場合、定時後に問題が発生した場合対応できないから。)



やっぱり残業必要なんだ。と思う。

評価や信頼、残業代のために。

そういえば、定時で帰ってる人で仕事のできる人はいない気がする。

まだ、社会人2年目だけど、

いや、だからこそ、周りからの信頼を得ることに心血を注いだほうが懸命な気がする。

それに最も有効なのが残業なんだろう。

久々に定時で帰って、そんなことを考えた。

SEという経歴の人を事務職で何人か採用したんだが

揃いも揃ってIF関数を使っていろいろ表示させるようなエクセルシートすら作れない

プログラムがかけるってことはアルゴリズム感覚を身に着けているのだから

言語が変わっても文法がわからないだけで、

どういう順番で処理をすれば動くとか考えられるものじゃないの?

ちなみにそいつらみんなJavaを使ってたらしい

Javaってアルゴリズム感覚くてもかけるの?

2017-09-16

株式会社はてな株主構成から見るはてな実態

今戯れに時価総額と持ち株比率から換算した資産表作った

近藤 淳也 66.33% 4482581400円 ○

(株)はてな 6.59% 445352200円

毛利 裕二 5.98% 404128400円

梅田 望夫 4.30% 290594000円

栗栖 義臣(社長) 2.61% 176383800円 ○

大西 康裕 1.97% 133132600円 ○

伊藤 直也 1.79% 120968200円 ○

田中 慎樹 1.41% 95287800円

田中 慎司 1.30% 87854000円 ○

小林 直樹 1.15% 77717000円

お金の額面はともかくの話なんだけど、

○をつけたのは、はてなコードを書いたことがあると"思われる人"。「名前 プログラミング」で検索して有意な結果が出た人に○つけた。各株主の詳細知りたい人は適当にググって

で、さら


はてな年収は524万円が平均年収です。(有価証券報告書調べ)

http://heikinnenshu.jp/joho/hatena.html

あると好ましい知識経験

スクリプト言語(主に Perl/PHP/Python/Ruby/JavaScript)によるアプリケーションライブラリ開発の経験

ScalaGoにおけるアプリケーションライブラリ開発の経験

iPhoneアプリ、もしくはAndroidアプリの開発経験

UNIX系OSRDBMS特に LinuxMySQL)についての基礎知識

オブジェクト指向プログラミングの基礎知識

コンピュータサイエンスアルゴリズムデータ構造分散技術自然言語処理技術機械学習データマイニング型理論)に関する基礎知識

ネットワーク技術HTTPDNSTCP/IPなど)についての基礎知識

大学卒/275,000円〜

http://hatenacorp.jp/recruit/fresh/application-engineer-entry

って、エンジニア待遇悪すぎじゃない?

この毛利 裕二という人の持ち株の資産新卒給料(計算だるかったか計算からボーナス抜いたけど、手取り分で考えたらボーナス分くらいは消えるだろう)で稼ぐとしたら122年かかるし、梅田 望夫という人は88年かかる。本当にこの人たちにはそれほどの価値(上にあげた新卒に求めるやたらと高いスペック)分の価値があるのか?いや、価値があると思ったから株をあてがったんだろうけど...

まぁなんていうか...、はてなのエンジニアのみなさんお疲れ様です...業務がんばってください

完全に外様の俺から言えるのは"エンジニアに"もっと給料たくさん払った方がいいんじゃないかということだけです

2017-09-13

ブログの月間PV数(スキルアップBLOG)がドンドンと増えている件を考察

ありがたいことにスキルアップBLOGの月間PV数(平均約15万PV)が、ここ数ヶ月でドンドンと増えています

http://www.inoue311.com/

15万なんて簡単だという人もいるでしょうが、これは選べれた人のみが勝ち取れる数字なのです。

やはり継続は力なりでしょうか。

ツイッター等で当記事を紹介して頂いている方もおられるので、本当に嬉しい限り。私自身も為になるブログ記事や素晴らしい記事は紹介しています

Googleアルゴリズム変更で、月間PV数が減ったというブログもちょくちょく聞きます

そんな中でこのスキルアップBLOGはなぜ月間PV数が増えてきているのかを考察していきます

ブログの月間PV数(スキルアップBLOG)が増えている理由



このスキルアップBLOGでは基本的に、ブログ運営自己啓発的なことを好きなように書いています

世の中には様々な考え方がありますので、私の考え方もそのうちの1つに過ぎません。このようにスキルアップBLOGでは、好きなことをドンドンと書いていくのが楽しくてたまりません。

その気持ちを察してか、このスキルアップBLOGファンになって頂いている方も日々増えているのが現状。

コメントもたくさん頂きますし、本当に感謝しかありませんね。


コメント等を貰えるとサイト評価は上がる?




コメントを受け付けないブログサイトは多いものですが、このスキルアップBLOGではコメントを受け付けています

そうすることによって、サイト評価が上がる可能性も出てくるのです。あくまでも可能性なので一概にはいえませんが、実際に月間PV数が増えてきていることから可能性0とは言えません。

なぜコメント等が貰えるとサイト評価が上がるのか。

もちろん、これは私の独断偏見での考察ですが、まずは滞在時間が増えるというものコメントを書いて頂いてる間も滞在時間に含まれるので、コメントをたくさん書かれるほど滞在時間は増えていきます

評価の値に滞在時間も含まれるので、あながち間違いでもありません。滞在時間けが評価の値ではありませんが、少なくとも滞在時間が短いよりは長い方が良いに決まっています


滞在時間を増やすための長文記事無意味




それならと滞在時間を増やすために長文記事を書けばいいと思う人もいるでしょう。

間違いではありませんが、長文記事だと余程の文章力や内容ではない限り、誰も最後まで読んでくれません。

それどころか途中で離脱するので離脱率や直帰率が下がってしまます

たまに長時間動画を貼り付けるブログ記事もありますが、誰もそのブログサイトでは見ません。

滞在時間が短い人は、ぜひコメント欄を導入することをお勧めします。


ブログの月間PV数(スキルアップBLOG)がドンドンと増えている件を考察のまとめ




今の時代は本当に情報収集には困りません。

とくにツイッターSNSの中でも最強の情報収集ツールではないでしょうか。

そのツイッターのおかげでブログの月間PV数もドンドンと増えていますし、とある情報最近DM(ダイレクトメッセージ)等で聞いては仕入れています

そのある情報はまた近いうちにブログ記事しますが、やはりツイッターでの情報収集力は素晴らしいですね。

今のツイッター犯罪者さえも捕まえることもできますし、悪いことをしている人の情報簡単に手に入る世の中。

とにもかくにもこのスキルアップBLOGの月間PV数がドンドンと増えていることに日々感謝しつつ、これからも楽しくブログを書いていきたい今日この頃です。


私のように月間平均15万PVという超人ブロガーになるために、みなさんもブログを書きましょう。
アーカイブ ヘルプ
ログイン ユーザー登録
ようこそ ゲスト さん