もともとは、2ちゃんねる系のまとめサイトを巡回して、Yahoo!ニュースのようなサイトを作っていました。(現在も鋭意開発中です。)
コンテンツの内容を解釈して自動的にジャンル分けをして・・・などと、出来るかわからない壮大なアイデアを実装しているので、いまだに完成時期が見えて来ません。
画像収集処理を作っている時に「これでエロ画像を集めたら面白そう」と思いついてしまいました。思い立ったら、すぐにやりたくなるのが人間の性というやつです。基本的な処理はほとんどできていたので、割に短期間で作成できました。エロ画像をどうせ集めるのなら、目的をもって役に立つサイトにしようと思い立ち、おなぬーをするためのWEBサービスにました。
作成したもう一つの目的として、月間10万PV程度のサイトを自分で運営したいという思いもありました。安直ですがエロ系のサイトであれば、それが可能なのではと考えた次第です。
せっかくサイトを作ったのですが、エロ系のサイトは告知をするのが難しいとう事実を作り終わってから知りました。私自身もブログをやっているので、そこでお知らせをしても良いのですが、ブログの趣旨にあわないのと、PVがとてつもなく低いという理由で断念しました。
匿名ダイアリーは、かなりのPVがあるので、作ったサイトの告知ができるのではと思い匿名ダイアリーを書いています。
せっかく作ったサイトですから、皆さんに利用してもらいたいし、役に立つサイトにしたいと思っています。ですので、サイトを見たらご意見をいただけたら嬉しいです。
もう、15年以上PHP(PHP FIと言う名称の頃からのユーザーです)でプログラムを作ってきました。PHPが持っている気軽さや気楽さは大好きなのですが、誰もが好き勝手なコードが書けるというデメリットもあります。プログラム言語にはある程度の厳しいルールがないと将来にわたってメンテナスしていけるプログラムを作るのは困難です。
せっかく新しプログラムを作るのだから、新しいプログラム言語で作ることにしました。
ある程度、厳しいルールがあって、誰もが同じようなプログラムが作れる言語はなんだろうと考えていくとPythonとRubyが候補に上がりました。
Rubyはできるだけ手数を少なくプログラムを作ろうという基本思想があります。私の感覚では、熟練したプログラマが使う言語という印象が強いです。
Pythonは、プログラマのレベルを問わず、熟練プログラマも新人プログラマも同じようなプログラムが書けるプログラム言語という印象でした。
私自身も将来誰かに教えられるようにと、今回はPythonを使用言語として選択しました。また、裸のPythonで書くのも面倒そうですので、フレームワークとしてDjangoを選択しています。
「おなりん」は、そんな思いを乗せて以下の環境で構築しました。
サーバー | さくらのVPS(1G) |
プログラミング言語 | Pytyhon 2.7.5 / Django 1.5.1 |
その他ツール | Bootstrap, jquery, wookmark, colorboxなど |
Webサーバー | Apache 2.2 |
データベース | MySQL 5.5 |
「おなりん」は、登録されたまとめサイトを定期的に巡回して、各エントリーから記事内の画像URLを抽出しています。取り出すのはURLだけで、画像の直接ダウンロードは行いません。ですので、リンク元の画像がなくなれば、「おなりん」からの表示もなくなります。
各サイトのエントリーはRSSから取得しています。各記事のHTMLをPythonライブラリurllib2を使って取り出し、HTMLから正規表現で画像URLを抽出しています。
サイトによっては記事画像のHTMLに決まった書き方がなされていないために、余計な画像を抽出してしまうこともあります。おかず画像の抽出精度は徐々に上げて行きたいと思ってます。
当初「おなりん」は、Amazon EC2(t1.micro)で構築する予定でした。構築までは完了したのですが、今ひとつ体感速度が上がらないのです。すでに利用しているさくらにVPSと比較したところ、3倍くらいの速度差(abコマンドの実行結果)があったので、Amazon EC2の利用を諦めました。
Amazon EC2は1年ほどの無料利用期間があります。これを過ぎると課金されていくのですが、Amazon EC2(t1.micro)を1ヶ月動かし続けると4000円近い料金が必要になります。さくらのVPS(1G)は1年で1万円程度です。3倍早くて価格は4分の1なら、チープな私はさくらのVPS以外選択余地がありません。
でも、拡張性を考えるとAmazon EC2も捨てがたいのです。
Pythonはインデントでプログラムブロックを表すます。他の言語のようにカッコを使いません。IFやFORを使ってインデントが深くなると、どんどん右寄りになってきて、全体的に斜めなプログラムが出来上がります。最初は見慣れずに違和感を感じましたが、慣れればそうでもありません。
ただ、ネストしたIFでインデントが深くなりすぎると、インデントの位置で意図しない結果が出るので注意が必要です。慣れてしまえば、使いやすい言語です。
Djangoは良いフレームワークだと思います。モデルを定義してしまえば、モデルのメンテナンスを行う、管理画面が一緒に生成されます。テンプレートタグなどを自作すれば、かなり深いところまで手を加えることが可能です。慣れれば扱いも楽なので個人的には気に入っています。
「おなりん」は、まだ作ったばっかりで、テストもまだ十分に行えていません。ですので皆様にも使っていただき、問題点があれば教えて頂きたいと思っています。開発しているマシンがmacなのでIE系のテストは皆無です。IEの方、ぜひともレポートをください。
レポートや感想などがありましたら、「おなりん」のサイトの下にある「お問い合わせ」リンクから送付をお願いします。また、巡回してほしいサイトも募集しています。ただし、日本国の法律に準拠したサイトに限らさせて頂きます。
機能的に今後は、画像の人気ランキング機能を組み込む予定です。また、サイト運営の足しにしたいのでひっそりと広告を入れます。
また、リクエストがあれば、ソースコードをGithubに公開したいと考えています。
長文を読んでいただき、ありがとうございました。
「はじめましょう!」ボタンを押した所で何も表示されないんだが何なのこれ。 http://www.fastpic.jp/viewer.php?file=8307327805.png
表示に時間かかるっぽいよー 自前で本画像どころかキャッシュすら持ってないって書いてあるし
使っていただきありがとうございます。 一応、memcacheを使って入るのですが、、、 もう少し早く表示できるように努力します。
使っていただきありがとうございます。 確かに表示されていませんね。ブラウザはサファリのようですね。調査します。
上でスクリーンショット載せたものですが、めっちゃ改善されててワロタ。 お疲れ様です。
確認ありがとうございます。 不具合やリクエストがあったら気軽にお知らせください。
みてみたら、新潟みなもとの五十嵐さんなのか。 品行方正だね! http://d.hatena.ne.jp/manabu55/
ごめんなさい。たぶん人違いです。
ニートがエロサイトを作ったら結構デカいサイトに成長した http://anond.hatelabo.jp/20130922195049 Ruby on Railsで可愛い子が集まるエロサイトを公開するまでの24H http://anond.hatelabo.jp/20130918212415 ...
これ全部同じ業者のステマなの? 何度もやってるってことは増田ステマは効果あるってことなのか?
まあ、瞬間的にはあるんじゃない? こうやって晒すことで、なんなんだよ、とか言いながらも開く人は居るし。 軽く新着に載るよりも瞬間的なビューは取れそう。 誰か発表してくんね...