2021-05-17

教えてパソコンエロい人(多分AIとか)

5chにはたまに「ソムリエスレ」と呼ばれるスレがあって

依頼者が○○で××な作品(漫画小説映画など板による)教えてください、と依頼して

住人が当てはまる作品を教える、という営みが数十スレにわたって行われ続けている。

データベースとして個人的にはかなり有用だと思っているので、いつかこれを検索可能状態にまとめたいと思っている。

だがプログラミングさっぱりで何から勉強しないといけないかからない。

多分AIかな…みたいな…

やりたいこととしては

・全ての過去ログを横断で検索できる状態にする

レス内に「お願いします」とあるレスを【依頼レス】とする

・【依頼レス】にアンカーをつけてるレスを【回答レス】とする

・【依頼レス】の依頼時のキーワードをなんとかして抜粋する

・【回答レス】内の作品名をなんとかして抜粋する

・【依頼レス】のキーワード、または【回答レス】の作品名で検索することができ、それぞれの【依頼レス】とそれに連なる【回答レス】を一覧できる

・できれば【依頼レス】のキーワードタグにして、よく検索される語がでかく表示されるようなアレがあるとよい

・多分上記だと漏れる依頼と回答もあるので、最終的にはwiki掲載して手動のメンテを入れる

という感じ。

これを作るために何を勉強しどんな環境必要なのか、御指南いただけないだろうか。

簡単HTMLCSSJavascriptはかじったがそれ以外の知識は全くない。

なんか既存webサービスを使って近しいものができるならそれに越したことはないが、

都合のいいサービスはなくても勉強してできるならやってみたい。

お金はそんなにたくさんはかけられないが一桁万円くらいなら(貧しくてすまん)

  • 似たようなことやってるゲーム系のまとめサイトいっぱいあるような

    • そうなのか、ゲームやらんので疎いかも もしよかったら参考に教えてください

  • クローラーでつくれるでしょ https://qiita.com/Octoparse_Japan/items/a9441a60ff5b42454a56

    • クローリングとかスクレイピングという語彙にいまはじめて触れた!ありがとう! 何となく朧に道筋が見えた気がする ちなみに、特に定型ではない書き込みからキーワードを抽出する...

      • 形態素解析でぐぐれ。APIかライブラリ使え。

        • 掲示板ログからクローリングしてデータを抜粋 ↓ 抜粋したデータをそれぞれ形態素解析して 【依頼】特徴的なワード 【回答】作品名 を抜き出す ↓ なんとかしてwikiに流し込み 作業...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん