「テキストマイニング」を含む日記 RSS

はてなキーワード: テキストマイニングとは

2024-10-07

おまえら政治の話やめろ

もっとダイレクト生活の中で何に困ってるのか書けよ。

金ないは、もう一歩踏み込んで、何に金を使ってるのか、もっと金があったら何するのか書け。

テキストマイニングする方の身になって書いてくれ。

どこが政権取っても、テキストマイニングするのは俺なんだから

頼むから

2024-04-02

anond:20240402085025

ICTのことはよく知らないけど、テキストマイニングだとmecabなどを使って「全部ひらがなにする」

2020-11-03

鬼滅の刃がヒットした本当のところ

鬼滅の刃が爆売れしているのはなぜか?というのを論じる記事をたまに見るが、どれも本質的ではない。惜しいものならあるのだが。

今回は、ヒットした理由の本当のところを述べてみたい。

結論から言うと、愛や憎しみの表現が上手いからだ。

鬼滅の刃は、他のジャンプ作品に比べて愛憎や人間同士の繋がりを描いた場面が多い。

そのうえで、キャラクターが魅力的であり、バトル描写があり、一応は恋愛要素もある。

これでウケないはずがない。

私の意見だけでは根拠に乏しいので、引用をさせてほしい。

ベストセラーコード』という、アメリカ言語学者フリージャーナリストによる共著だ。テキストマイニングという数学アプローチにより、実際に世にウケる作品パターンについて記した本だ。1万冊以上の小説スキャンして機械分析にかけている。

少し長い。結論最後の方にある。

 しかし、このふたり(注:書中で紹介されているベストセラー作家のうち2名)の共通点のうちもっとも興味深いのは、彼らが上位で使っているトピックが、ベストセラー予測するにあたって決め手になるとモデル判断したトピックに一致することだ。といっても、ベストセラー作家特有トピックという意味ではない。売れない作家もよく使うトピックからだ。しかし、非ベストセラーにくらべると、ベストセラーに出てくる率が高いので、予測するときには威力を発揮する。書き手にとっては無視できないトピックといっていいだろう。セックス犯罪といった人目をひくものにくらべると、驚くほど平凡なそのトピックは、人と人との交流関係を示すものである。だが、人間関係といっても、ロマンチック恋愛情熱といった激しい感情を伴うものではないし、先生と生徒、社員上司といった型どおりな関係でもない。それは人間同士のつながりを感じさせる近しい関係だ。予測するにあたってもっと重要なこのトピックが出てくるシーンには、互いに親しみや愛情を感じ、絆で結ばれている人々が登場する。

 【ベストセラーコード「売れる文章」を見きわめる驚異のアルゴリズム】 p.89~p.90


著者は、これ以降の章においても、ベストセラーになる作品の傾向を繰り返し述べている。人間同士の温かい関係性という要素が、作品がヒットする最大の要因であると。

同感だ。これまで多くの漫画アニメ映画小説を嗜んできたが、面白かった作品というのは、どれもみな人の繋がりの描き方に重点を置いている。

それに比べれば、作画が美しいとか、戦闘シーンに迫力があるとか、性的描写というのはおまけに過ぎない。

もう一点だけ述べるとしたら、「感情」だろうか。鬼滅の刃は、とにかく感情が動かされる。ページを捲りながら、複雑な気分になって悶えたりすることが私の場合はよくある。

あとひとつだけ引用させてほしい。こういうのは客観性大事だ。

 脚本の基礎を学ぶ時間はそろそろ終わりにしよう。今から脚本執筆術で本当に大事なことに焦点を当てよう。本当に大事なこと、それは脚本を読む人に感情的な体験提供するということなのだ。読んだ人の心がいろいろと感じたから、それを良く書けた脚本と呼ぶのだ。

 【「感情から書く脚本術 心を奪って釘づけにする物語の書き方】 p.14


先に挙げた本は科学者寄りの人が書いたもので、こちらは実際の脚本家が執筆した本になる。

こちらの著者は、感情を揺さぶものこそが良いストーリーであると、本書の中で繰り返し述べている。

例えば、『鬼』の描き方がそうだ。鬼滅の刃に出てくる鬼のほとんどに過去がある。凡百の作品では、敵は倒しておしまいであり、過去が用意されるのは重要キャラクターに限られる。

でも、この作品では、鬼と戦っている最中モノローグが流れ、敵が歩んできた道のりや、鬼になった理由や、鬼になってからの労苦が描かれる。こんな作品は今までにあっただろうか。いや、ない(反語)。

鬼滅の刃の冒頭は退屈だ。地味な情景からスタートする。

山に住んでいる少年が炭を売りに出るところから始まって、売りに出た先の町では可愛がられていて、炭治郎の人柄ゆえに炭は無事に売れて、帰る頃には暗くなっていて、山に登ろうとしたところで〇〇に泊まっていくように言われ…その夜、家に男が2人、何も起きないはずがなく…

修行シーンも長々と描かれて退屈に感じることもある。それでも、上に挙げた名作の条件をばっちり満たしているからこそ、ジャンプで生き残ることができた。

世でいうところの、売れる要素、売れない要素というのは上っ面でしかない。連載当時の編集者や読者は『本物』を見抜くことができた。だから、同じくこれが本物であることを見抜いたアニメプロデューサーによって、潤沢な予算スケジュールをもってアニメ化されたのだ。

鬼滅の刃評価については、当記事のほかにはてな匿名ダイアリーや、note記事や、個人ブログなどをいろいろ読んでみるといい。

個人的には、Amazonカスタマーレビューが一番参考になった。以下のURLを載せて終わりにする。

漫画

ブルーレイディスク

プライムビデオ

なお、漫画版において低評価レビューが顕著であるが、彼らの正体は売れない漫画家かアマチュア作家だ。

自分作品が世に評価されないので、人気作品の粗を探して叩くことで自尊心を保っている。

魔法科高校の劣等生』など、アマチュア作家出世作ありがちな現象だ。目にはつくが気にする価値はない。

2020-10-16

MT4あるある、凄いとおもったインジケーターが動かない問題

MT4には無数のインジケーターがあるのだが、

驚くほど動かない、あるいは正しく表示されない、またはまったく表示されないことが多い。

 それなのに、各国内ブローカーは外部インジケーターからとまったく手をつけようともしない。

お前らの提供するインジが凄いなら誰も外部のインジを利用しようなんて思わないわ、タワケ、、、><

 先日もみんなのFXが華々しく新しいインジを発表した。

ヒートマップはまだいいだろう、これはテキストマイニング系のAIの考えから来ているらしい。

使えるかどうかはまだ判らんが、

 問題通貨強弱だ、これどこが新しいの?

よくよく突っ込んでみると、旧トムソンロイターから受け売りらしい。

これ、使える?凄いといえるほど新しい何かがある?

とても思えない。

 話は変わるが、何も新しく出て来たものがすべていいものとは限らない。

古い物の中にもブログ解説し、時には改良までした素晴らしいものがあるのだ。

だが、動かない、データーを読まない、ただしく表示されない、あるいはまったく動かない。

 そしてなぜか、ブログは2.3年前に更新が止まっていて連絡が付かない、、、、><

泣けてくるとはこういうことだろう、、、。

 ほんと頭にきたので、KOF2020でこういうのが出来る人を探そうかと思ったくらいだ、

が今年はオンライン開催、、、、>< オーイ

 ということで、怒りの日記を書いてる訳だが、はてなの人 どなたか動かせるようにしてもらえませんか。

https://yasufx.com/mz/indexes-v7l

ちなみに、FXOPENのデモ口座ならというので

わざわざ開設して、通貨すべて表示したけど表示されません、、、>< 

なんとかしてくれ、はてなさん

2019-05-19

はじめてのかんたん3Dモデルづくりのようなもの

結構前に3D美少女簡単に作れると話題だったVカツをいまさら触ってみた。

気づいたら半日経っていたレベル面白かった。美少女を作り出したり(今回は模写だけど)、自在に3Dモデルが動かすのは面白い! プリセットされたモーションで視点マウスグリグリ変えると「すごい、そこに居る」って感じがする。


仕事で使っている3DCADより操作性が良かったので、作りながら時々スカートの下からのぞき込んだりしてみて幸せ。以前モンタージュみたな2Dのキャラメイクで好き放題にパラメータをいじったら、いまいち萌えない属性キメラ誕生してしまった。それで、キャラクターデザインって難しいんだなあということを身をもって知った。だから今回はお気に入りキャラを模写することから初めて見たんだけれど、やっぱり生き物(かわいい)を作るのは難しい。顔の輪郭とか目とかパラメータが多すぎて、お手本のキャラと3Dの何が違うのかわからなくなった。

うーん、美少女ゲシュタルト崩壊してしまった。目のパラメータの多さを見て、目は口程に物を言うということなのだなと思い知らされた。胸の大きさと体形のパラメータを見たら肉体に対する熱いこだわりみたいなものを感じたし、言語化しずらいけどけど体形って実は個性が宿るんだよなあと痛感。


それで、パラメータを変えてたら身長や足の長さを滑らかに変えてお姉さん体形からお子様体形までスムーズに変えて一番かわいいポイントがあるんだなとわかった。3Dで身長が変わる系の変身やったらおもしろそうだな。3Dだと高身長ガッシリお姉さんに見下ろされる視点も華奢な低身長妹をゼロ距離で見込む視点自在なので、そこがいい。


「隣の吸血鬼さん」のソフィーというキャラを模写したつもりだった。しかし、出来上がったものソフィーちゃんコスプレをしたちんちくりんな女の子になってしまった。服装は黒ワンピパンストで、控えめ体形に銀髪で赤目で若干ジト目気味というキャラ一見簡単なように見えて難しすぎた。髪型服装ももちょっと自由度が欲しかった。完コスしたのにイマイチ再現度の上がらないコスプレイヤーを見たときコレジャナイ感を味わえたのでお得と思うことにした。つぎはもうちょっと特徴がハッキリしたキャラリベンジするかな。


モデルを作った後は着せ替えしたりモーションで動かしたりしてみた。いろいろと衣装を変えてみると、やっぱ美少女は何着てもかわいいわと当然の感想を感じた。さらに、プリセットしたモーションでキャラを動かすとやっぱ美少女は何してもかわいいわと当たり前のことを思った。エアギターのモーションがあって声出して笑ってしまった。モーションには女性っぽい動きと男性っぽい動きがあり、その違いを見ると面白い。美少女3Dモデル男性っぽい動きをさせると、「こんなにかわいいのに中身オッサンなの!?」感があって胸が熱くなる。黒ワンピ美少女に大きな剣を持たせて躍動的なモーションをつけると、マジでかわいい。後ろから見ると美少女に守られたい願望満たされますよ、いっそもう切り捨てられたいレベルですよこれ。


ちょっと半日かけたのは、美少女ゲシュタルト崩壊引き起こししまってやりすぎだったかなと思う。でも、やっぱ自分の思い通りの3Dモデルが画面上でグリグリ動いて、下からのぞき込んでみたりしたら楽しい。モーションがついたらすごくかわいい。もうね、つくる過程癒し

今後もチマチマとキャラを作って、最強にかわいいキャラをつくっていこうと思う。





次の宿題は、

2017-09-19

増田テキストマイニングして投稿者パターン判別

https://anond.hatelabo.jp/20170918004847

続き

テキストマイニング勉強して増田に頻出する人間の種類をパターン化しようとしてるんだけど、方法が思いつかない

スクレイピングデータを取る→mecab形態素解析して頻出名詞データ化する→頻出名詞によって元増田がどのカテゴリーの属するのか判定する

最後カテゴリーを作るのがむずい。カテゴリー名前を人力でつけようとするから難しいのか。ある程度頻出名詞が似通ったら(閾値を作って似てるの基準を作る)適当に振った名前group1,group2等に放り込むか。頻出名詞が似てるかどうかを判定するのは何の理論を使うのか、もしくは何のライブラリを使ったらどれだけ似てるかの判定を簡単にできるのか

最後のどれだけ似てるかの判定が自分は分からないってことが分かった

こういうのはどこで質問したら良い回答が得られるかな

2017-05-28

http://anond.hatelabo.jp/20170528132414

先日感心したエントリ

直接の答えになってないけど、コメントし終わったら読んでみて

他のサービスから見たら五十歩百歩なんじゃないかなと思った

2017-05-26

http://anond.hatelabo.jp/20170525145352

ありがとう、わかりやすい。

消される前のPDFを読んだところ、テキスト句点記号で区切って1文ずつバラバラにして、それぞれを分類していくという手法を取っていた。

作品を全体で捉えて文脈を読むという手法ではない以上、個々の作品アドレス呈示する必要はあまりないと思うんだよね。

この追記の末尾にも書いてたけど、サンプルデータをどのように抽出たかを書けば充分だったんじゃないのかな……。

参考にならないかなと、Web上でTwitterとかブログテキストとかを分析するテキストマイニング系の発表とか、ちょっと探してみた。

たとえば、

https://www.jsce.or.jp/library/open/proc/maglist2/00039/201105_no43/index.html

の「(145)ブログマイニングからの行動データ抽出分析可能性とアンケート調査との比較

ブログ収集するために,八ヶ岳南麓地域代表であ

ろうキーワード複数選択し,それらの組み合わせによ

って複数エンジンを用いて検索を行った.観光旅行

エントリーがあるブログ抽出効率の高さから,最終的

には「八ヶ岳」と「行った」をキーワードとしてGoogle

およびYahoo! Japanを用いて検索を行い(2),192ブログ

収集した.上記キーワード抽出されたブログのうち両

エンジンともに上位でリスとされ,重複して検索された

ものは80であった

こういう出典の示し方をしてくれたら、炎上しなくて済んだんじゃないかなぁと思う。

2016-10-04

高杉さん家のお弁当10巻の感想サイトによって違いすぎる

amazon酷評の嵐

読書メーターは「まあ賛否両論あるかもだけど面白かったよ」的な感想が多い

プリキュア数字ブログの人がヤフコメはてブの違いとかテキストマイニング分析してたけど、

amazon読書メーターも同じようなことやったら面白そう

ユーザー層が違うから、とかあるのかな~

2016-01-08

緊急

1月15日20時締切の卒論。全く白紙データがあるだけで分析もしていない。テキストマイニングとかやったこともない。詰み。

2015-11-19

テキストマイニングを少ししている会社で働いことある原文ママ増田多すぎるので

考えるにその会社は潰れたんだな

2014-04-05

ビジネスプラン

サイト名:オナニパッド

種類:SNS

目的ユーザはとっておきのオナニー方法を「レシピ」として公開する。テキストマイニングキーワードからオカズ」を表示することでマネタイズを行う。

2013-04-26

友達の友達から聞いた話だけど

道玄坂緑色ロゴの某Web企業は偽名で契約を行った上に途中でバックれても契約金を満額支払ってくれるらしい。

そこでテキストマイニング研究してる人がそう言ってたとか。

 
ログイン ユーザー登録
ようこそ ゲスト さん