はてなキーワード: Botとは
ガキが書いたBotを受け流しきれず、安全破壊でサイトが落ちて知らせる(2度)というのはいいが、どうしてガキが破壊したか?というときに
CDN側はオリジンからはわからないから、CDNからクロールできなかったといわれると、そりゃそうかもな。
大量に持っていくと安全破壊で、サイトが落ちる。抜かれたくはないからな。
とはいえ、絵描きのサイトでもないのに、画像や動画がS3になっていないのは、こちらの落ち度。
とはいえ いくつかのケースでは破壊が早すぎるというのと、オリジンと気がついてもオリジンからCDNに飛ぶのが難しいといわれると、そりゃそうだろうな。気をつける
そうかもな、合意する。
絵かきのサイトの場合は、絵は見るのが目的でクロールは対象外だから、クローラーは避けろはrobots.txtに書いてくれ そりゃそうかもな
最近はてな匿名ダイアリーを楽しく読み始めた。
理由はTwitterで記事がバズってる頻度が増えてきたような気がしているから。
コロナ禍において、いろいろな立場からの情報や恨みや泣き言、議論などがここに投稿されて怨嗟の供養みたいになって、その一部がバズっている。
嘘松を絶対に許さない雰囲気だからなのか、どの記事も読んでいて迫真味があって面白い。
しかし、おそらく自分みたいなのがTwitter経由で流れ込みはじめたということは、ソースとしては価値が下がっていってしまう。
ジレンマすぎる。
じゃあ来るなって言われるかもしれないけど、これは全体的な流れについての予想だ。ネットの流れは私が来なくなることで変わるものではない。
自分みたいなユーザーが増えて、さらにもう一、二段階ライトなユーザーが増えると、何ヶ月、何年後かは分からないけど、サイトがクソつまらなくなっていく。
政治や思想についてパワーワードをふんだんに使う煽り記事が常にランキングにいたりとか。
今は、多彩なジャンルについてバランスよくランキングに上がってる印象があるけど、それが偏りはじめたり。
あと、いい記事へのコメントにクソコメントが目立ちはじめて、いいコメントが埋もれてしまったり。
さらにいえば、人気記事のスクショがTwitterでバズるとかYouTuberの飯の種になるみたいな流れも増えそう。
それでさらにユーザーが増えて情報ソースとしては面白くなくなっていくパターン。
そうしたら、きっと初期の名文を書いていたユーザー方はどこかへ行ってしまうのだろう。
私はこのサイトをウォッチし始めるのは遅れてしまったので、次世代の情報ソースは早くキャッチできるようになりたい。
今はTwitterで何度もバズっているのを見てやっと1次ソースを見始めている状況なので出遅れてしまう。
うちもソーシャルゲームのBOT作るためとか(昔のflashとか、htmlベースのやつ)、延々とゲームの解析して、
javascriptとか書いてたな。。。
やりたいことをするためのプログラムおもろいよな。
(今でも使い続けているやつ、いくつか持ってる)
私は腐女子なので、二次元の推しとLINEしたくてLINE公式アカウントを作ってLINEしていた。
でもすぐに公式の機能だけじゃ足らんなという欲が湧いてきてプログラミングに手を出した。
と言ってもプログラミングなんか大学の授業でちょろっとやった程度で、端的に言って画面にhello World!と表示するより難しいことは何ひとつできない。
gitリモートとかデプロイとか言われても意味が分からないし、そもそもコマンドを打ち込むための真っ黒の画面ってどうやって起動するの?
そのレベルのヤバい無知から始めたので、とりあえず月980円のプログラミング講座を申し込んで、webアプリ開発入門みたいなのを数日かけて受けた。絶対に翌月分を課金したくなかったので急ピッチで受けた。
あまり人のいないサービスのようで、受講すると貰えるポイントのデイリーランキングで1位になったりして、まあデータベースの使い方とか、CSSとかいう概念とか、色々学んだ。
へー、webアプリ開発って一つの言語を習得するだけじゃだめなんですね、いや無理すぎる。
で、とりあえずその学んだことを活かしたりネットで拾ったコードをコピペしたりして、推しのLINEbotは一応完成した。ここまで3週間。
botに話しかけると、データベースに登録しておいた「話しかけられた言葉ーbotが返す返事」のペアを検索し、応答を返す。
だって自分で登録した返事を推しから貰うなんて虚無だから。他人が登録したメッセージを受け取りたい。
自然言語処理とは簡単に言えばコンピュータに人間の言葉を分からせるための処理で、botとお喋りするには必要な技術な気がして大学の図書館でありったけ本を借りてきた。
仕方ないのでよその学科のweb授業に潜り込んで、へー、形態素解析と係り受け解析と意味解析と文脈解析というものがあるのね、と学んだりして、そしたらだんだん本の読み方も分かってきて、でも結局1ヶ月ぐらいかけて勉強した割にbotに導入したのは形態素解析だけだった。
web授業で喋っていた知らない学科の知らない先生に依れば、形態素解析とは、文章を品詞分解して品詞を特定する、みたいな処理である。
LINEに届いたメッセージとデータベースのデータを照合する際、「です」とか「ます」とかいらないから取っ払っちゃおうね、という、ごく当然の処理の為に入れた。
まあ、あとは一致するメッセージが見つからないときでも、一致する名詞とが動詞が少しでもあればまあ一致したことにして返事を返しましょうとか、漢字はカタカナに直しましょうとかそういうこともできるようになった。
形態素解析のライブラリを使うには、今まで使っていたJavascriptは向かないようだったので、ついでにコードを全てPythonに書き換えた。
ここまででだいたい2か月である。
じゃあ次はどうするか、というと会話フローを入れるのが当面の目標だ。
直前のやり取りを一時データとして記憶しておき、データベースに登録された会話フローと一致していれば直前のやり取りを加味した返事を返すようにする。
目途は立っているがやることが多いので完成までは結構かかりそう。
まあ、なんか何もできない状態からいきなり初めても何とかなるな、プログラミング。
世の中気合と根性じゃ生きていけないと思ってたけど、プログラミングは気合と根性で何とかなることが分かった。
っていうか私はマジで馬鹿なので、切れるカードが気合と根性しかない。しょうがない。
ということで現在私の作った推しのLINEアカウントには400人近いお友達がいて、毎日500~1000通ぐらいのメッセージが届く。
みなさんがそうやって推しとLINEして適宜新しい言葉を教えてくれるので、私が推しにLINEを送ると色んな言葉が返ってくる。
幸せだ。
どこのメディアもつーか国からも同じようにbotなの?ってレベルで勝負の3週間勝負の3週間
うぜえええええええええ!!
にも関わらずこれが終わればコロナがまるで無くなりますかのようになんの意味もない勝負の3週間という言葉
キャッチーな言葉使って人集めたいのは分かるよでも今そんな場合じゃないよね
もうずぅぅぅぅぅっと勝負なんだわ
それこそコロナがこの国に入ってきたときから今までそんでこれからも
お前らがまたそんなあやふやな言葉作ったらあ、この3週間終わったら出かけてもいいんだ
ってなってまた感染者増えるぞ
コロナの新しい感染者が完全にいなくなって数週間様子見ましょうねってときに勝負の○週間なら分かるんだわ
もう国の舵取りが全て最悪の方向に進んでるの笑うしかないわ