はてなキーワード: スコアとは
3件(実質2件)
https://opensource.srad.jp › story
2019/10/28 — みんな導師《グル》? Re: (スコア:0). by Anonymous Coward. ゲイツとサンマイクラシステムズを思い出す. Re: (スコア:0). by Anonymous Coward. ノームに ...
GNOME、「パテントトロル」に対抗すべく支援を求める - YRO
https://yro.srad.jp › comment
2019/10/28 — by Anonymous Coward. ゲイツとサンマイクラシステムズを思い出す. Re: (スコア:0). by Anonymous Coward. ノームにトロルにグールって何のゲームだか.
Alice & Teres (アリス と テレス) - 研究する人生 - したらば掲示板
https://jbbs.shitaraba.net › bbs › read.cgi › study
2016/02/23 — サンマイクラシステムズ. 返信. 498 : 研究する名無しさん 2016/06/11(土) 08:28:35. 2350 :研究する名無しさん :2016/06/10(金) 21:41:19 ハニーと ...
モデル名 | リリース日 | コンテキストウィンドウ | 入力料金(100万トークン) | 出力料金(100万トークン) | MMLUスコア |
GPT-3.5-Turbo | 2022年3月 | 16K | $0.5 (約¥74) | $1.5 (約¥220) | 70% |
GPT-4 | 2023年3月 | 32K | $30 (約¥4,400) | $60 (約¥8,800) | 86.4% |
GPT-4 Turbo | 2023年11月 | 128K | $10 (約¥1,500) | $30 (約¥4,400) | 70% |
GPT-4 omni | 2024年5月 | 128K | $5 (約¥735) | $15 (約¥2,205) | 88.7% |
GPT-4o mini | 2024年7月 | 128K | $0.15 (約¥22) | $0.60 (約¥88) | 82% |
Multi-task Language Understanding on MMLU
https://paperswithcode.com/sota/multi-task-language-understanding-on-mmlu
俺は今年、「マウサー」というものすごく古いアーケードゲームのスコアアタックをしていた。
(参考)https://www.famitsu.com/news/202403/13337194.html
長い間俺は2位だったのだが、少し前に念願の1位を取ることができた。
しかし、まだスコアを伸ばせる余地があったので、ある程度伸ばした。
しかし、これ、いつになったら終わるのか。
理論値まで極める気はないけど、カウンターストップがあるわけではなく、「ここまで行ったら終わり」という指標がないのだ。
毎日プレイする習慣があったので、今もそのゲームをプレイしている。
一体何のために?
分からない。
やめ時がわからないのだ。
「もういいよ、終わりにしよ?」と言われても俺はやめないだろう。
どうしたらいいんだ。
今日も俺はマウサーをする。
マウサーというゲームは、ネズミを捕まえてクリアしていく、固定画面型のアクションゲームだ。
誰か止めてくれ・・・
とか言うやついるけど、自分は全然そんなんじゃなかったんだよな
自分は遅咲き?で、それこそ幼稚園とか小学校とか、周囲は女子はジャニーズだったり、男子も何らかのアイドルにハマってたりするわけだけど、
自分にはそんな偶像崇拝はなかったというか、スクールカースト最底辺らしく、アニメとか漫画とかゲームとかだったから、音楽は自然とアニソンとかゲームの曲になるわけで、
あと、家ではラジオだらだら聴いてて、英語の勉強にもなるんじゃないかとFENとか流しっぱなしにしてたんで、洋楽の方が聴いてたけど、曲名とか歌詞とか全然理解しないで聴いてたので、
学校で会話が成り立たないし、なんか流行の曲が分からないので、すげーバカにされたこと思い出ばかり残ってるんだけど、
山の中のド田舎みたいな場所に、ある日レンタルビデオ、レンタルCD屋みたいなのができて、よくわからんがジャケットの墓地がカッコイイという理由だけでメタリカ聴いて、
人生で最も感動したんじゃないかぐらいに感動してしまって、親にねだって田舎の電気店でギターを買って、バンドスコア買って、タブ譜でリフはすぐ弾けるようになったけど、
速いソロは弾けないし、家のあちこちにギターぶつけて表面加工がボロボロになったり、フロイドローズのスプリングのテンションいじってて壊したり、無理やり直したりした思い出があるけど、
ギターは未だに下手くそだけど、女性にモテたいという気持ちは当然本能としてあるのは否定しないけど、女性にモテたいと思ってギター弾き始めたわけでもないし、弾いてる訳でもなくて、
なんか難しいソロが弾けた、カッコイイアニソンをとりあえず耳コピできた、延々とYouTubeをカラオケ代わりに流して、知らない曲でもいきなり弾いてみたり、自己満足だけどなんかそういうのが楽しいわけで、
そもそも、自分が観てるYouTubeのチャンネルとか、例えばイングヴェイとかインペリテリとか完コピしてる人とか、まったく再生数ないよね
凄く上手い人、メタル関係なく、どんなジャンルでもいいけど、凄い上手いし、観れば参考になるのになぁ、と自分が思ってる人は意外と再生数が異常に少ない
再生数が多いのは、ギターは顔で弾け!の人とか、ファンクおぢとか、富士山とか、あとアニソン耳コピしてタブ配ってるような人とか、そういうのだよね
スコアが出回る前のぼっちざろっくとかは再生数が伸びるけど、スコアが出回ったり、挫折者が大量に出るようになったり?すると、再生数が落ち着くというか低くなる感ある
何が言いたいのかよくわからなくなってきたけど、未だにギター下手だし、ネットで上手い人見てスゴイネーとかコナミ感してるけど、今更モテたい気もしてきたけど、もう遅いんだよね…
昨日、ラウドネスネタで盛り上がってるYouTube観たけど、登場してる人がみんなおぢさん、おぢいさんばかりで、正直自分より一回り、二回り上の世代ではあるものの、
他人事じゃないぐらい、自分もアラフォー、アラフィフのおぢさん、おぢいさんだからね…
腰痛が酷くて、ギター立って弾いてたらギックリ腰するようなおぢさんだからね…
高齢独身童貞おぢさんが、暗い部屋の中で独りでLUNA SEAの耳コピしたり、End of 早漏とかウケないおやぢギャグを脳内再生してるからね…
もう人生終わりだね…
早く退場して異世界行きたい…😟
「不妊の原因の半分は男性にあると言われている」←まるで不妊の原因が男女半々かのような印象操作よくない。
↓のWHO調査結果のグラフを見ればわかるが、男性のみ原因が24%、女性のみ原因が41%。倍近いスコア差がある。
https://kenko.sawai.co.jp/prevention/202003.html
2017年の世界保健機関(WHO)の調査によると、不妊症のうち、男性のみに原因があるケースが24%、男女両方に原因がある場合が24%
昨日でプリパラが10周年ということなので、ちょっと思い出話。
『プリパラ』はアーケードで稼働していた着せ替えを楽しむリズムゲーム。
一度遊ぶと長細いカードがその場で印刷させて排出され、着せ替えのコーデのためのカードと、コーデを着用したアバター(マイキャラ)が表示されたカード(トモチケ)の2枚に分割できるようになっている。
このトモチケの方はゲーム中に使用すると、そのアバターがリズムゲームのメンバーとして呼び出せるという機能があった。トモチケを使わなくても、メンバーは呼べるけどランダムだし、スコアは低くなる。
だから可能であればトモチケからメンバーを呼び出す方がよいし、ライブによってはコーデを合わせた方が見栄えもよくなる。
トモチケを手に入れるにはどうすれば良いのかというと、他の遊んでいる人に声をかけて貰う、もしくは交換するしか方法がなかったりする。でも、この微妙な不便さと、リアルにコミュニケーションを強いられるシステム、そしてゲームを介して、ある意味同じ目標があるから、意外と声をかける心理的ハードルが低いということもあって、みんな結構躊躇せず、知らない人でも声を掛け合ってた。
俺は長年ゲーセンに通ってたけども、あそこまで見知らぬ人とコミュニケーションを取りまくったゲームはプリパラ以外なかったな。競合していたアイカツも、トレードの持ちかけで話すことはあっても、どうしてもそれ以上の話は出てこない。それにトレードだと集めきったら終わりだけど、トモチケは集めきるという考えがないからいくらあっても良かったし。
稼働末期はゲーセンもこのシステムのことを理解していたようでトモチケ交換ボードみたいなものを用意してくれて、人を介さなくても他の人のトモチケを手に入れることができたけど、やっぱりそれはちょっと違うんだよ、と心のどこかで思っていた。あと、稼働末期はトモチケが大量に発行できるようになり、トモチケ交換ボードにだだあまりしていたのも見ていて悲しいものがある。
稼働当初はトモチケは1プレイで1回しか入手できなかったから需要と供給が絶妙に噛み合っていたというのも良かったんだけどね。
このトモチケシステムは、アイカツも続編でパクったけどほとんど有効活用されないまま終わってしまった(アイドルカードのシステムを覚えている人はどれくらいいるんだ……)。プリパラの続編、『プリチャン』ではトモチケシステムは続行していたけども、前述のトモチケ交換ボードを公式で作っちゃったから、リアルで交換するという文化がほとんど消滅してしまっていたのが辛かった。さらにその続編の『プリマジ』では、トモチケに該当するシステムが初期のころは実装されず、途中から実装されたものの1回の排出でコーデをもらうかトモチケをもらうかの二者択一になってしまったから、わざわざトモチケを排出する人がいなくてシステムとしては死んでしまっている。
あと、プリパラはリズムゲームであるものの、いかにキャラを可愛くコーデしてライブを楽しむかということに重点が置かれていたので、基本的には殺伐としておらず、コミュニケーションも取りやすかったというのも良かった。ツイッターなんでも、このコーデが可愛いとか、俺のマイキャラは可愛いだろとか、そんな話ばっかりだったな。
そんなわけでこのゲームがきっかけで知り合った友人は多く、このゲームきっかけで結婚した人もいたりしたし、本当に凄いゲームだったよ。
プリパラは今ではスマホ用のアプリであり、たまに遊んではいるけど、何をするにもスマホ内で完結してしまうから、やっぱりあれは何か違う。
プレイヤー間のコミュニケーションを促進するツールであり、各々が自らのマイキャラやコーデを自慢しあう、あの空気こそがプリパラの最大の面白さだったと思う。
今日、某駅前で小池百合子は自民党の候補ですみたいなことを念仏のように唱えていた人は何だったんだろう。
あとは、選挙に移こうみたいなことをじーさんばーさんがしきりに主張していたのも気になる。
そのじーさんばーさんはなんか別の主張を書いたプラカードも持ってたんだけれど、それはあまり表に出してなかった気がする。
あとはいかに都政に意見を言えないかみたいなことを音楽を流しながらずっと主張している人もいたな。こっちは候補者らしいけど。
音楽を流しながらの辻説法で某集団を思い出したけど、どうなんだろう。
まあ、自分が票を入れる候補者はvote matchingのスコアが一番高かった人なので、そういうのはどうでもいいんだけれど。
オレオレFCがホームスタジアムで首位を完膚なきまでに叩きのめすー。30日のホーム町田ゼルビア戦に備え、28日はロイスタで一部非公開練習を行った。線状降水帯による激しい雨の影響でスタジアムの芝は一部水溜まりになった中で、紅白戦などを行った。ホームでは現在3連敗中だが、イレブンは町田撃破に闘志満々。3月に味わった屈辱的な敗戦から進化した姿を見せ、首位撃破を目指す。
◇ ◇ ◇
ロイブル軍団の「パワースポット」である本拠地で首位撃破を目指す。都内は線状降水帯が発生した影響で大雨洪水警報が発令された。練習中は滝のような雨が降り続けたが、イレブンは関係なく、ナイター照明も点灯。試合2日前に行う紅白戦など、普段と同じ調整ができた。野河田彰信監督も「これで当日も試合も晴れたら最高やな」とニヤリ。町田撃破へ自信を覗かせた。
町田には3月の試合で1ー2の敗戦。スコア以上の内容を喫する屈辱的な敗戦を喫した。FW森永は「悔しい以外に言葉が出なかった」。その後、町田は現在首位と好調をキープ。「町田が(首位を)走って、J1のチームが情けないと思われている。僕達も悔しいし、これ以上、町田の好きにはさせない」と語気を強める。
チームは鈴木潤主将やDF岩田、村山が町田戦出場停止だが「何時も助けられているので、成長するチャンスだと思っている」と悲観はしていない。ミーティングでは町田に勝った新潟や磐田の映像に加え、ロングスローやセットプレー対策を多めに使ったと言う。「勝つ自信はあります。町田ゼルビアにオレオレFCのサッカーというものを見せつけたい」と宣言した。
本拠地3連敗中だが「勝てば反撃態勢ができる。圧倒して町田にギャフンと言わせたい」と森永。豪雨降って地固まる-。町田が席巻しているJリーグの旋風は、ホームのロイブル軍団が食い止める。
○…DF松岡が奮闘を誓った。3月の敗戦について「球際で負けたり、セカンドボールの反応が遅れていた」と反省する。今節はDF岩田、村山が累積警告で出場停止。脳震盪のMF藤崎も欠場が濃厚だ。この日はDF伊藤と田曽野が主力組に入ったが、野河田監督は「スタメンとは限らん」と煙に巻いた。町田撃破にはDFラインの奮起が不可欠。松岡は「いい時の自分たちを出すことが大事。我慢勝負になる」と表情を引き締めた。
自由研究って言われても、そもそも「研究」という概念がよく分かってなかったなって思う。
なんか顕微鏡覗いたり、薬混ぜ合わせたり、本読んだりするイメージはあるけど、じゃあ研究とは何なのかと言われるといまいち分かってない。
仮説の設定、検証、考察というプロセスによって物事の法則や論理の蓋然性を確かめる、という趣旨を理解してなかった。あんまり説明もされてなかったような気がする。
「実験」にしたって、教科書に書いてあることを実際に試してホンマやんって確かめるだけの作業だったし。
本やネット情報の写経だったり、何らかの論理を用いた訳でもなくただ作りましたってだけの工作ばかりだったのもそういう所があるのかなって思う。
定量的な比較による睡眠量とゲームのスコアの相関分析、とかの方が遥かに「研究」ではあるんだけど、それよりはなんか理科の教科書に従って「実験」でもしてる方がそれっぽいと思ってたし。
もっとも理解してた所でちゃんとやってたかって言えばそんな事もない気がする。
大人になったらさ、ガキの頃面倒だった自由研究も羨ましく思えるんだよな〜とか言う奴いるけど、じゃあやればええやんと思ってたし。
発表の場が欲しいってんなら、今どきyoutubeなりSNSなり色々あるんだから。やれば?やりたいなら。やれよ。やらねえだろ?やらねえんだよお前は。
大人になってから勉強したくなってさ〜〜とかもそうだけど。それは現在のアンタの価値観、環境、諸々の前提に立って発される感情であって、その前提が違う人間の前で押し付けがましくのたまうなよ。
よしんば、というか多分大体の人間が似たような後悔を抱くにしたって、少なくとも今この瞬間やりたいとは思ってないんだよ。お前の後悔には経験に基づいた納得という重みがあるんだろうけど、その結論だけ押し付けられてもおれには重みがねえんだよ。と思ってた。
最近自由研究ってちゃんとやったら面白そうだよな〜〜とか思い始めた。やる気もねえ癖に。
絶対あの手の事言わんよう気をつけてえ。
草の根じゃ批評している人いっぱいいるが、メディア関係者はいつも順位が低いと大騒ぎするばかりだが絶対に触れないことがいくつかある。
全体的に俯瞰すると日本のスコアは以下のようになっている(2024年版の資料)。
分野ごとにはこうなっている。
教育と健康についてはもうスコアをどうこうするようなものではないだろうし、そもそも先進国において教育や健康においてのジェンダーギャップなどほどんどないと言っていいだろう。
一方で日本が達成できていないのはなにか、ということだが、まず、技術職、専門職、管理職につく女性が少ないという点と、政治参加があまりにも低い(が、0.118で113位というのもよくわからんところではあるが、他の国々も似たりよったりなのだろう )。
つまりスコアを改善するには、女性の政治家を増やす、女性の高給取りを増やす、というこの二点に尽きる。
男性がどうか、ということはこの指数では実は関係がない。女性がどうかという話でしかない。だから虐殺によって人口における男女比がぶっ壊れたルワンダのスコアが高くなることになる。
これ一つ見ても「ジェンダーギャップ」と言いつつも「男性が不利益を被りやすいポイントは見ていない」ということがよくわかる。
例えばだが戦争に行く男女比率や危険な仕事に従事する男女比率、犯罪被害に合う男女比率などは見ていないしこれらを見たときにこの指数がどういう結果になるかはわからない。
さて、実はフェミニストたちはこの辺を見て大騒ぎしている。多分詳細も見た上で騒いでいるだろうが、末端でジュンイガーと発狂している人たちの中には全く見ていない人もいるだろう。
「日本は順位が低い!女性は差別されている!118位ってことさえわかってれば十分だ!詳細を見ろとか差別主義者の戯言!」
ぐらいに怒り散らかしているかもしれない。
だが先程も言ったようにこの指数が表していることはなんだろうか、という話でしかない。女性が政治に参加できていない、女性が経営者だとか技術職だとかになっていない。
政治の世界については今も男尊女卑がまかり通っているのかもしれないが、それは候補者が、ということもあるが投票者が、ということも要因として大きいだろう。投票する人たちが何はともあれあの政治家に投票することはすでに決定されているくらいでやっているのだから変わりようがない。
女性が技術職になるには、技術職になった男性たちと同等の努力は求められるし、それができるだけの支援もいるだろう。女性の体についてはやはり男性のそれに比べると停止せざるを得ない期間が長いからな。
停止しなくても住んでいる幸運な女性たちが他の女性にやっかまれながら生きていくのも見るに忍びない。
この辺は個人的ング地でしかないが、女性は本当にここで言うジェンダーギャップを解消してほしいと思っているのか?何の努力もなしに解消することはない。
特に仕事については女性が頑張る必要のある分野だ。政治の分野は政治側の変化と女性の頑張りが必要だ。
教育については国が提供するものだし、健康も医療を国が提供するものだ。つまり、女性の努力が解決に大きく寄与するものほど解決できていないと考えたほうがいいかもしれない。
こういうこと言うと「だって男社会が女を努力から遠ざけるじゃないか」という人が出てくるんだろうなあ。はっきりいうがそんなことはないだろう。
GPT3.5とGPT4とでは歴然の差があるとは感じる
でもGPT4とClaude 3 Sonnetとでどれくらい差があるのか、よくわからん
○○の出力は得意だね、賢いね、とか
結局恣意的に見てるだけなんじゃねって気がするし
英語や中国語ヒンディー語スペイン語とかの他の言語で賢いの?どーなの?って尺度では体感的には分からない
実際は何某かのスコアを使って定量的な性能評価をしてます、なんだろうけど
どこまで信用できるんですかね
賢い賢くないってそのスコアで測れるんですかね
AIっていう非常に複雑な対象を、何々スコアっていう単純なものさしで本当に測れているのか?
人間だってペーパーテストの点数や知能テストで「賢さ」が分かるかっていうとそうではないじゃん
いまだに地頭なんていうよーわからん概念を信仰してたりするじゃない、人間はね
と、いうふうなことがAIにも言えるんじゃないのと思う
LLMが競い合う折れ線グラフみたいなやつも、あれを出して、○○が××を上回りました、って主張するけど本当にそうなのかね?
歌川広重並に疑わしいよね