はてなキーワード: N-gramとは
お前は人工知能より頭がいいのか?研究によると、パラメータの大きな言語モデルプログラムが人間の知性を凌駕する可能性があることがわかっている。
Generative Pre-trained Transformer 3が、知能を測る一連の推論テストにおいて平均的な大学生を上回っていることが発見されている。例えばN-gram LMsはカウントベースのマルコフモデルパラメータフィッティングを用いるが、GPT3はより巨大なパラメータを持つ。入力に対して人間のようなテキスト、つまり確率の高いものを出力する。GPT3はOpenAIが生み出した技術で、言語翻訳やチャットボットなどのアプリケーションのテキスト生成など、さまざまな用途がある。
1750億のパラメータを持つ、最大かつ最も強力な言語処理AIモデルのひとつだ。
ではGPT-3は「天才」なのか?研究では、一般知識、SAT試験のスコア、IQという3つの重要な要素において、プログラムが人間に匹敵する能力を持つかどうかを調べられた。プレプリントサーバー「arXiv」で公開された結果によると、AI言語モデルは3つのカテゴリーすべてにおいて、人間よりも高いパーセンタイルでゴールしていることがわかっている。
実際のIQテストでのGPT-3の成績はどうか?平均的な大学受験生を相手に、様々な言語モデルが分析的推論問題でどのような結果を出したかについての調査結果を発表された。AIが明らかに勝者となった。とのこと https://twitter.com/AiBreakfast/status/1607594052785930240
"GPT-3は、抽象的なパターン誘導に驚くほど強い能力を示し、ほとんどの場面で人間の能力と一致するか、あるいはそれを上回ることが分かりました。我々の結果は、GPT-3のような大規模言語モデルが、広範な類推問題に対するゼロショット解を見つけるための創発的能力を獲得したことを示しています"と研究者は言う。
同チームは、GPT-3が「明示的に訓練されていないにもかかわらず、生物学的知性がとるのとは根本的に異なる経路を経て、人間の類推の基礎と考えられているものと同様のメカニズムを開発することを余儀なくされた」ことを付け加えている。
GPT-3は、すべての問題タイプにおいて、生成精度...および多肢選択精度ともに、人間の参加者を上回った 。https://twitter.com/AiBreakfast/status/1607594057735278592
この研究によると、ほとんどの質問に答え、人の代わりに論文の下書きまでできるAIプログラムは、問題をゼロから解かなければならないときや、多肢選択式のテストから選択するとき、人間を上回ったそうだ。
AIの専門家で作家のアラン・D・トンプソン博士は、GPT-3が120以上のIQを示すことを示唆している。
いや、純粋なプログラミング能力に限定したつもりはないよ。一般的な技術力の話。レイトレーシングだってFPGAだってコンパイラだって純粋なプログラミング能力とはいえない。だいいちそういうのを連携させるというカリキュラムは実務的とは言わないまでもその辺の給料もらうためだけに書いてるだけのプログラマにはできない芸当をやっていることは確かでしょ(馬鹿にするわけじゃないが)。ギークとまでは呼べないかもしれない。ただそのへんのwebギークにすぐにできる芸当ではない。当たってるかどうか知らないが、私が知っていたadvancedなトピックとしてはフォトンマッピング、HW/SWコデザイン、関数型プログラミング言語とかか。むしろページランクも分かち書きもN-gramも、web系のギークが得意な話題ではないかなとも思う。
話の流れとしてはどうでも良くて、、そういうことさえ経験できない他の大学(宮廷でもままある)の学部卒って使えないよねーという話になって、だからこそ東大IS羨ましーという話になるのです。まああんまり自分を卑下してT大を持ち上げてもしょうがないので私は似たような題材で切磋琢磨しましたが。
リブログです。
An axiomatic basis for computer programming
C. A. R. Hoare
Communicating Sequential Processes (CSP)
C. A. R. Hoare
Call-by-name, call-by-value, and the lambda calculus
Gordon Plotkin
Towards a theory of type structure
John C. Reynolds
Definitional interpreters for higher-order programming languages
John C. Reynolds
Philip S. Abrams
The Anatomy of a Large-Scale Hypertextual Web Search Engin
Sergey Brin and Lawrence Page
A Mathematical Theory of Communication
Claude Shannon
Communication Theory of Secrecy Systems
Claude Shannon
Bayesian Networks without Tears
Eugene Charniak
A Universal Algorithm for Sequential Data Compression
Jacob Ziv and Abraham Lempel
Let's Build a Compiler 1988-1995
Jack Crenshaw
Gauging Similarity via N-Grams: Language-Independent Sorting, Categorization, and Retrieval of Text
Marc Damashek
Richard P. Gabriel
Hints on Programming Language Design
C.A.R. Hoare
Why Functional Programming Matters
John Hughes
Kenneth E. Iverson
The next 700 programming languages
Peter J. Landin
Recursive Functions of Symbolic Expressions and their Computation by Machine (Part I) 1960
John McCarthy
Teach Yourself Programming in Ten Years 2001
Peter Norvig
Alan J. Perlis
The Complexity of Theorem Proving Procedures
Stephen A. Cook
Guy Steele and Gerald Sussman
A Method for Obtaining Digital Signatures and Public-Key Cryptosystems
R.L. Rivest, A. Shamir, and L. Adleman
http://www.zafar.se/bkz/Articles/ClassicCompScienceTexts
http://www.zafar.se/bkz/wiki/view/43bafac8c8570f4f
にあったけど、無くなっていたので
http://web.archive.org/web/20060823143349/www.zafar.se/bkz/home/classictextsincomputersc.html
から拾ってきた。
でも書いてる途中に↓を見つけてしまったのでした。