はてなキーワード: ビッグデータとは
序盤にネット世界にはリアル世界の違いとして「三大法則がある」と書かれていて、これは現在どうなったかと言うと
(1)(企業に膨大な顧客データが集まることにより)神の視点を獲得できる
→ その後、ビッグデータ活用とかデータサイエンスの話になって現在も進化中。
(2)リアルで仕事をしている間もネット上に作った分身で金を稼げる
→ アフィリエイトブログを経て現代ではYoutuberになった。
しかしYoutuber同士の競争が激しく、結局はみなリアルで体を張っており、お気楽な副業というよりは専業職と化しつつある。
(3)(≒無限大)×(≒0)= something (塵も積もればなんか新しい価値が見つかる。「「一億人から3秒ずつの時間を集めてなんかやる」的発想)
→ この方向性はニッチな分野での活用に留まったように思われる。
00年代には「数十万人の個人PCの余った計算資源で白血病ゲノム解析を!」みたいなプロジェクトがあり(名前忘れた)、参加者も多かった。
しかし計算資源の確保というジャンルでは結局データセンターで集中的にやる方が効率的という世の中になった。
他には大人数でGoogleEarthの衛星写真から遭難者を探せ、とかもあったな。
現代でも、散歩してる人にそのへんの電柱を撮影してもらい写真を保全チェックに使う、というタイプのプロジェクトはあるが、そこまでメジャーではない。
わかるけど疲れちゃったよ
Xにイラストや写真を投稿するのはやめようって言うのもわかるし、権利とか規約とか、誰かの意見にタダ乗りするんじゃなく自分で考えて判断するのが大事だっていうのもわかる。
わかるけど
別にXにイラスト投稿を続けるのは犯罪じゃないし、AI学習用のビッグデータとして扱われるのは気分が良くないけど、消極的に諦める事だって許されてもいいんじゃないって思ったりもする。
全体一致できれば強いけどそうしないのが悪でもないし、ウォーターマークだってジャミングだって、使わないのは自己責任でそれ以上でも以下でもない。
イラスト描いてる人間の端くれとして、所謂AI絵師が色んなイラストレーターにやってきたこととか、そもそもの生成に使われてるデータのこととか、嫌だなーと思ってる。でも疲れた。そしてこんな事もうXじゃ呟けない。
15日以降、これまでと変わらずイラスト投稿を続ける人に対してその判断を責める空気感が醸成されないことを祈ってるけど、もう手遅れな気もする
人工知能(AI)は、現代社会において急速に進化している技術である。AIは、データ解析、機械学習、自然言語処理などの分野で多岐にわたる応用が可能であり、その影響力は日々増大している。特に、ビッグデータの解析においては、AIのアルゴリズムが膨大なデータセットから有用な情報を抽出し、意思決定を支援する役割を果たしている。
AIの進化は、医療、金融、製造業など、さまざまな産業においても顕著である。医療分野では、AIが診断支援システムとして活用され、早期発見や治療計画の策定に貢献している。例えば、画像認識技術を用いたAIは、X線やMRI画像から異常を検出する能力を持ち、医師の診断を補助する。また、金融業界では、AIがリスク管理や市場予測に利用され、投資戦略の最適化に寄与している。製造業においても、AIは生産ラインの自動化や品質管理の向上に役立っている。
さらに、AIの発展は社会全体にも大きな影響を与えている。例えば、スマートシティの実現に向けた取り組みでは、AIが交通管理やエネルギー効率の最適化に活用されている。これにより、都市の生活環境が改善され、持続可能な社会の構築が進められている。また、教育分野においても、AIは個別学習支援システムとして活用され、生徒一人ひとりの学習進度に合わせたカリキュラムの提供が可能となっている。
しかし、AIの急速な発展には課題も存在する。プライバシーの保護や倫理的な問題、労働市場への影響などが挙げられる。AIが収集するデータの管理や利用方法については、厳格な規制が求められている。また、AIの導入により一部の職業が自動化されることで、雇用の喪失が懸念されている。これらの課題に対処するためには、技術の進化とともに社会全体での議論と対応が必要である。
総じて、AIは現代社会において不可欠な技術であり、その応用範囲は広がり続けている。今後もAIの進化が続く中で、技術の利点を最大限に活用しつつ、課題に対する適切な対応が求められるであろう。
https://togetter.com/li/2443894「「令和入社の後輩に絶句された」昭和、平成、令和各時代の「無理すれば通えるぜエリア」に様々な反応集まる」これの記事のブコメの反応。
https://b.hatena.ne.jp/entry/s/togetter.com/li/2443894
トップがすでにいい感じのツッコミなのは素晴らしいとして、こんなくっっっそいい加減な地図を作って悦に入ってる元のXのポスト主が元凶なのは当然として、まんまと乗っかってあーだこーだ言ってるブクマカたちは、もう少しこう、知性を持ってほしい、いや知性は持ってるだろうし何なら知性なんて無くてもいいが、「通えるぜ」のマップの色分けの、色と色の間に白い空白地帯委があるのがまじで凶悪だと思うんですよ?そこ無視できましたねよく。いや本当に元のポスト主、Youtubeで都市論ぽいことやってんの?こんなくそいい加減な地図作る輩が?デマ屋レベルじゃねーの?
賢明なブコメ諸氏も突っ込んでおられたが、そもそも通勤先が東京駅周辺が新宿駅周辺かでも余裕で20~30分の誤差が出るわけで正円で表現すること自体が正気の沙汰じゃない(おまけに内房線がなんたらかんたら注釈をつけてて共感性羞恥でこちらが死にたくなるレベル)。さらに首都圏の通勤鉄道は準急やら特別快速やらがあったりするので駅が一つ違うだけでも10分ぐらいの誤差は普通に出る。首都圏居住者の都心通勤時間が1時間前後に多く分布してることを考えれば、無視していい誤差ではない。本当に、元ポスト奴の指に強制ギプスをはめ込んでポスト出来なくしてやりたい。
通勤圏の変化や通勤時間ごとの通勤者の増減等含めた動向は、いろんな人が色々分析していて、ちょっと検索するだけでもレポートはたくさんみつかるのであんなの見てへぇなんて一瞬でも思う前に検索しようず。そして興味のある人は検索結果を色々読んだらいいと思いますが、せっかくはてなというギークでナードな人の多いコミュニティだというのに、ひょっとしてこのサイト知らない人結構いるのかと驚いたので、偏差値の低い元ポスト奴のまとめにまともに反応した人あたりは、もし知らなかったら下のURL見てみるとよいかとおもいます。すでに知ってる人の方が多いとは思いますけども。
https://resas.go.jp/ RESAS - 地域経済分析システム
内閣府がやってるビッグデータを地図化できるやつです。色々見られるから。ほんとマジで、頼むからこんな簡単なこと程度はファクトを調べようよ、みんないい大人でしょ?マジでむかつくわ元ポスト奴~~~~~
また暇アノン負けたんか
男性はニュースサイト「エコーニュース」を運営する江藤貴紀氏で、X上では「音無ほむら(@echonewsjp)」のアカウントで発信を行っている。
ご挨拶
メインスタッフ
1980年生まれ 東京都在住。好きなものはお酒(でも禁酒中)と古めの映画と旅行。それほど好きじゃないのは、そつの無いエリートと体罰教師。熊本県立済々黌高校中退、大検合格、東京大学法学部および東大法科大学院卒業。
日本はこれまで長らく、情報発信力の弱さが指摘されてきました。この原因としては明治維新以来の西洋型ロールモデルを模倣する枠組みが背景にあると言われることが多くありました。
しかし現在ではそれに留まらず、海外からの情報収集能力の低下も著しいものがあります。新聞・テレビをはじめとするメジャーメディアの取り上げるニュースはその多くにおいて、他国と比べて、ポイントがずれています。その内容は(それ自体をカルチュラル・スタディーズの対象としたり、いわゆる「ビッグデータ」の元としてみるならともかく)刹那的なノイズでうまっています。
そしてユーモアのなさにおいては嘆く余地もないほど嘆かわしいのが現状です。(記事は無論のこと、新聞に掲載の、いしいひさいち氏以外の4コマ漫画で面白いものがあるでしょうか?)これはかつて、偉大な福澤翁らを擁していた国とは思えない状況です。
しかし、嘆いているばかりでは現代社会において生きている世代としての義務を果たせていないと私は考えました。
そこで①古典のごとく100年後にも読み返す価値のある記事を精選して、②海外情報を積極的に収集し③ゆくゆくは海外に積極的な情報発信を行い④福澤諭吉の文章ぐらいの遊びを持ったメディアを作り挙げることをいま、目指しています。
さむい・・・
https://seijiyama.jp/area/card/14040/a8fs6g/M?S=qenel9qelin
氏名 江藤 貴紀
得票数 1030
年齢 34
新旧 新
私は政治の透明性を高めることに関心があり、そのために大学は東京大学の法学部と法科大学院へ進学、情報公開法をとくに熱心に学んでいました。
そして、その知識を活かして生かしてジャーナリストとして調査報道を行ってきました。
そして、今度は政治の場で実践したいと思い、議会へ出馬することになりました。
一期目に、日本全国で(国の法律よりさらに)進んだ情報公開制度を文京区に作り、政治の透明性を高めるとともに、そのデータを元に行政運営の効率化を図ることの出来る議論の「仕組み作り」が目標です。
主な政策
身近な問題としてのゴミ回収日の増加です。高齢化社会に伴い、「おしめ」などの介護ゴミが増えています。また子育て世代 でも、子供の紙おむつがどうしても出ますが、集合ゴミ置き場のない物件に暮らす人は燃えるゴミの日まで匂うゴミを自宅で保管することになります。
無論ゴミを減らすエコ の努力は必要ですが、健康で文化的な生活のためには、なるべく速やかにゴミを処理できる仕組みが必要です。
おそらく、文京区単体ではなく他の行政機関や業者などとの調整が必要な問題と思います。ですが、調整も政治家の仕事の本分であり、まさに達成が必要な課題と考えています。
区立図書館におけるフリーWI-FIの 整備です。ネットの情報と文献で得られる情報は、両方を結びつけることで相互補完的に機能すると考えています。
ところが現在、図書館のWI-FI利用には 一部の携帯企業との契約が必要で、登録手続も面倒です。
これをメトロや羽田空港など位シンプルにすれば利用もしやすくなります。そして社会人が仕事で利用するにも学生が勉強をするにも、効率的な環境を行政が整備することが出来ます。
なお、近隣諸国、たとえば韓国のソウル市では昨年に出張した際に市内のほぼどこでもiptimeというフリーWI-FIが通じたので、図書館単体で整備するのは決して難しいことではないはずです。
財源も、セキュリティ対策の問題はありますが基本的に回線を引いてWI-FIを飛ばせば良いので、賄う費用は十分に捻出できるはずです。
https://web.archive.org/web/20150320211549/http://etotakanori.com/
あくまで事前学習モデルを生成に使用するケースのみに限れば、悪用は難しくなると言えるね
ただ現実的にAIの悪用って、モデルが同意のあるデータまたは許諾の不要なデータのみで構築されているかはあんまり関係ないんだよ
例えば、自分含めて許諾済みの様々な裸の写真を学習した生成AIは、アイコラ製造機としても利用可能なんだよね
自分の裸と芸能人の顔を組み合わせればアイコラ作れるのと一緒だよ
「まともなAI」は、どの程度の性能を想定しているのか分からないけど
「これから安心して使えるクリーンなデータのAIがでてきますよ」と「ビッグデータなしでAIは成り立たないので無断学習とはセットですよ」はモノによるから、なんとも言えないかな
クリーンなデータだけでも何かを生成できるくらいの領域は多いけど、手当たり次第にデータをかき集めなければ作れないものもあるね
例えば、一つのモデルで-多様性のあるデータを生成可能で-色々なタスクを実行可能な-マルチモーダルファウンデーションモデルは、まだ大規模で多様なデータがなければ構築不可能だから、無断学習必須だね
逆に言うと、そんなよくばりセット以外ならそれなりのものは出てくるだろうと思ってて良いよ
真っ先に提示された例がファミレスを対象としたクーポンですが、そのようなクーポンはファミレス以外の飲食店から客を奪うことが明らかです。
そもそもファミレスなどのチェーン店はすでに独自でクーポンなどのシステムを構築しています。
都の政策ではむしろ、独自のシステムを構築しづらい個人経営などの小規模な事業者を支援するべきであるのに、そのような視点が欠けているように思えます。
仮に個人経営の店なども対象にしたとしても、そもそも近所に選べるほど飲食店がない地域はいくらでも存在します。飲食物の通販でカバーするような方法も考えられますが、いずれにしても地域によって活用できるクーポンの差は非常に大きくなるでしょう。
それは都の予算の使い方として、適切で公平な形でしょうか?
ビッグデータの活用についても示唆されていて、それはそれで興味深いですが、デメリットを上回るメリットが示されているとは思えません。
貧困世帯の子どもを支援する意図があると思いますが、そういう家庭の子どもはスマートフォンを自由に利用できる環境でしょうか。
国の調査によれば、スマートフォンの利用については「小学生が 43.7%、中学生が 79.9%となり、高校生になると 97.8%が利用している。」とされています。(令和5年度「青少年のインターネット利用環境実態調査」報告書)
つまり、高校生でも1万人中200人はスマートフォンを利用していません。
スマートフォンが利用できない人には紙のクーポンなどを検討するとしていますが、ではその紙クーポンの存在はどうやって対象者に伝えればいいでしょうか。
確実に伝えるためにはプル型ではなくプッシュ型にするべきで、貧困層以外も含めた全世帯に案内を郵送するような形になるでしょう。
そうなると、当初目指していた「デジタルクーポン」の形からは大きく乖離していくように思えます。
そもそも解決すべき課題は「貧困により体験が損なわれること」ではなく「貧困そのもの」であるはずで、デジタルクーポンは応急処置・対症療法レベルでしかないと思います。
提示された政策からは、より大きな課題を解決するビジョンが見えてきません。
ひまそらあかね氏はゲーム開発者としての経験からデジタルクーポンについて意欲を見せているようですが、それは彼が「できること」であっても、都知事が「やるべきこと」もしくは都知事に「求められること」からは外れていると思います。
予測不能なカオスの中からこそ新しいものは産まれると思っているからだ。
あと、誰かの計画の一部に自分が組み込まれているのが許せない。
昨今、スクレイピングの是非が問われているが、それもやはり嫌だね。
なんなら、子供の誕生日に喜ぶやろうなあ、と思って買ったものが計算通り喜ばれるとものすごく不快。
俺が思いつきもしなかった遊び方で楽しんでいるならいい。
喜ぶ理由が予想外ても許す。
だが俺ごときに予想される行動を取るのなら内心見捨てる。
電車が時刻通り運行する行為も許せないし、医療や法律が規定通りに遂行されるのも不愉快だ。
未だに「謎の半導体メーカー」程度の認識の方になぜNVIDIAが時価総額世界4位なのかをあれこれ説明する必要があるので短めにメモ。半導体業界のすみっこの人間なので機械学習まわりの説明は適当です
・~1993年 AI冬の時代。エージェントシステムがさほど成果を挙げられなかったり。まだ半導体やメモリの性能は現代とくらべてはるかに劣り、現代のような大規模データを用いた統計的処理など考えられなかった。2006年のディープラーニングの発明まで実質的な停滞は続く。
・1995年 NVIDIAが最初のグラフィックアクセラレータ製品NV1を発売。
・1999年 NVIDIAがGeForce 256発売。GPUという名が初めて使われる。以降、NVIDIAはGPU業界1位の座を守り続ける。
・2006年 GPGPU向け開発基盤CUDAを発表。以降、その並列計算に特化した性能を大規模コンピューティングに活用しようという動きが続く。
・2006年 ディープラーニングの発明。のちのビッグデータブームに乗り、これまでよりはるかに高性能なAIを模索する動きが始まる(第3次AIブームのおこり)
・2006年 CPU業界2位のAMDがGPU業界2位のATIを買収、チップセットにGPUを統合することで事実上自社製品をNVIDIAと切り離す戦略に出る。CPU業界1位のインテルも、同じく自社CPUに自社製GPUを統合する動きを強める。NVIDIAはこれまでの主力だったGPUチップセット製品の販売を終了し、データセンター向けGPGPUのTeslaシリーズ、ゲーム用外付けGPUのGeForceシリーズ、ARM系CPUと自社GPUを統合したTegraシリーズの3製品に整理する。このうちTeslaシリーズが性能向上やマイクロアーキテクチャ変更を経て現代のAIサーバ製品に直接つながる。GeForceシリーズはゲーマー向け需要や暗号通貨マイニング向け需要も取り込み成長。Tegraシリーズは後継品がNintendoSwitchに採用される。
・2012年 ディープラーニングが画像認識コンテストで圧倒的な成績を収め、実質的な第3次AIブームが始まる。
・2017年 Transformerモデル発表。これまでのNN・DLと異なり並列化で性能を上げるのが容易=デカい計算機を使えばAIの性能が上がる時代に突入。
・2018年 IBMがNVIDIAと開発した「Summit」がスパコン世界ランキング1位の座を5年ぶりに中国から奪還。全計算のうち96%がGPUによって処理され、HPC(ハイパフォーマンスコンピューティング)におけるGPUの地位は決定的になる。NVIDIAの開発したCPU-GPU間の高速リンク「NVLink」が大規模に活用される。「Summit」は2020年に「富岳」にトップを奪われるまで1位を維持。
・2018~2021年 BERTやXLNet、GPT2など大規模言語モデルの幕開け。まだ研究者が使うレベル。
・2019年 NVIDIA CEOジェスン・ファン(革ジャンおぢ)が「ムーアの法則は終わった」と見解を表明。半導体のシングルスレッド性能の向上は限界に達し、チップレットを始めとした並列化・集積化アーキテクチャ勝負の時代に入る。
・2022年 NVIDIAがH100発表。Transformerモデルの学習・推論機能を大幅に強化したサーバ向けGPUで、もはや単体でもスパコンと呼べる性能を発揮する。H100はコアチップGH100をTSMC N4プロセスで製造、SK Hynix製HBMとともにTSMC CoWoSパッケージング技術で集積したパッケージ。※N4プロセスは最新のiPhone向けSoCで採用されたN3プロセスの1つ前の世代だが、サーバ/デスクトップ製品向けプロセスとモバイル製品向けプロセスはクロックや電流量が異なり、HPC向けはN4が最新と言ってよい。
・2022年 画像生成AIブーム。DALL-E2、Midjourney、Stable Diffusionなどが相次いで発表。
・2022年 ChatGPT発表。アクティブユーザ1億人達成に2カ月は史上最速。
・2023年 ChatGPT有料版公開。Microsoft Copilot、Google Bard(Gemini)など商用化への動きが相次ぐ。各企業がNVIDIA H100の大量調達に動く。
・2024年 NVIDIAが時価総額世界4位に到達。半導体メーカー売上ランキング世界1位達成(予定)。
こうして見るとNVIDIAにとっての転換点は「ディープラーニングの発明」「GPGPU向けプログラミング環境CUDAの発表」「チップセットの販売からコンピューティングユニットの販売に転換」という3つが同時に起こった2006年であると言えそう。以降、NVIDIAはゲーマー向け製品やモバイル向け製品を販売する裏で、CUDAによってGPGPUの独占を続け、仮装通貨マイニングやスパコンでの活躍と言ったホップステップを経て今回の大きな飛躍を成し遂げた、と綺麗にまとめられるだろう。
'サービス 開発 リモートワーク 提供 機械学習 プロダクト ソリューション 大規模 技術 要件 する チーム 企画 運用 設計 検索 ため 推進 製品 活用 改善 通信 投資 terraform アーキテクチャ フレームワーク ポジション データ 用い cto プラットフォーム gcp 課題 ビジネス 備考 リーダー scala クラウドサービス 配信 利用 リード 特化 github 処理 ユーザー ci js パーソルクロステクノロジー 新規 喫煙 月額 ai 提案 ビッグデータ クラウド 検知 仕様 スクラム 受注 施策 連携 マーケティング 展開 主体的 インフラ メディア フレックスタイム制 翻訳 広告 社会 事業内容 年俸制 行動 対する マネジメント 音声 自然言語処理 東京メトロ django レコメンド 保養 docker 購入 分析 go メンバー 解決 フルフレックス 検討 jira sas ステークホルダー 折衝 基本給 定義 創業 表彰 新橋駅 インターネット ansible'
'制作 応募 ます 未経験 ゲーム 月給 研修 案件 ください あり 完全 ok 交通費 歓迎 java 土日 アクセンチュア 試用期間 希望 契約社員 です たい テスト 休み スキル ヶ月 電話 エンジニア 年収 まで ませ 実績 あなた 名古屋 住宅手当 スクール ブランク 弊社 php サーバー 面接 net お客様 紹介 vb 豊富 up タイトル 経験者 チェンジ 原則 から 営業 夏季休暇 ディビジョン 不問 ses 全額支給 step ドローン ござい 許可 つけ 相談 みなとみらい 言語 か月 定期的 書類 好き 気軽 製造 内定 当社 活躍 db また 昇給 週休 教育 全員 prevent 面談 デバイス ソクコム 内容 分野 人数 cobol 雇用 策定 先輩 有料 連絡 求人 知識 安心 農業 残業 産前産後休暇'