「文字コード」を含む日記 RSS

はてなキーワード: 文字コードとは

2022-12-12

ロリコンオタクのせいで日本人ネットから排除されていた

はてな村村長の語りに便乗して昔話しちゃおうかな

結構多くのWEBサーバアクセス制限で.co.jp .ne.jp .jpがdeny設定されていたって話である

https://b.hatena.ne.jp/entry/s/twitter.com/kanose/status/1601270223386324992

 

2005年までの個人サイト自宅サーバブーム

個人ネット利用で大きな転換点は2005年くらいで、例えばブログのはしりはてなダイアリーサービス開始は2003年アルファブロガー選考開始は2004年youtubeサービスインが2005年だが、これらの特徴は「アカウントをとって企業WEBサービスを利用する」という、今では当たり前の方法だ。

だがこの以前にはそういう方式のものは少なく、ISPや借りたレンタルサーバ自分コンテンツアップロードして構築するというのが主流だった。

これは内部的にはLINUXサーバ制限アカウントを貰ってユーザーディレクトリの/WWWファイルを置くという事やね。

から最初のうちは個人サイトURLは「http://www.yourisp.co.jp/~aybabtu」って感じだった。~はUNIXユーザーホームディレクトリを示すのね。やがてバーチャルドメイン対応するサーバ会社が増えてhttp://www.aybabtu.rentarusabaa.comみたいな今では当たり前のURLになったんだが、最初バーチャルドメイン設定は有料だった。

MS Officeには「パブリッシュ」ボタンがあってそれを押すと編集してるファイル群の構造のまま指定したサーバFTPファイル送るみたいな機能もあった。(だがこれはShift-JISでUpするというクソ仕様で後に読めなくなるのだった)

httpの頭のHTはハイパーテキストで、参照箇所にはリンクが設定できて参照元ジャンプ(これも死語だ)できる電子文書なわけで、まさに公開はパブシュッシュ=出版なわけだ。今もサブスクリプション新聞雑誌定期購読というのはこの建付けが残ってるからだ。

 

ISPWEBレンサバにはユーザー権限多寡で違いがあって、ユーザに実行権限付与してperlなどのインタープリタを構築しておくと、テキストであってもファイル先頭にインタープリタへのパスを書いておくとそれが実行され、標準出力httpで返す。これがCGIで、ISP供与で多いHTMLファイルの公開だけの権限制限されたサーバに不満な層は「CGI実行可」のレンサバ屋に移っていった。

但しプログラムであるから、いい加減に書いてループ参照とか起こすとサーバCPUメモリを喰いつくしサーバダウンを惹き起こす。だからISP供与のでは実行権限を与えなかったわけだ。逆に言えばISPが必ずホームページ公開スぺースを供与するのに個人向けレンサバが成り立ったのは何故?と言えばCGIの実行が出来たからだ。

故にWindowsしか使わない人には難しい上級者向けだったのだが、これを優しいチュートリアル簡単設定出来るようにしてユーザーを増やして会社を大きくしたのがpaperboy&co.の家入一真氏なわけだ。はてな創業者近藤淳也氏と並ぶ個性的アントレプレナーと謂われた。その後堀江などと共にインターネッ党を作って都知事選に出て箸にも棒にもな結果になったのは黒歴史なので触れないで上げてください。特に堀江野菜でいじられるよりも傷つくので偉そうに政治の話してる時に「インターネッ党」とボソっというのは残酷な事なので止めてあげて欲しい。お願いします。

また、CGIでの使用言語perlが圧倒的で、perlで書いた掲示板スクリプトを配布するサイト趣味プログラマが星の数ほどいた。

こういう訳で初期のWEBで動的ページ=perlであってJcode.pmを開発した小飼弾氏は魔術師扱いされて崇拝されており、ブログブームが来ると圧倒的な人気を誇った。

今では多言語普通に扱えるのが当たり前だが、マルチバイト文字の扱いというのは難しく、文字コードがそれぞれ違うのがそれに輪をかけていた。例えば今でも日本語Windows上でフランス語中国語ファイル名は作れないだろう。また、最初からかなりの期間、Twitterでは日本語検索が出来なかった。youtubeでも日本語投稿できなかった期間は長い。

子飼氏はperl日本語使用できるようにするライブラリUNICODE対応にしてWEB普遍的日本語が使えるようにしたものだ。

ただ、HTLMと実行文を混ぜ書きできるPHPがver.4になるとデータベース連携が強化されていてデフォルトSQL文発行関数実装されており、perlCGIは廃れていってしまう。

 

またISPより高い自由度を求めて自宅にサーバを立ててそれを公開するという者も現れた。

はてなサーバデータセンターに置いてはいものの、筐体は町工場設計図を持ち込んでステンレスの1U筐体を自前で作っていたし、Pixivギガバイトシステムボードを使って自作した多数のサーバエレクター上に置いてむき出し運用してしていたので、自宅サーバ組の延長にあったのだな、実は。

アップローダ

 

こういう中で画像を公開する、動画を公開するというのはなかなか大変だった。

間内で見るという分にはファイルを置けばいいだけだが、問題になったのが「2ch晒し」であった。これは悪意を持って2chURLを貼るのだけじゃなくて、単にURLを書くというのも含まれた。

というのも2chURLが書かれるとアクセスが集中して大抵はサーバダウンしてしまう。すると他の契約者のサイトもページも見れなくなってしまう。

例えばヒーロー戦記主題歌みたいな社歌buzzった日本ブレイク工業サイトは重すぎて何週間も閲覧出来なくなった。社歌動画ファイルを置いていたためだ。

こういうサーバダウンは契約者の責任ではないがホスティング会社も許してはくれない。契約解除、つまり出ていけか、法人契約への変更かを迫られる。転送制限なしと言っていても実際に転送過多になると干すティングになるわけだ。

から2chは悪意の塊の他にサーバーダウンとサーバからの追い出しを惹き起こすので蛇蝎のように嫌われていた。2ch晒し→その時点でサイトを閉じてしまう人も多く居た。

 

するとこれを逆手に取ってアップローダあぷろだ)を自作サーバ運用してアフィリエイト収入を上げる者が現れてくる。

ただこれは著作権違反ファイルが上げられて訴えられる事もあるからそのリスク低減のためと転送制限の為にファイル容量に制限が設けられていた。

 

すると大きなファイルを共有したい連中はこれでは満足できない。

そこで目を付けたのが海外アップローダ運用しているサーバだ。運用動機日本アップローダと変わらない。だがファイルの大きさの制限が緩かった。

そこでそういう海外アップローダ違法性が高いファイルの共有に使われるようになった。やってたのは2chダウンロード板と半角板がメインだ。

 

ようやくロリの話

だがこれは運営には迷惑な話で、日本人は英語広告なんてクリックしない。しか商品販路が無いので日本からアクセス報酬は支払われない。つまり金を落とさず転送量だけ上がるのだ。しか海外では転送量従量課金は多かった。

 

更に問題なのがロリ画像アップロードされることだ。2次元ロリでも規制があるのに実写ロリは完全アウトだ。実写ロリが発覚した場合サーバ管理者は必ず逮捕される。マグショット新聞掲載されTVで晒され、釈放後も幼児被害者性犯罪者なのでGPSロガ装着が義務付けられ住所は共有される。二度と部屋を借りる事は出来ずに一生トレーラーハウスキャンピングカーを買って橋の下生活となる。

こんな実写ロリ画像動画アップロードする奴が居たのである

 

そこで管理者としては日本からアクセスが増えたのを確認した時点で遮断するしかない。一生を棒に振る可能性を回避するためだ。

圧倒的によく使われるWEBサーバapacheでは.htaccessというシステムファイル記述してアクセス制限を掛ける事が出来る。ここで国別IPアドレス指定するのはちょっと難しいのでdeny from co.jp deny from ne.jpという風に書くとドメインco.jpne.jpからアクセスを全部弾くことができる。

この時にディレクトリ指定を「/」にするとそのサーバの全てが弾かれて403エラーが出てしまう。しかバーチャルドメインも同じなので思わぬところで403エラーが出る事もある。

そういう訳であちこち海外サーバ日本からアクセス拒否されていた。全て2chダウンロード板と半角板のやつらのせいである。

自分アメリカ田舎新聞社のトップページ403を食らったことがあるから嫌われ方は相当なものだと思う。「やるべき.htaccessの基本設定」みたいなのに書かれて共有されたのかも知れない。

 

因みにダウンロード板と半角板は2ch名物厨房板だったのに、今見たら無くなってるのな。諸行無常だ。

 

AYBABTU

2005年サービスインしたYoutubeだが、翌年にGoogleに買収されたもの最初は元paypal社員らが作ったベンチャーだった。

だが最初著作権違反コンテンツばかりであって、自作ビデオというのは少なかった。

特に酷かったのがまた日本人で、最初10制限がなかったのをいいことにアニメの全話丸上げみたいなのが大量にされており、当事者アニオタ達も「ここまでやったら閉鎖されるだろ!」と諫めるほどだった。

そんな中で2006年6月Youtubeが数日間の大メンテナンス突入し、画面には「All your video are belong to us」というブロークン英語が書かれていて騒ぎになった事があった。

これの元ネタは「All your base are belong to us」で、古いセガゲーム英語版で出てきたセリフだ。深刻な場面で突然めちゃくちゃな英語をいう。このおかしさでFLASHが作られたりとミーム化していたものだ。

しか日本ゲーム結構あちこちバカ英語を作ってて、engrishとかjanglishとか言われてネタにされていた。日本で言えばアヤシイ中国製品の日本語を愛でるような感じだ。

そこでYoutubeあんメッセージを出したので、日本ネット民は身に覚えがありすぎて「アニオタのせいだろ!また排除されるだろ」と責任なすり合いと相なったのだった。

因みにその後も日本人の利用が制限とかは無かったので誤解だったのだが、海外アップローダ見つけては403の焼き畑とかロリ画像問題とかがあって、その後のアニメフル全話という流れだったので過剰反応をしたのであった。

 

以上、ロリ403の話でありました。

2022-12-01

コンピューターサイエンスって何だよ?

最近コンピューターサイエンスプログラマー必要か否かみたいな話が上がっているが、そもそもコンピューターサイエンスって何だよ。どこまでの範囲をさしてんの?

って思ってググってみたらちゃん定義されてた。

ググって出てきた情報を整理しただけなので詳しい人、補足・訂正よろしく


情報

CS2013

https://www.acm.org/binaries/content/assets/education/cs2013_web_final.pdf

CS2013はACM/IEEE-CSによるカリキュラム標準。

ACM(計算機協会)はコンピュータ分野全般国際学会、IEEE-CSIEEE(米国電気電子学会)の中にあるテクニカルソサエティ


J07-CS

https://www.ipsj.or.jp/12kyoiku/J07/20090407/J07_Report-200902/4/J07-CS_report-20090120.pdf

J07-CS一般社団法人情報処理学会がCC2001CSベースアレンジを加えたカリキュラム標準。今はCS2013を反映したJ17-CSがあるらしいけどその辺は良く分からん

IPA共通キャリアスキルフレームワークとの対応表もあり。

https://www.ipa.go.jp/files/000024060.pdf


知識体系

J07ーCSから抜粋CS2013と比較するとナレッジエリアがあったり無かったり。

KAナレッジエリアKUナレッジユニットアユニット最低履修時間
DS離散構造DS1関数, 関係, 集合6
DS離散構造DS2論理6
DS離散構造DS3グラフ4
DS離散構造DS4証明技法8
DS離散構造DS5数え上げと離散確率の基礎7
DS離散構造DS6オートマトン正規表現6
DS離散構造DS7計算論概論4
DS離散構造DS8計算
PFプログラミングの基礎PF1プログラミング基本的構成要素9
PFプログラミングの基礎PF2アルゴリズム問題解決6
PFプログラミングの基礎PF3基本データ構造14
PFプログラミングの基礎PF4再起5
PFプログラミングの基礎PF5イベント駆動プログラミング4
ALアルゴリズムの基礎AL1アルゴリズムの解析の基礎4
ALアルゴリズムの基礎AL2アルゴリズム設計手法8
ALアルゴリズムの基礎AL3基本アルゴリズム8
ALアルゴリズムの基礎AL4アルゴリズムの高度な解析
ALアルゴリズムの基礎AL5高度なアルゴリズム設計
ALアルゴリズムの基礎AL6計算クラスPとNP
ALアルゴリズムの基礎AL7暗号アルゴリズム
ALアルゴリズムの基礎AL8幾何アルゴリズム
ALアルゴリズムの基礎AL9データ分析アルゴリズム
ALアルゴリズムの基礎AL10並列・分散アルゴリズム
ARアーキテクチャ構成AR1論理回路と論理システム6
ARアーキテクチャ構成AR2データマシンレベルでの表現2
ARアーキテクチャ構成AR3アセンブリレベルマシン構成7
ARアーキテクチャ構成AR4メモリシステム構成アーキテクチャ5
ARアーキテクチャ構成AR5インタフェース通信3
ARアーキテクチャ構成AR6機能構成7
ARアーキテクチャ構成AR7並列処理と様々なアーキテクチャ2
ARアーキテクチャ構成AR8性能の向上
ARアーキテクチャ構成AR9ネットワーク分散システムのためのアーキテクチャ
OSオペレーティングシステムOS1オペレーティングシステム概要1
OSオペレーティングシステムOS2利用者から見たオペレーティングシステム1
OSオペレーティングシステムOS3オペレーティングシステム原理1
OSオペレーティングシステムOS4プロセス構造スケジューリング3
OSオペレーティングシステムOS5並行性4
OSオペレーティングシステムOS6メモリ管理4
OSオペレーティングシステムOS7入出力デバイス管理と入出力
OSオペレーティングシステムOS8ファイルシステム2
OSオペレーティングシステムOS9認証アクセス制御1
OSオペレーティングシステムOS10セキュリティと高信頼化
OSオペレーティングシステムOS11リアルタイムシステム組込みシステム
OSオペレーティングシステムOS12並列分散処理のためのオペレーティングシステム機能
OSオペレーティングシステムOS13オペレーティングシステム構成
OSオペレーティングシステムOS14システム性能評価
NCネットワークコンピューティングNC1ネットワークコンピューティング入門2
NCネットワークコンピューティングNC2通信ネットワーク接続7
NCネットワークコンピューティングNC3ネットワークセキュリティ2
NCネットワークコンピューティングNC4クライアントサーバコンピューティングの例としてのウェブ3
NCネットワークコンピューティングNC5分散アプリケーションの構築
NCネットワークコンピューティングNC6ネットワーク管理
NCネットワークコンピューティングNC7ワイヤレスおよびモバイルコンピューティング
NCネットワークコンピューティングNC8マルチメディア情報配信システム
PLプログラミング言語PL1プログラミング言語概要2
PLプログラミング言語PL2仮想計算機1
PLプログラミング言語PL3言語翻訳入門2
PLプログラミング言語PL4宣言と型3
PLプログラミング言語PL5抽象化メカニズム3
PLプログラミング言語PL6オブジェクト指向言語6
PLプログラミング言語PL7関数言語
PLプログラミング言語PL8論理言語
PLプログラミング言語PL9スクリプト言語
PLプログラミング言語PL10言語翻訳システム
PLプログラミング言語PL11システム
PLプログラミング言語PL12ブログラミング言語意味論
PLプログラミング言語PL13プログラミング言語設計
HCヒューマンコンピュータインタラクションHC1ヒューマンコンピュータインタラクションの基礎6
HCヒューマンコンピュータインタラクションHC2簡単グラフィカルユーザインタフェースの構築2
HCヒューマンコンピュータインタラクションHC3人間中心のソフトウェア評価
HCヒューマンコンピュータインタラクションHC4人間中心のソフトウェア開発
HCヒューマンコンピュータインタラクションHC5グラフィカルユーザインタフェース設計
HCヒューマンコンピュータインタラクションHC6グラフィカルユーザインタフェースプログラミング
HCヒューマンコンピュータインタラクションHC7マルチメディアシステムのHCI 的側面
HCヒューマンコンピュータインタラクションHC8協同作業コミュニケーションのHCL的側面
MRマルチメディア表現MRI情報ディジタル表現2
MRマルチメディア表現MR2文字コード1
MRマルチメディア表現MR3標本化。 量子化圧縮原理アルゴリズム
MRマルチメディア表現MR4マルチメディア機器
MRマルチメディア表現MR5オーサリング
GVグラフィックスとビジュアルコンピューティングGV1グラフィックスにおける基礎技術2
GVグラフィックスとビジュアルコンピューティングGV2グラフィック・システム1
GVグラフィックスとビジュアルコンピューティングGV32次元画像の生成と加工
GVグラフィックスとビジュアルコンピューティングGV4モデリング
GVグラフィックスとビジュアルコンピューティングGV5レンダリング
GVグラフィックスとビジュアルコンピューティングGV6コンピュータアニメーション
GVグラフィックスとビジュアルコンピューティングGV7視覚
GVグラフィックスとビジュアルコンピューティングGV8仮想現実(VR)
GVグラフィックスとビジュアルコンピューティングGV9コンピュータビジョン
ISインテリジェントシステムIS1インテリジェントシステムの基本的問題3
ISインテリジェントシステムIS2探索および制約充足2
ISインテリジェントシステムIS3知識表現および推論
ISインテリジェントシステムIS4高度な探索
ISインテリジェントシステムIS5高度な知識表現と推論
ISインテリジェントシステムIS6エージェント
ISインテリジェントシステムIS7自然言語処理
ISインテリジェントシステムIS8機械学習ニューラルネット
ISインテリジェントシステムIS9プランニングシステム
ISインテリジェントシステムIS10ロボット工学
IM情報管理IMI情報モデルシステム2
IM情報管理IM2データベースシステム2
IM情報管理IM3データモデリング4
IM情報管理IM4関係データベース3
IM情報管理IM5データベース問合わせ3
IM情報管理IM6関係データベース設計データ操作
IM情報管理IM7トランザクション処理
IM情報管理IM8分散データベース
IM情報管理IM9データベース物理設計
IM情報管理IM10データマイニング
IM情報管理IM11情報格納と情報検索
IM情報管理IM12ハイパーテキストハイパーメディア
IM情報管理IM13マルチメディアデータベース
SP社会的視点情報倫理SP1コンピ

2022-11-28

藤田ニコル藤田二コルと表記されてた件

原子力原子カに表記されてた件や

北千住が北干住に表記されてた件を思い出した。

日本人ですら時折スルーしてしまうんだから

アルファベット主体の人たちから文字コード策定時に「土と士は同じでよくない?」とか言われるのも分かるわ。

2022-11-22

文字コード八分言語ってあるんだろうか(その言語で使われている文字登録されていないので表記しようがない)

そういうところは旧列強国の言語ネットに発信してるだけなのだろうか

2022-03-06

調子に乗ってる老害の鼻をへし折ってしまって罪悪感を感じている

あるオープンネットコミュニティにて、知識20年ぐらい前で止まっている文字通りの老害が偉そうに新人講釈をたれていたので思いっきり鼻をへし折ってしまった。

未だに「IE11未満の対応を考えて~」とか、「Macではローマ数字文字化けするからなるべく使わないように」とか、「文字コードは必ずUTF8を指定しましょう。ShiftJISでは…(ここからShiftJISの歴史の話が延々と続く)」とか言ってて、こりゃ時間無駄だと思って「論破」してやった。

その結果なんだが、当然こちらは正論なので勝ってしまうわけだ。

以降、その人は表に出てこなくなった。

ものすごい罪悪感を感じるようになった。

正論なんだからつのは当然なんだ(ここでの「正論」は絶対的に正しいとかではなく、場を健全にする、ぐらいの意味合いでとらえてくれ)。

つのが分かってるんだから、どっしり構えているべきだった。

この武器の抜きどころは他にもあったよねっていう。

とはいえ、年単位老害っぷりを傍若無人に発散されてはやっぱり困る。

中途半端に斬ったらいくらでも蘇ってくる。

抑止力であった武器を発射してしまった感じだ。

戦争が早く終わることを願う。

311を忘れない。

2022-02-25

50年後も生きているファイル形式

50年後タイムマシンを掘り返して出てきたファイルで、

一般的デバイスGUI上で「往時と変わりなく読める/再生できる」もの予想

(取り込み方法は置いといて)

JPEG画像

PDF/a(画像+α)

他、よくわからんもの

TXT文章)→日本語文章場合文字コードとかどうなってんだろう

MP3(音声)→WAVよりは…

SVGベクター)→PDFのついでに読まれそう

賢い人たち教えて!

2022-02-03

1byteが8bitなのはマナー講師のせい

もともと1byteは7bitだったんだ

なぜかってASCII文字を表すのには128通りあればよくて、2^7=128だから

ところが当時コンピュータを作っていたIBMマナー講師がやってきた

「目上の方が使う文字コードと目下の者が同じ文字コードを使うのは失礼にあたる」

こんなことを言ってギャーギャー騒ぎ出した

マナー講師曰く、上司から部下に送られた文章に返信するとき、部下が上司と同じ文字を使うのは失礼にあたるとのこと

タイプライターで打ち出すとき上司より部下が一回り小さいものを使って文字を変えていたのに

デジタルデータにするとき文字コード上でその区別をつけられないのはいかがなものか、という話になった

IBM側では協議を重ねた結果、全ての文字列の先頭にフラグ(0=上司、1=部下)を付けることで対処した

それで1byteは8bitになってるんだぜ

知らんけど

2022-01-25

anond:20220125141559

俺は設計より実装の方が苦手だわ。プログラミング言語特に脈絡のない仕様ファイルオープンして1行読むのってどうやるんだっけ?改行コードの扱いはどういう仕様だっけ?EOF判定はどういう関数だっけ?str2numに対応する処理の関数はなんだっけ?文字コードがUTF8じゃない場合にはなんか特別引数書かないといけないんだっけ?1行読んでポインタを先頭に戻したい場合はどう書くんだっけ?ていうかディレクトリ内のファイルリスト取得する関数はなんだっけ?あー余計なファイルをはじくための正規表現仕様はなんだっけ?.......)が全く記憶できなくてすげーストレス。なんど覚えても雑然としすぎていてすぐ忘れる。ファイル云々に限らずプログラミング一事が万事全部そうだし…。

設計とかアルゴリズムのものの構築はもっとずっとすっきりした数学論理学的な構造で考えられるから楽。

2021-12-10

anond:20211210135422

「断言はできませんが、utf-8以外の文字コードを使ったことで発生したエラー可能性があります

エラーutf-8以外の文字コードをつかってたんちゃうん?しらんけど」

意味的に大差ないと思うけど何が気に入らんの?

2021-09-06

𝗮𝗺͜𝗮͉𝘇𝗼𝗻

𝗮𝗺͜𝗮͉𝘇𝗼𝗻

これの文字コードどうやってんのw

2021-07-25

熊の絵文字みたいなやつ

そもそもどんな文字コードだよと思ったら顔の部分に合成文字を使っているのか。

APIが想定できないケースなのだろうな(ちょろ過ぎないかと思わなくもないが)

2021-07-08

[]2021年7月7日水曜日増田

時間記事文字数文字数平均文字数中央値
0012617354137.745
0195678271.442
0248467697.454.5
0352371271.456
0453379071.540
05396825175.056
06747895106.741.5
07949784104.139.5
0892723678.752.5
0996641866.943.5
1018519276104.239
1116218339113.241
1215218072118.944
131581327484.044.5
14118938779.633.5
1515417951116.648.5
161811601488.543
171441199283.331.5
181291045581.031
1913715240111.251
201791406178.635
2118120130111.248
2220624346118.245
232432090586.038
1日309830391498.143

本日の急増単語 ()内の数字単語が含まれ記事

91年(30), unicode(3), 7月7日(3), リュウジ(4), 彦星(4), ソムリエ(15), 豊洲市場(3), 文字コード(6), 唖(4), 七夕(10), 両さん(3), プリキュア(20), タレント(18), ハンバーグ(8), PV(7), アーティスト(14), 焼く(8), スイッチ(10), 付近(8), 衣装(8), 五輪(30), レシピ(9), ダンス(9), 国語(12), 観客(8), オリンピック(58), 韓国(40), 感動(24), 反省(29), 接種(25), ワクチン(66), 打っ(19), アイドル(36), 中止(24)

頻出トラックバック先 ()内の数字は被トラックバック件数

女性VTuber元カレについて話している動画 こんなの許されるのか /20210706191608(37), ■主語デカ病気 /20210707061507(35), ■「感動を届ける」の類語他にある? /20210707164659(27), ■○○ソムリエという言葉を使うのを今すぐやめてください /20210707083056(27), ■【追記有り】男性問題について何故女性が首を突っ込んでくるのか?という疑問 /20210707213629(19), ■東京オリンピックプリキュア人質に取られた気持ちがわかるか。 /20210706120130(18), ■最近はてなが糞溜になってきてる /20210707093406(15), ■料理においてよくわかっていない所 /20210706120259(12), ■同じ20前後グループでも日本韓国でこれだけ違うから悲しくなる /20210707112939(12), ■なんで氷河期世代20代だった頃、処女厨覇権握ってたの? /20210707152859(12), ■俺の性癖が一番気持ち悪い自信がある /20210706190411(11), ■好きで漫画描いてるけど /20210707064836(10), ■映画タイトルプリキュア入れていこうぜ /20210707162046(10), ■リュウジのパクリについて /20210706172941(9), ■磯野カツオはどう見てもフネの孫 /20210707003201(9), ■はてなーの邪推が酷い /20210707120139(8), ■欧米出生率やばいことになってる /20210707135356(8), ■増田ブクマは運次第 /20210707135546(8), ■名前に入ってるとカッコいいと思う漢字 /20210707143138(7), ■マッチングアプリ女の子とヤったら初手で不治の病を引いた話 /20210706181333(7), ■しにたい /20210707015718(7), ■senbuuさんさぁ…… /20210706141425(7), ■クッキーの利用を聞いてくるサイト /20210707185657(7), ■「腐女子除霊師オサム」を読んだ男オタク感想 /20210707013052(7), ■転職組、ディスられる /20210707224811(7)

2021-07-07

anond:20210707105937

もう少し詳しく話すならエディタでもブラウザでも表示されていた

さら文字コード指定UTF-8文字unicode

なのにいつの間にか化けたかファイルを開いてみたらファイルまで化けていた

anond:20210707110009

anond:20210707102807

なんでHTMLファイルの中身まで「?」に変わってるわけ?

そんなことあり得るの?

だれかmacファイル開いて化けたんじゃねえの?

いやunicodeからそれでも化けないよな?

化けることはある。

unicodeとして読み取れば正しく表示できるデータが格納されているテキストファイルだとしても、それをShiftJISとして読み取ればそこに格納されているデータは化けた文字として解釈されてしまう。

テキストファイル基本的自身が使っている文字コードを宣言するデータを含まなくてもよいので、このような解釈ミスが発生することはあり得る。

anond:20210707104914

エディタが表示できない文字勝手に置換して元の文字コードが失われている状態」を文字化けと言ってる可能性がある

プロならそういうところから確認するんだ

2021-05-25

逆レイプ」という言葉ポリコレではない

レイプが仮に男から女への暴力とした場合にその逆の女から男への性暴力という意味合いで使われるのが逆レイプになるわけだが、何故レイプ男性から女性に行われることがスタンダードであるという前提なのか。

逆レイプだって日常的に存在するのではないのか?

ならばこそ、今からこの言葉使用しないように心がけていかなければならない。

から女へのレイプは「嬲」、女から男の場合は「嫐」、女から女へのレイプは「姦」という風に変えていくべきである

から男へのレイプは? 文字コードに無いからナシでいいんじゃない

2021-05-18

Firefox君さぁ

いくらプライバシーがどうこう言われても機能ちゃんと動かないと使い物にならないんだよ

input type="color"でdatalist指定した時にちゃん候補出してほしいし

dialogフラッグ扱いじゃなくて普通に開放してほしいし

昔のcgiゲームちゃん動作させてよ(具体的には初代の商人物語がまともに動かない。たぶん文字コード判定が厳格で認識しない?)

からGoogleChromeしか使えんのよ(今はEdgeChromium化したからまあまあ使えるが)

2021-04-08

anond:20210408221511

から実在するとして)当時の技術の浸透度を考えてもまじめな判定をしている可能性はほぼなくて

多少はマシなひらがな解析と、適当な思いつきで組んだランダム同然な判定を混ぜた遊び程度のものだと思うんだよね

ランダム同然というのはたとえば文字コードを参照してスコア化するとかでもいい

難しい漢字が出たらスコアを下げるくらいの判定はできるので意外とそれっぽい数字になるかもしれない

ただ文が短かったり、ひらがな感嘆符が少なかったりすると精度が落ちてランダムスコアの重みが増してしまうとかの意図せぬ特性もありそうだ

あとは品詞解析くらいなら当時でもネットライブラリがありそうだが、Excel VBAで使うというのは非現実的かな

ログイン ユーザー登録
ようこそ ゲスト さん