「Orale」を含む日記 RSS

はてなキーワード: Oraleとは

2018-12-24

UTF8ってunsigned charで良いんだっけ?問題

https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b]

から出発したこの話。あちこち議論されているようですな。

https://b.hatena.ne.jp/entry/s/qiita.com/yumetodo/items/54e1a8230dbf513ea85b]

https://togetter.com/li/1301253]

https://naruse.hateblo.jp/entry/2018/12/24/013446]

文字コードを多少かじった人間としては、また人類文字コードで混乱している。と思っていて議論が深まるのかなと思ったりします。

ただ、この話、見ててもやもやする所が一つありまして、UTF-8の1コードポイント=uint8_t=unsigned charでええんかいな。という点です。

文字コードを少しでも知っている人はUTF-8は1つのコードポイントを可変長のバイト列で表します。

よく言われるようにASCIIは1バイト、大体のCJKV文字は3バイト以上で表します((久々にWikipediaUTF-8見たら、UTF-8サロゲートペアってあるんだねー。罪深いわOrale〜))。最大6バイトで1つのコードポイントを表します。

まりですね、char16_tとかchar32_tとかがUTF-16UTF-32マッピングされるのは分かるんですよ。サロゲートペアは脇に置いておいて、コードポイントを表すのにはこの型(っつーか、データ長)を使うよってのが分かるので。

サロゲートペアを考えたときのUTF16も同じ考え方になるんですけど、UTF-8みたいな可変長のバイト長を取るエンコード方式は、結局、1「文字」を表す型(データ長)が定まらないんですよ。

char8_tをunsigned charの子クラスにしたとしてもそれって、UTF-8にとっては「1文字を表す型」ではないんですよ。「1文字を表すバイト列の単位の1つ」でしかないんですよ。(サロゲートペア考慮したときchar16_tも同様)。

意味論で言っちゃえばUTF-32に対してchar8_tを使っても意味は同じになるんですよ。UTF-32って8ビット×4で構成されるだけなんで。

なので、UTF-8で表される1文字を型で使いたかったらuint64_tの子クラス(本当は最大6バイトなので48でいいんだけど)にしなきゃダメなんじゃねぇの?もしくは最少8ビットで48ビット保証する型。とC++界隈ではない自分は思うわけです。

つーか、可変長文字って示すフラグになる型を作った方がまだマシじゃないのと思うのです。

2015-11-16

http://anond.hatelabo.jp/20151115222455

しろプロレスをナメんなと言いたい。安保がどうしたかなんてチャチな話は国会議事堂の前でも行って勝手にやってろって。

昨日引退した天龍源一郎って男が何年闘ってきたと思ってんだ?プロレスだけでも39年、前歴の相撲も含めれば初土俵から52年。

馬場猪木からピンフォール勝ちした唯一の男だぞ。ピンフォールってのはな、誰にでも出来るもんじゃねえんだよ。

クイックなら不意を突かれました、シュートなら反則です、いくらでも言い訳が立つけどな、ピンフォールは何の言い訳もできねえんだよ。

正々堂々、勝負が決まるんだよ。それを団体トップが許すってことは、下手すればその団体が終わるかもしれないんだよ。

まあ、それで終わらないのがプロレスだけどな。

安保なんか安倍なんやか言って共産党なんやか言ってしばき隊だかSEALDsだかわかんねーけどなんやか言って、お前らマイクパフォーマンスだけじゃねえかよ。

ラッシャー木村だってな喋る前には闘ってからマイク持って喋るんだよ。

こんばんは。ってな。

その点じゃあ藤田諏訪魔もなんだありゃ?藤田年末が楽しみだ」って、おめえは大晦日しか仕事しねえのか!?寺の鐘を突く坊主かよ。

諏訪魔プロレス方向性が違う」解散するロックバンド!?

大体、この二人の遺恨なんていつの話だったか忘れたっての。プロレスラーならごちゃごちゃ言ってねえで闘え。

もう、その場で殴り合いもつれ合いながら場外に落ちて、天龍引退試合横目に見ながらエニウェアマッチを繰り広げろ。

それで引退試合ぶち壊されて頭に来た天龍からグーパンチ喰らって鼻血出して倒れてろっての。顔じゃねえんだよ。

まぁ、闘う闘わないで女々しく引っ張るのもプロレスだ。構わん、やりたまえ。

まり言いたいことはOrale , ViVa La RaZa !!

 
ログイン ユーザー登録
ようこそ ゲスト さん