「文字コード」を含む日記 RSS

はてなキーワード: 文字コードとは

2024-04-26

anond:20240426121548

拡張子については、例えば Excel拡張子が変わったとき一括対応できる、とか?

あとは普通に".txt" で取り扱ってるファイルはどれだ、って時にその定数の参照箇所を見ればもれなく分かるとか、

取り扱うファイル種別を段階的に変えようってときも、どのファイルは変え終わっててどのファイルはまだ、とかも同じように分かる

あとはあれだ、どのスコープにおける分類なんだって話を明確にする事も出来るだろうな。

const EXT_TEXT = ".txt";

const LOG_FILE_EXT = EXT_TXT;

とか。

パラメータについては、複数選択肢から選ぶ奴は enumしろよ、とは思うが、

enum の前段として内部的な数値表現統一する意味はある

文字コードも大体同じような話か。

まぁ基本的には、拡張子にせよ文字コードにせよ、

ここに定義したもの以外は登場しないよ、という保証をする事は出来るわな。

"UTF-8"を使っている事は Grep かければわかるが、"UTF-8"以外使ってません、の方はそうはいかないし

これ何の意味があるのか教えてほしい

いろんなアプリケーションメンテ(バグ取りとか細かい機能追加とか)を何度か経験してきた。

主にテキストファイルとかCSVファイルとかExcelファイルとかを入出力するものばかりだったんだが、その大半がファイル拡張子グローバル変数化していた。

こんな感じ

const TxtFileExt = ".txt";
const CsvFileExt = ".csv";
const ExelFileExt = ".xlsx";

なので、読み書きするファイル名の指定時は、

outFileName = 〇〇 + ×× + "ABCDEFG" + TxtFileExt;

みたいな指定をしなきゃならない。

これ何の意味があるのかよく分からんのだけど、誰かわかる?

あと、プログラム言語標準的メソッドのあらゆる引数も全部変数定義されてて、そのまま渡すのは禁止、みたいな規約になってる。

たとえば引数が三種類(truefalse(未指定時のデフォルト値)、任意の数値(ただし当該プログラムでは0、10、25以外指定不可))しかないやつはこんな感じ。

const 〇〇ParamTrue = true;
const 〇〇ParamFalse = false;
const 〇〇ParamIntMin = 0;
const 〇〇ParamIntMid = 10;
const 〇〇ParamIntMax = 25;

文字コードなんかもこんな感じで定義されてる。

const charCodeSJIS = "Shift_JIS";
const charCodeUtf8 = "UTF-8";

以前関わった改修内容に「××の処理は開始時と終了時にそれぞれUTF-8(BOMなし)形式ログを出力する」みたいなのがあって、普通に文字コード指定する部分に「UTF-8」で直に書いたら、規約に従ってないからとコードレビューで指摘されて差し戻されたんだけど、そもそもこういう規約って何の意味があるの?

2024-04-18

anond:20240418114312

X(twitter)でもよくあるけど、そういうのって文字コード直打ちで入力してるの?

2024-04-01

anond:20240401185124

この時代文字コード体系では太陽系統一言語の表示が不可能のようで

はい嘘松!乙!

お前はUnicodeを舐めている!

地球のみなさんこんにちは未来から書き込みしてます

この時代文字コード体系では太陽系統一言語の表示が不可能のようで、おじいちゃんの家にあった古文翻訳ソフトを通してになりますが、うまく書き込めていますでしょうか??



追記

はい嘘松!乙!

お前はUnicodeを舐めている!

あっ!お返事ありがとうございますレスバ?っていうんでしょうか?

私たち世界では争いというもの禁止されているので、なんだかとってもウニです!!!あーーおじいちゃん私やったよ昔の人とお話してる!!

あっウニだとわかんないですか?「新鮮」って意味で、ウニっていうのが流行ってるんですよねー

といってもウニって生き物はもう絶滅しちゃってるんですけどね。

ソイプリンにソイ汁をかけたものが味が近いらしくて、それはとっても新鮮で……もうまさにウニ!って感じの味なんです。

すみません脱路しちゃいましたね。あ、脱線というんでしたっけ。

えっと、Unicodeというものは今もあるんですが、地球のみなさんが使っていらっしゃる言語のほうが今はもう誰も喋ってなくて……保護区では何名か暮らしてらっしゃるんみたいなんですけどね。

から統一言語から地球語に変換して、書き込みさせてもらってます!!

2024-03-21

anond:20240321161857

オプションキー推しながら¥キーをすんだよ

なお¥はユニコードの¥で入るのでASCIIの\とは文字コードが違います

なのでプログラムを書く時によく\をつかうのですが

\を入力したつもりで(DOSとかだと¥に表示がなってるだけなので)¥をつかうとなんとプログラムが正常に動きません

これがマックプログラムに不向きな点です

なおこの問題日本語マックでのみ発生しま

2023-09-26

文字入力専用の機械を買った

今日、Pomeara DM250という機械が届いたので、それを使って試し打ちのためにこの文章を書いている。知っている人もいるかと思うが、Pomearaというのは、キングジムという会社が作っている文字入力専用の機械だ。いってみれば昔のワープロだ(昔とはどれぐらいのことかというと、昭和の末ぐらいか平成の初期ぐらいのことをぼんやりと考えている)。

じつはこのPomeraシリーズを買うのは4台目だ。たしか、一番最初モデルが出たときに頑張って買ったのを覚えている。あの機械はどうなったのだろうか。まだ処分していないはずだからどこかにあるはずだ。本体のその軽さにときめいたものだが、なんか使いにくくて結局使うのをやめてしまった。あと本体の一部が加水分解してベトベトになっていたような気がする。

2台目はこのDM 250と同じ形式の、キーボード折りたたみ式じゃない、クラムシェル型の最初モデルだったと思う。書き心地は軽快でかなり気に入っていたが、当時は文章を書くといえば論文がメインだったので、Pomeraがどんなに使いやすくてもcitationを入れる役に立たないという問題があった。で結局iPadWordを使ってドラフトを書いていたことを覚えている。この機種もまだ捨てていないはずだがどこかにいってしまった。

3台目は、はじめて画面にEインク採用したモデルだ。はじめて、というかこれ以降Eインクモデルはなくなってしまったので、最後モデルでもある。これは夜中に液晶画面を見たくないが、文章は書きたいというニーズがあって買ったものだ。Eインクの画面で文字入力ができることに購入当初は感動したものだが、このモデルには複数問題があった。まず文字入力の遅延。キーボードを打って画面に文字が表示されるまでに少しの遅延があるのだ。これは我慢しているとある程度慣れてくるが、まったく気にならないレベルには至らなかった。

次にEインクの画面の汚さ。これはEインクに固有の問題だが、画面を定期的にリフレッシュしないと、先に入力した文字残像が表示されたままになるというか、画面上に変な縞縞がずっと表示されているのだ。これも文字入力に集中していると気にならないが、あるときハッと我に返ると、汚い画面だなあと思ってしまった。

最後文字コードの問題。このモデル文字コードがShift JISしか使えない。最近PomeraにはPomera Linkというアプリ本体からスマートフォンQRコード経由でテキストデータ転送する機能がある。これを使えば、Pomera入力したテキストスマートフォンPCで利用できるのだが、文字コードがShift JISだと使い勝手が悪かった。そのままでファイルを開くと文字化けしてしまうケースがけっこうあり、文字コードを変換してから流用するのが大変な手間だった。これが最大の理由で使うのをやめてしまった。

このモデルはまだ手元にある。売ってしまおうと思っていたが、Eインク文字入力機械を作るという発想自体は好きなので、取っておこうと思い直している。

4台目のDM 250を思い切って買ったのは、上記問題がこのモデルでは解決されていると思ったからだ。まず、文字コードはデフォルトUTF-8なので、今度はストレスなくPomeraから他のデバイステキストデータを流用できるようになった。Pomera Linkアプリも気づけばかなり改善されており、データの読み取りがとてもスムーズになったと感じる。

あとはなんといっても画面がきれいで、文字が読みやすい。初期のモデルに比べるとまったくの別物だと感じる。

それから日本語入力Atok)がとても改善されたと感じる。思うように変換ができなくて変換候補を探し続ける、ということがほぼなくなった。これは大きな改善ポイントだと思う。

ただしこのモデルにも問題がないわけではない。まず、キーボードPCキーボードに比べるとどうしてもひとつひとつキーが小さいので、タイプミスをしやすい。これは指がこのキーボードの大きさに慣れるまでの問題なのかもしれない。だがキーボードの質感じたいがどこか玩具っぽいという感じには慣れそうにない。この値段にしてみればキーボードの質感はもうちょっとなんとかならなかったのだろうかと思う。あとは打鍵感。音が静かなのはたいへんよいが、このキーボードで何時間文字を打ち続けると、指の関節が痛くなりそうだ。そこまで長時間この機械文章を書き続けられればだが。

あとは本体がやっぱり重い。知ったうえで買ったが、このサイズで620gという重さは、手に持つとかなりずっしりくる。手元にあるPanasonicのLet's note本体重量が800g台だったと思うが、これより小さく軽いPomeara DM250を手に持った時の方がずっしり感があるのは不思議だ。PCを持ち運ぶよりはましだといえばそうなのかもしれないが、あまり気軽に持ち運ぶことに適した機種ではない。少なくともPCと一緒に持ち運ぶのはつらいので、外出するときにはPCPomeraか選ぶことになるのだろう。

意気込んで買ったわりにはすぐに使わなくなるものナンバーワンPomeraだ。なのだが気がつけば4台も買い続けているのは、集中して長い文章を書き続けることに自分憧憬を持ち続けているせいだと思う。シンプルに、集中したいという願いをPomeraに込めてしまうのだ。で、気づけばPCに戻ったり、スマートフォンBluetoothキーボード接続して文章を書いたりしている。直感的に、道具としての納得感があれば自分Pomeraを使い続けるだろう。今回のモデルはそうなるだろうか。気づけば約2400文字を30分程度で打ち込んでいるので、まずまずの生産性なのかもしれない。それが続くかどうか、試してみたいと思う。

2023-08-11

anond:20230811225200

😷文字コードが小さい方を優先的に表示してる手抜き仕様なんやろなあ

2023-08-01

anond:20230731115218

そういうのってマイナンバーカードなどの件でも感じるよな。文字コード/異字体や住所表記正規化標準化)などに十分に対応しないまま事を進めた結果、名寄せがうまく出来なくて困っちゃう日本政府......

2023-07-06

anond:20230706143208

絵文字にツッコむなら、ApplemacOS(やiOSでも?)で表示される「コンピュータマウス🖱️U+1F5B1にも是非ツッコんでやるべきw

縦長で角が丸くなった四角形にしか見えん。ボタンもない。マウスに見えないだろよアホかw

自分とこのオシャレな製品の形を主張すんじゃなくて、世間一般で知られてるマウスの形にしなきゃ、情報交換手段としての文字コードとそのグリフの意義が無くなるだろってw

2023-06-20

anond:20230620143356

なになに。どこがダメなの。

 

メモリ空間の使い方。もっと自由につかわせろ。

機械語命令ダイナミック命令作らせろ。

文字コードの標準。JISISOうざい。

メモリ境界が8bitごとになってる。自由にしようぜ。

 

みたいな感じか。

MSX以前の混迷状態になりそう。

2023-04-18

スマホウェブサイト上の文章を長押ししてコピーしようとすると、ちゃん漢字部分なら漢字部分だけが選択される気がする

ひらがな部分を長押しすると、ひらがな部分だけ選択される気がする。

これって、長押し一発でコピーしたい区間に収まって、とても便利でありがたい機能なんだけど、そもそもどういう機構で成立してるんだろうか。

長押し最中に、付近の一文字ごとに文字コードを読み込んで、選択区間を判定しているんだろうか。

それとも、私の気のせいで、そんな機能など無いのかな?よくわからなくなってきた。

からExcel方眼紙はやめろ

システムエンジニアをしているけどお客の自称大企業システム管理経験ありの役職者が要求仕様意気揚々Excel方眼紙資料出してきて頭抱えている。

せめて内容がまともなら良いが書かれている内容も要求仕様からは程遠いメモ書きでこちからかい質問を投げては社内で確認して回答貰うメッセンジャーしかなっていない。これで社内システム責任者

ほんとマジでExcel方眼紙は止めろ。餅は餅屋で表計算だけにしろ馬鹿Excel方眼紙しか出来ないならPDFに出力してよこせ。どうせファイル馬鹿みたいに日付とリビジョン付けんだろうな。

ExcelはA4横に綺麗に罫線ひいて見栄えよく書類作るツールじゃないわ。あとcsvExcelで開くな。Excelに合わせてShift-JIS文字コード要求すんな。システム担当UTF-8ファイルExcelで開いて「文字化けしてますバグですね!」とか言うな。あと郵便番号データ開いて0消してはがきデータ印刷で失敗して焦んな。

こんなこと書くと何故かExcel方眼紙肯定派が出てくるけど一度も納得できる理由を聞いたことが無い。結局馬鹿が色んなツール覚えられないだけでしょ。そういう人はシステム仕事から離れろよ。Office365もまともに使えない奴がいっちょ前にシステムエンジニア意見言うな。レガシーシステムの改変に文句言うな。工数に口出すな。っていうかこっちが言ってること大半理解せず金の時だけ発言すんな。あとアジャイルなんでそんなに好き?アジャイルの前に自社の業務理解しろ。そのうえでExcel方眼紙やめろ。

2023-04-07

anond:20230407185756

こういうのも良いな。

昔のは文字化けしてるけど。

PCブラウザ文字コード指定しないとダメっそう。

iPhoneSafariだとなすすべなしかな。

2023-02-17

仕事で「何やってんだろ…」と思うとき

Macで作られたファイルWindows環境圧縮しようとしたら、文字コードの違いでエラーが出るので、各ファイル名を書き直しているとき。(カタカナ濁音のところとか。)

たとえどんなに素敵なオフィスで働いていても、「何やってんだろ…」と思う瞬間はあると思う。

2023-01-02

三流エンジニアがやりがちなミス

タイムゾーン考えずに時間を使う

暗黙的にJSTとして時間を使ったせいでUTCで作った場所で盛大にバグる

応急処置バグったところを+9とかやってしまうと、それ以降に逆に誰も気付かずに更に影響範囲が拡がったりする

海外展開しようとしたときバグに気付くがどうしようもなくなって途方にくれて海外だけは別アプリになったりする

UNIXTIMEを使えば楽なんだけれど、そうすると生データぱっと見で時間判別できないので困ることも多い

素直にUTCでISO8601が良い

文字コードUTF-8だと大丈夫だと思ってしま

とりあえずUTF-8にしとけば大丈夫、ってことで実装を進めた結果、Mac/Winでハマる

他にもBOMでハマったりして、むしろSJISの方が良かったんじゃ無いか、とか言い出す

DB統一的になっている場合はまだ後からどうにかできるが、変なところでキャッシュされてたりすると凄い困ることになる

MySQLなりPostgreSQLなりでUTF-8を正しく扱う方法はいろんな記事があるのでちゃんと読んでおけば問題無い

価格浮動小数にしてしま

「将来的にはグローバル展開が必要

とかよく分からないことを言い出して価格浮動小数にしてしま

かに米国なら$2.43みたいな感じで価格を使ったりするし、むしろ小数点以下が無い通貨の方が珍しいのだけれど

丸め誤差を考えないで作ってしまってバグが見つかりめちゃくちゃ揉める

応急処置として丸め機能とかが追加されて事なきを得るけれど

そもそも最小単位で扱って表示の時に小数化すれば良いだけ

他にある?

2022-12-20

anond:20221220162023

㋿は文字コードが増えたというより文字を設定していなかった空きコードを使ったんだよね

空き区画指定したわけで区画自体が増えたわけではない

から新元号とはちょっと事情が違うかもしれんね

そうなると中国語文字コードどうやってるんだろう?という疑問は出てくるけど

anond:20221220161636

中国そうなんだー

「㋿」日本元号変わったら漢字じゃないけど文字コード増やしてもいいっぽいから、

新しい漢字作るのも同じ理屈なのにね。

ログイン ユーザー登録
ようこそ ゲスト さん