【悲報】マイクロソフト「Shift-jisとかいうローカル文字コード使うのやめろ」
■ このスレッドは過去ログ倉庫に格納されています
Microsoft、Shift_JISや外字からUnicodeへの移行を呼びかけ
Microsoftが、外字の利用を止めることを推奨するブログ記事を公開している(窓の杜)。
Microsoftが収集したWindows診断データによると、日本では突出して外字の使用頻度が高いという。
この背景には、Windowsにおいては長らく日本語の文字コードとしてShift-JISが使われており、Shift-JISで
表現できない文字を外字として登録して使っている、ということがあるようだ。一方で現在のWindowsは
Unicodeをサポートしており、Unicodeを利用することで「外字でなければ表示できない文字」はほぼなくなるという。
https://www.zaikei.co.jp/article/20200306/556304.html Unicodeにしたら中国漢字になったりするのがいや そんなのより縦書きの…や―や→が横になる不具合はいつになったら直るんだろうか……
というかそもそも直す気あるんだろうか そんな簡単な話やないぞ
昔ながらの漢字や書道家が作った漢字を使おうって一族は多いから
外字じゃないと対応できんのや HTML5はUTF-8前提なのに
s-jisやecuで宣言してるのがあるなあ linuxでログファイルがUTFやったりSJISやったりEUC-JPやったりするのなんなん?
毎回エンコードすんのめんどいんやが 最強最悪のクソオブクソオブクソオブクソ記号
半角の¥を廃止してバックスラッシュに統一しろ
MSが率先して実力行使するべき 未だに日本語フォントと中華フォントの区別がつかない糞エス&343 >>12
英字オンリーのログなら、それらどの文字コードでも同じ。
日本語入るlinuxのログなんて、自作プログラム以外に出力されないだろ?
それエディタの文字コード判定の優先順位がガバなだけ。
サクラエディタみたいなアホ使ってない? コロナ世界中に広めたくせに他国の対応を批判してる中国みたいだな >>17
ニートやん君(笑)
無理してレスせんでええで >>14
アホとかいうレベルじゃない
職種変えなければならないレベル >>20
man ascii
をまず読め。
出力ログがこの範囲の文字だけで出来てるなら、utf8 euc sjisどれでも間違いじゃない。
てかこんなこと解らんで、まさかプロとして金とってんの?
ないわー。 今どきUnicode使わないほうが面倒くさいし時間が解決する話
Unicodeにすら入ってない異体字なんかもう無視していい
そもそもガイジって書き間違いやろ >>23
間違いか否かなんてハナから言うてへんやん
無職の上にメクラなんか 直 と https://glyphwiki.org/wiki/u76f4-us の
区別がつかんような馬鹿規格は
超漢字の爪の垢でも煎じて飲んどけ >>25
まず最初に、なんでなん?
って質問系の文章で、わざわざエンコードまでしてる内容だった。
俺は素直にその質問に答えた。
君は、質問に答えた人間にどんなレスつけた?
人をメクラ呼ばわりする前に自分の書き込みを見直せ >>28
なんなん?となんでなん?が同義やと思ったアホか
別にお前みたいなイベリコ豚に質問したつもりはないねんけどな
あとCUIでログとか見てるからサクラエディタとか的外れやで 中国語の簡体字の簡略漢字と日本語の漢字が同じコードに割り振りされている問題ってどうなったの >>30
なおさら意味不明
lessとかじゃなく、わざわざvim emacs?
なぁ、まじでプロとして金取ってんの?
それに、これらのエディタだったら.vimrcとかでいくらでも解決策あるやん。
まじで大丈夫か? >>30
内容的にも疑問形で「なんなん?」だとなんなの?って言ってるように見えるんだけど、どういう意味だったのかちょっと知りたい
「なんなん」自体を他の使い方するのは知ってるけど、当てはまらない気がして >>12
おっ、linuxエアプか?
ドヤ顔でubuntu出羽守してそう Unicodeはなーサロゲートペアの扱いが面倒くさいのがなー。 お前のところのOSからSJISをデフォルトするのやめればいいと思うよ。 >>4
それおま環
フォントを源ノ角ゴシックなりNoto Sans JPなりに変えろ >>32
どうもなってない。今更変えるわけにいかんし >>33
急に社畜臭がしてきたな
プロとしてめっちゃ連呼するやん
多分お前の年収の倍以上はもらってんで(笑) >>35
ドヤ顔でいじってんのはレッドハットやな
あとはSQLもできるで
プログラミングはチンカスや RHEL触ってるほうがよっぽど社畜臭じゃん
それともFedoraとかCentOSのことを言いたかったのか >>43
何いうてんねん
触ってるOSで社畜かどうか決まるんか? >>32,40
異体字セレクタで完全に解決してるよ
もちろん使ってるフォントが両方の自体持ってたら別に表示されるし、片方なら同じになる
CJK統合漢字の異体字の区別のためにShift_JISを使う必要性は消えた >>41
社畜以前に、お前がお金とる水準に達してなくてな。
人をニート扱いしてたのに対しての皮肉で、まじでプロなんかって言っただけなんだけど。
この程度の皮肉も読みとけんようじゃ >>47
お金いっぱい客からとってるしめちゃくちゃ儲かってるで
基準はお前みたいな世間知らずじゃなくてユーザが決めることなんで(笑)
お前も多分うちの顧客やで(笑)
まいどっ! お前も多分うちの顧客やで(笑)
この一文で無能だと判断できる >>38
とっくにやめてるしもうメモ帳すらSJISで保存できなくなった 基本的にはUTF-8の方が楽
しかし全角2バイト前提の糞レガシーファイルを扱うことはまだある キリル文字とローマ字は字形と発音がほぼ同じルーツが同じ文字でも完全に別の領域与えられてるのに、
漢字は形違ってても同じ領域にまとめられるのって酷くね? MS漢字コードやコードページ932という別名もある
マイクロソフトも規格の制定に携わっていたのでは?
昔のソフトを使うのに必要
xpかvistaの頃には既に事前にchcp 932と打たないと駄目だったな そんな事よりsteamで使われる漢字に中国語の漢字みたいなのが混じるの何とかして >>38
7あたりから内部的にはUTF-16だぞ
まあWindowsの使い方とか興味ないだろうし知らないよね情弱さん utf-8のcsvをExcelで開くと文字化けするよね >>44
RHELはSIerのイメージで社畜感が強い
俺もSIer時代そうだったから
UbuntuやCentOSだとWeb系のイメージ >>60
ルール指定して取り込みする必要があるな
最近のバージョンだと素でいけるかもしれんが Windowsの内部はUTF16で
固定長ゆえ文字数とバイト数の一致で途中を参照しやすくて良かったが
難字とか絵文字で32になるサロゲートペア使うせいで今やなんのメリットも無いという現状 >>61
はえー
なるほどな
確かにそうかもしれへんわ 古い国産ゲームエンジンはsjisしか対応してねえんだよ >>60,62
BOM付けてあれば直で開いても正しく解釈できるけどね。
無くても出来るようにしろよ糞が!とは思う。 わエクセルワードが未だにSJISのせいだろ
csv開くと文字化けするやんけ >>63
ついでにMS-DOS互換の為にエイリアス名は未だにShiftJISを引きずってたり
UTF16のロングファイル名と紐付けされているので、これを止めてしまうと過去作成した膨大な数のファイルがアクセス出来なくなる >>57
そりゃそもそも当時は今と違って文字のバイト数すら気をつけないといけないほどのスペックしかなかったからな
それをなんとか2バイトに押し込んだのがShiftJISであって、文字に3バイト以上使うのが当然の今とはぜんぜん違う >>63
そうでもない
XMLとか非固定長のデータのパーサ作るときUTF16の方がずっと効率的に作れる
ほとんどの文字を2バイトで処理できるから、例外処理があったとしても、UTF8みたいに1バイト2バイト3バイト予測つかないエンコーディングよりもヒット率高くできる UTF8はどのバイトを抽出しても「文字の何バイト目かフラグビット」あるから助かる
SJISはこの判定が無理なんだよね ファイルサイズ的にはUTF8よりSJISの方が小さく済むというメリットはある localeにutf8設定できない欠陥osのせいだろ PowerShellがデフォでSJIS使うから参ったわ UTF-8だとUS-ASCIIは1文字1バイトだけど
漢字は1文字3バイトのと1文字4バイトのが混在していて
半角カナすら1文字3バイトだからな... Excelで長年Shift-jis使ってたゴミクロソフトさんはいうことが違う まず、ExcelでのCSV読み書きSJISにしてるの止めろや >>1
その前にWindwosとかいう頻繁なアプデで人類の貴重な時間を食いつぶし続けるクソOSをやめろって言いたい Windowsがなかったら人類はまだソロバン使ってたぞ >>86
掲示板はシフトJIS
変えると過去ログとの整合性が取れないからな 絵文字使える板もShift_JISでHTML数値文字参照使ってやりくりしてるのかと思ってた ■ このスレッドは過去ログ倉庫に格納されています