サーバーからダウンロードしたファイルを解凍すると日本語が全て文字化けしてた時の原因と対策

サーバーからダウンロードしたファイル(.tar or .tar.gz)を解凍した際に、以下画像のように日本語ファイルが全て文字化けしてしまう時の原因と対策についてメモ。
screenshot_5971
▲7zipだとこんな風に文字化けする

※具体的には、Xサーバーのコントロールパネルにある「バックアップ」という項目からサーバーのファイルを一括で「.tar.gz」でダウンロードしたもので発生した
screenshot_5981

原因

原因は「サーバー(Linux)の文字コードは全てUTF-8で、Windowsの文字コードがCP932だから」。

で、UTF-8に対応していない解凍ソフトで解凍すると、CP932だと勘違いしたまま解凍するから、日本語ファイルは全て全滅する。

※「7zip」とか「Lhaplus」はUTF8には対応していないらしい(?)

対策

なので、対策としては「UTF-8に対応した解凍ソフトを使用すれば良い」。

実際に以下のソフトを使用すれば、文字化けせずに解凍出来た。

無料圧縮・解凍フリーソフト CubeICE – CubeSoft

ウィザードに進めてインストールするだけ。
screenshot_595

こんな感じで↓で普通の解凍ソフトを同じく解凍出来る。
screenshot_5961

WindowsをUTF8対応にする?

Windowsでも、パッチを導入すればUTF8で解凍する事が可能になるらしい。

以下はWindows7の方法だけど、他のOSでももしかしたら可能なのかもしれない。(試してない)

※以下引用

日本語ファイル名が UTF-8 でエンコードされているものについては、Windows7・Windows Server 2008 R2 用 Hotfix を適用すれば解消される模様。

引用:ZIPファイルに日本語ファイル名が含まれる場合の文字化け予防方法(Windows7, CentOS 6) – 風柳メモ

余談

というかこれまでの人生で文字コードのせいで100回くらい悩まされてる気がする。

もう全部UTF-8に統一してくれよ・・。

「CP932」とか「EUC-JP」とか「SJIS」とか意味分かんねーよ氏んでほしい・・。

おわり

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク