htmlファイルの文字コードを変換する

私が管理しているhtmlファイルの文字コードはEUC-JPで統一していたのだが、最近はSublime Textで編集することが多くなり、Sublime Textは基本的にUTF-8のテキストしか扱えない、プラグインで他の文字コードも扱えるがやや面倒なことがある、という問題がった。そこで、今でも編集することが多い、政治情報ドキュメント(http://politics.free-active.com/document/)のhtmlファイルはUTF-8に変換することにした。

けっこう面倒くさいかと思ったが意外とそうでもなくて、まず、Repl-AceというWindowsのアプリケーションを使って文字コードを一括変換して、Sublime Textを使ってhtmlファイル内のcharsetをUTF-8に一括置換して、一部の文字を文字参照で書いていたので、それを普通に書くようにして、終了。最後の作業はこのサイト独自の作業なので、文字コード変換という点では、2ステップで完了した。

私が管理しているサイトを全部UTF-8にしたほうがいいのかもしれないが、放置状態になっているのも多々あるし、そこまではしなくていいかなとは思っている。必要に応じて、ということで。