Glossary用語集

Unicode

ゆにこーど

Unicode(ユニコード)とは?

Unicodeとは、「世界中の文字を、1つの決まりごとで表現しよう」という考え方で作られた文字コードの規格です。
たとえば、日本語・英語・中国語・アラビア語・絵文字など、言語や国が違っても、すべての文字を一つのルールで扱えるようにすることを目的としています。

なぜUnicodeが必要だったのか?

昔のコンピュータでは、国や言語ごとに別々の文字コードが使われていました。
たとえば:

  • 日本では「Shift_JIS」や「EUC-JP」など
  • アメリカでは「ASCII」
  • ヨーロッパでは「ISO-8859」など

このせいで、同じ文章でも環境が違うと文字化けしてしまうことがよくありました。
そこで、「世界共通の文字コードを作ろう」ということで生まれたのがUnicodeです。

Unicodeの特徴

  1. 世界中の文字を統一的に扱える:日本語、英語、韓国語、ヒンディー語、記号、絵文字など、ほとんどの文字を一つのルールで管理しています。
  2. 一文字ごとに番号(コードポイント)が決まっている:たとえば、「A」はU+0041、「あ」はU+3042というように、すべての文字に番号がついています。
  3. 文字化けを減らせる:環境の違いに左右されにくく、メールやウェブページなどでの文字化けが少なくなりました。

よく使われている「UTF-8」って何?

Unicodeを実際にコンピュータで使うためには、「どうやって保存するか(エンコード)」の方法が必要です。
その中でも、最も広く使われているのが UTF-8(ユーティーエフエイト) という形式です。

  • UTF-8は、英語などのアルファベットは少ないデータ量で、
  • 日本語などの多くの文字は少し多めのデータで、 効率よく扱えるようになっています。

WordPressや多くのウェブサイトでも、デフォルトでUTF-8が使われています。

Unicodeが使われている場面

  • ウェブページ(HTML、CSSなど)
  • メールの本文
  • スマホの絵文字
  • プログラミングの文字列処理
  • PDFやWordなどの文書ファイル

Unicodeは、今ではコンピュータやスマートフォンで文字を扱うときの「当たり前の基準」となっています。

まとめ

Unicodeは、世界中のあらゆる文字を1つのルールで扱うための文字コード規格です。
言語や国が違っても、同じルールで文字を扱えるので、文字化けなどのトラブルを防ぐことができます。
今のインターネットやアプリの世界では、Unicodeは欠かせない土台のひとつになっています。