データ表
このツールは、参照および開発に役立つデータ テーブルを提供し、各データ テーブルの変換および検索ツールを提供します。
Unicode 変換と検索
グリフ、16 進数、10 進数、または 8 進数の値を入力して Unicode 情報を検索します。Unicode "U+undefined" Information
• 名前: undefined undefined
• カテゴリー: undefined (undefined)
• Bidirectional Class: undefined (undefined)
• Combining Class: undefined (undefined)
• Script: undefined
Unicode ブロック テーブル: undefined (U+undefined ~ U+undefined)
Unicodeブロックリストを選択し、テーブル内のUnicodeデータを検索できます。表内の行を選択すると、上のカードに Unicode 情報が表示されます。UNICODE 説明
Unicode 標準は、世界のすべての主要な書記体系で書かれたテキストの使用をサポートするために設計された Unicode コンソーシアムによって維持されているテキスト エンコード標準です。この標準には、さまざまな言語の文字を表す約 100,000 文字が含まれています。 ASCII は 1 バイトのみを使用しますが、Unicode は文字を表すために 4 バイトを使用します。したがって、非常に多様なエンコーディングが提供されます。 UTF-8、UTF-16、UTF-32 の 3 つのタイプがあります。その中で、UTF-8 は主に使用されており、多くのプログラミング言語のデフォルトのエンコーディングでもあります。
長年にわたり、Unicode 標準エンコードは着実に拡張され、現在ではチェロキー語、モンゴル語、古代エジプトの象形文字などの言語が含まれています。 Unicode コンソーシアムは、単に標準化された文字コード システムを提供するだけでなく、アラビア語やスワヒリ語で日付がどのようにフォーマットされるかなどの標準的な「ロケール」データや、プログラマーの開発を支援するコード ライブラリを含めるように取り組みの範囲を拡大しました。 Unicode はもともと、それまでに設計されたすべてのテキスト エンコーディングに存在する制限を超えることを目的として設計されました。各エンコーディングは、独自のコンテキストでの使用に依存していましたが、他のエンコーディングとの互換性は特に期待されていませんでした。実際、選択した 2 つのエンコーディングは一緒に使用するとまったく機能しないことがよくあり、一方でエンコードされたテキストがもう一方では文字化けとして解釈されます。ほとんどのエンコーディングは、多数のスクリプト間の相互運用ではなく、少数のスクリプト間 (多くの場合、主に特定のスクリプトとラテン文字間) の相互運用を促進することのみを目的として設計されており、サポートされているすべてのスクリプトが一貫した方法で処理されるわけではありませんでした。