Table des caractères Unicode (10000-1FFFF)

Un article de Wikipédia, l'encyclopédie libre.
Une représentation graphique du Plan multilingue supplémentaire d'Unicode (SMP). Chaque case numérotée représente 256 points de code.

Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.

Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme U+.... (où .... correspond à un nombre hexadécimal de quatre à six chiffres, entre U+0000 et U+10FFFF).

Plan multilingue complémentaire (PMC/SMP)[modifier | modifier le code]

Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.

Légende des conventions de couleurs et de style

Les blocs affichés sur fond clair sont alloués et contiennent des caractères affichables et normalisés. Certains de ces blocs peuvent également contenir des signes diacritiques.

Les blocs affichés sur fond bleu sont alloués et contiennent des signes diacritiques normalisés qui se combinent avec d’autres caractères de base après lesquels ils sont codés dans les textes.

Les blocs affichés sur fond jaune pâle sont alloués et contiennent des caractères affichables et normalisés pour des écritures de droite à gauche (ils nécessitent la prise en charge des écritures bidirectionnelles pour un rendu correct ; certains de ces caractères, mais pas tous, peuvent nécessiter une présentation en miroir selon le contexte directionnel). Certains de ces blocs peuvent également contenir des signes diacritiques.

Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non interopérables.

Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères affichables (ce sont des caractères spéciaux ou de contrôle).

Les blocs affichés sur fond gris foncé ne sont pas encore attribués officiellement (dans la version actuelle Unicode 15.0). Parmi ceux-ci :

  • les blocs nommés « (en caractères droits entre parenthèses) » sont acceptés par les groupes de travail de normalisation Unicode et/ou ISO et en cours de validation finale pour une normalisation prochaine, cependant la liste exacte et l’ordre des caractères qui seront retenus n’est pas encore définitive, des unifications, distinctions ou ajouts étant encore possibles ;
  • les blocs nommés « (en italique entre parenthèses) » ont seulement fait l’objet d’une proposition formelle et sont en cours de validation par les groupes de travail de normalisation Unicode et/ou ISO, pour une normalisation ultérieure, la liste précise et l’ordre des caractères n’est qu’indicative ;
  • les blocs nommés « ¿en italique entre points d’interrogation? » sont en projet et peuvent être encore déplacés, leur taille étant seulement estimée s’ils sont finalement retenus.

Les blocs affichés sur fond noir sont pour des points de codes réservés de façon permanente à des « non-caractères ».

  • Ils peuvent servir uniquement pour des représentations ou encodages nécessaires à des opérations ou transformations internes, propres à certains processus ou protocoles (qui les utilise avec des règles spécifiques). De tels points de codes sont interdits pour représenter un quelconque caractère dans des textes valides encodés dans une forme UTF normalisée par Unicode ou compatible. En dehors de cet usage interne pour de tels processus ou protocoles, ils ne sont pas interopérables et pas transformables librement entre toutes les formes de codage UTF normalisées.
  • Noter qu'il existe également deux points de code réservés de façon permanente à des « non-caractères » à la fin de chacun des 17 plans dans un petit sous-bloc « spécial » affiché sur fond rouge dans les tableaux ci-dessous.
  • Afin de limiter la taille des pages sur Wikipédia, chaque plan Unicode est subdivisé ici en 16 plages arbitraires de 4 096 points de code chacun, décrits dans des sous-pages plus complètes accessibles par la palette de navigation en haut des pages, ou bien via les liens dans la première colonne des tables ci-dessous.
  • Lorsqu’un bloc officiel d’Unicode s’étend sur plusieurs plages, les liens nommant les blocs dans les tables ci-dessous pointent seulement vers la première partie du bloc, et les autres parties sont liées entre elles et listées chacune dans les sous-pages des plages de 4 096 points de code.
Note : pour le moment seules certaines tables classées par paquet de 4096 points de code sont accessibles dans la première colonne. Les pages de description plus complètes de chacun des différents blocs individuels sont encore souvent absentes (en cours de construction).

Écritures alphabétiques et syllabiques anciennes ou rares et jeux de symboles de gauche à droite[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+10000 linéaire B – syllabaire linéaire B – idéogrammes
U+10100 nombres égéens nombres grecs anciens symboles antiques disque de Phaïstos
U+10200 (paléo-hispanique septentrional) (paléo-hispanique méridional) lycien carien numéros épactes coptes
U+10300 vieil italique gotique ancien permien (ou abour, anbour) ougaritique vieux perse ¿shavien – ext. écr. rapide?
U+10400 déséret shavien osmanya osage
U+10500 elbasan aghbanien vithkuqi (todhri)
U+10600 linéaire A
U+10700 linéaire A latin étendu – F (redjang étendu)

Écritures alphabétiques et syllabiques anciennes de droite à gauche[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+10800 syllabaire chypriote araméen impérial palmyrénien nabatéen (proto-sinaïtique) hatrénien
U+10900 phénicien lydien (sidétique) ¿numidien? hiéroglyphes méroïtiques cursif méroïtique
U+10A00 kharochthî sud-arabique ancien nord-arabique ancien (balti) manichéen
U+10B00 avestique parthe des inscriptions pehlevi des inscriptions pehlevi des psautiers (pehlevi des livres) (babouri)
U+10C00 turc ancien de l’Orkhon runes hongroises anciennes
U+10D00 rohingya hanifi (garay (wolof)) (arabe étendu – D)
U+10E00 (arabe étendu – D) arabe – symboles numéraux rûmîs (chiffres de Fès) yézidi arabe étendu – C
U+10F00 sogdien ancien sogdien ouïghour ancien chorasmien élymaïque

Écritures brahmiques[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+11000 brahmî kaïthî (ou kayathi) sora sompeng
U+11100 chakma (ou changma, ojhapath) mahâjanî charada (ou shard) nombres archaïques singhalais
U+11200 khojkî (landa) multanais (ou multanî) khoudawadî
U+11300 grantha (toulou-tigalari)
U+11400 newar tirhouta (tani)
U+11500 (ranjana) siddham
U+11600 modi mongol (ou bitchig) – supplément takrî (birman étendu – C)
U+11700 ahom (zou) (pyu)
U+11800 dogra (sirmauri) warang citi
U+11900 dives akuru (vatteluttu) nandinagari
U+11A00 carré zanabazar soyombo SACS – ext. A pau cin hau
U+11B00 dévanagari étendu – A ¿charada étendu? (tolong siki) (sunuwar)
U+11C00 bhaïksouki marchen (balti – B)
U+11D00 gondi massaram gondi gunjala (léké)
U+11E00 (tocharien) (khotanais)' makassar
U+11F00 kawi (pallava) lissou – supplément tamoul – supplément

Cunéiforme et autres écritures antiques[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+12000

U+12300
cunéiforme
U+12400 ponctuation et nombres cunéiformes (cunéiforme dynastique archaïque)
U+12500 (cunéiforme dynastique archaïque)
U+12600

U+12D00
¿proto-cunéiforme?
U+12E00 (indus)
U+12F00 (indus)

Écritures hiéroglyphiques égyptiennes et anatoliennes[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+13000

U+13300
hiéroglyphes égyptiens
U+13400 hiéroglyphes égyptiens (hiéroglyphes égyptiens étendus-A)
U+13500

U+13F00
(hiéroglyphes égyptiens étendus-A)
U+14000

U+14300
(hiéroglyphes égyptiens étendus-A)
U+14400
U+14500
hiéroglyphes anatoliens
U+14600 hiéroglyphes anatoliens (hiéroglyphes égyptiens étendus-B)
U+14700

U+14F00
(hiéroglyphes égyptiens étendus-B)
U+15000 (lampung) (kerinci) (mandombe)
U+15100

U+15400
(mandombe)
U+15500

U+15900
¿hiéroglyphes mayas?
U+15A00
U+15B00
U+15C00

U+15F00
¿pictogrammes aztèques?

Écritures littéraires inventées, autres écritures alphabétiques et syllabaires récents[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+16000 (tengwar) (cirth)
U+16100 (moon)
U+16200

U+16500
(Bliss)
U+16600 ¿supplément Bliss?
U+16700 (Bagam)
U+16800
U+16900
supplément bamoum
U+16A00 supplément bamoum mro vah bassah
U+16B00 pahawh hmong (woléaï)
U+16C00 (kpèllé) (afaka) (tangsa (khimhun))
U+16D00 (tikamuli) (kirat rai) (chisoi) ¿lontara bilang-bilang? (kulitan)
U+16E00 (mangwégo) médéfaïdrin (buginais – supplément)
U+16F00 miao ¿bopomofo étendu – A? (kanbun étendu – A) symb. et ponct. sinographiques

Écritures asiatiques orientales larges[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+17000

U+18000

U+18700
tangoute
U+18800

U+18A00
tangoute – composants
U+18B00
U+18C00
khitane – petite écriture
U+18D00 tangoute – supplément (khitane – idéogrammes)
U+18E00

U+19000

U+19500
(khitane – idéogrammes)
U+19600

U+19A00
(jurchen)
U+19B00 (jurchen)
U+19C00
U+19D00
U+19E00
...
U+1A000
...
U+1A200
(syllabaire pau cin hau)
U+1A300
...
U+1A600
(eskaya)
U+1A700 (eskaya) ¿kaïda?
U+1A800

U+1AC00
(nakhi dongba)
U+1AD00

U+1AE00
¿nakhi géba?
U+1AF00 ¿nakhi géba? ¿kana étendu – C? kana étendu – B
U+1B000 kana – supplément
U+1B100 kana étendu – A petits kana – supplément nüshou
U+1B200 nüshou
U+1B300
...
U+1B500
(logogrammes shuishou)
U+1B600
...
U+1B900
(syllabaire lissou)
U+1BA00
U+1BB00

Notations sténographiques[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1BC00 sténographie Duployé sténo.

format.
(sténographie Pitman)

Autres écritures étendues[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1BD00
...
U+1C000

U+1C200
(proto-élamite)
U+1C300 (proto-élamite) (élamite linéaire)
U+1C400 (élamite linéaire)
U+1C500
...
U+1CB00

Symboles hérités et systèmes de notation[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1CC00
U+1CD00
(symboles informatiques hérités – supplément)
U+1CE00 (symboles informatiques hérités – supplément)
U+1CF00 symboles musicaux znamenny
U+1D000 symboles musicaux byzantins
U+1D100 symboles musicaux occidentaux
U+1D200 notation musicale grecque ancienne (flute chinoise) (luth chinois, pípa) numéraux kaktovik numéraux mayas
U+1D300 symboles du Classique du mystère suprême chiffres-bâtonnets chinois ¿symboles mathématiques alphanumériques – supplément?
U+1D400

U+1D700
symboles mathématiques alphanumériques
U+1D800 (signécriture de Sutton)
U+1D900
U+1DA00 (signécriture de Sutton) (jianzi – contrôles de format)
U+1DB00 (jianzi – notation musicale)
U+1DC00 (jianzi – notation musicale)
U+1DD00
U+1DE00

Écritures alphabétiques et syllabiques de gauche à droite[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1DF00 latin étendu – G
U+1E000 glagolitique – supplément cyrillique étendu – D
U+1E100 hmong nyiakeng puachue (hmong eebee)
U+1E200 (cham occidental) toto wancho
U+1E300 (loma)
U+1E400 (loma) (bagam) nag mundari
U+1E500 (pungchen) ¿pungchung? ¿marchung? (brusha) (ol onal)
U+1E600 ¿chola? ¿chalukya (à tête carrée)? (yo lai tay)
U+1E700 ¿béria? éthiopien étendu – B

Écritures et systèmes numéraux de droite à gauche[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1E800 kikakoui mendé
U+1E900 adlam
U+1EA00

U+1EB00
U+1EC00 (numéraux siyaq persans) numéraux siyaq indiens (numéraux siyaq diwani)
U+1ED00 numéraux siyaq ottomans
U+1EE00 symboles mathématiques alphabétiques arabes
U+1EF00 ¿symboles arabes supplémentaires?

Symboles de jeux[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1F000 pièces de mah-jong dominos cartes à jouer

Symboles alphanumériques et sinographiques[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1F100 alphanumériques délimités – supplément
U+1F200 sinogrammes délimités – supplément

Ensembles pictographiques et symboles divers[modifier | modifier le code]

+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1F300

U+1F500
divers symboles et pictogrammes
U+1F600 émoticônes casseau ornemental symboles du transport et cartographiques
U+1F700 symboles alchimiques formes géométriques étendues
U+1F800 flèches – supplément C
U+1F900 symboles et pictogrammes – supplément
U+1FA00 symboles pour les échecs symboles et pictogrammes – extension A
U+1FB00 symboles informatiques hérités
U+1FC00 ¿pictogrammes étendus (émoji)?
U+1FD00
U+1FE00
U+1FF00   sp.

Voir aussi[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Articles connexes[modifier | modifier le code]