Windows-1258 - Windows-1258

Windows-1258
MIME / IANA windows-1258
Alias cp1258 ( Codice pagina 1258)
Le lingue) vietnamita , inglese , francese
Creato da Microsoft
Standard Standard di codifica WHATWG
Classificazione ASCII esteso , Windows-125x
Basato su Windows-1252

Windows-1258 è una code page utilizzata in Microsoft Windows per rappresentare i testi vietnamiti . Si avvale della combinazione di segni diacritici .

Windows-1258 non è compatibile né con lo standard vietnamita ( TCVN 5712 /VSCII), né con le varie altre codifiche in uso nella pratica ( VISCII , VNI , VPS ). Piuttosto, è molto simile a Windows-1252 , con le differenze che mancano s-caron e z-caron (che sono stati aggiunti a Windows-1252 in seguito), cinque delle lettere con segni diacritici sono state sostituite combinando i segni diacritici per il vietnamita segni di tono , uno è stato sostituito con il segno đông e altri otto (quattro per caso) sono stati cambiati in quattro lettere vietnamite altrimenti non supportate .

L'uso della combinazione di segni diacritici significa che Windows-1258 può coprire il gran numero di combinazioni di lettere e segni di tono in vietnamita senza compromettere la copertura dei codici di controllo o dei simboli. Tuttavia, significa anche che il software deve fare attenzione a gestire le conversioni tra caratteri precomposti e combinare correttamente le sequenze durante la conversione in/da altre codifiche e rende più difficile la determinazione della lunghezza visibile dall'utente di una stringa.

IBM utilizza la tabella codici 1258 ( CCSID 1258 e CCSID esteso con simbolo dell'euro 5354) per Windows-1258.

UTF-8 è la codifica preferita per il vietnamita nelle applicazioni moderne. Windows-1258 potrebbe non essere sempre vietnamita con codifica Unicode di andata e ritorno a causa delle modifiche causate dalla normalizzazione Unicode . I segni diacritici combinati sono codificati dopo la lettera sia in Windows-1258 che in Unicode (come VNI , a differenza di ANSEL ).

Set di caratteri

La tabella seguente mostra Windows-1258. Ogni carattere viene mostrato con il suo equivalente Unicode .

Windows-1258
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UN _B _C _D _E _F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SIN
0016
ETB
0017
PU
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
US
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
io
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
uno
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
ore
0068
io
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
tu
0075
v
0076
w
0077
x
0078
e
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

20AC
,
201A
ƒ
0192

201E

2026

2020

2021
02C6

2030
<
2039
Œ
0152
9_
144
'
2018
'
2019

201C

201D

2022

2013

2014
~
02DC

2122

203A
œ
0153
Ÿ
0178
A_
160
NBSP
00A0
¡
00A1
¢
00A2
£
00A3
¤
00A4
¥
00A5
|
00A6
§
00A7
¨
00A8
©
00A9
ª
00AA
«
00AB
¬
00AC
TIMIDO
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
'
00B4
µ
00B5

00B6
·
00B7
¸
00B8
¹
00B9
º
00BA
»
00BB
¼
00BC
½
00BD
¾
00BE
¿
00BF
C_
192
À
00C0
Á
00C1
Â
00C2
Ă
0102
Ä
00C4
Å
00C5
Æ
00C6
Ç
00C7
È
00C8
É
00C9
Ê
00CA
Ë
00CB
0300
Í
00CD
Î
00CE
Ï
00CF
D_
208
©
0110
Ñ
00D1
̉
0309
Ó
00D3
Ô
00D4
Ô
01A0
Ö
00D6
×
00D7
Ø
00D8
Ù
00D9
Ú
00DA
Û
00DB
Ü
00DC
ü
01AF
0303
ß
00DF
E_
224
a
00E0
á
00E1
â
00E2
ă
0103
ä
00E4
å
00E5
æ
00E6
ç
00E7
è
00E8
é
00E9
ê
00EA
ë
00EB
0301
í
00ED
î
00EE
ï
00EF
F_
240
¹
0111
ñ
00F1
̣
0323
ó
00F3
ô
00F4
Ô
01A1
ö
00F6
÷
00F7
ø
00F8
ù
00F9
ú
00FA
û
00FB
ü
00FC
ü
01B0

20AB
ÿ
00FF

  Lettera  Numero  Punteggiatura  Simbolo  Altro  Non definito  Differenze da Windows-1252

Codice pagina 1129

La tabella codici 1129 di IBM ( CCSID 1129 e CCSID esteso con simbolo dell'euro 1163) è simile alla pagina codici 1258, ma con le seguenti differenze:

Code page 1129 (differenze dalla code page 1258)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UN _B _C _D _E _F
8_
128
9_
144
A_
160
NBSP
00A0
¡
00A1
¢
00A2
£
00A3
¤
00A4
¥
00A5
|
00A6
§
00A7
œ
0153
©
00A9
ª
00AA
«
00AB
¬
00AC
TIMIDO
00AD
®
00AE
¯
00AF
B_
176
°
00B0
±
00B1
²
00B2
³
00B3
Ÿ
0178
µ
00B5

00B6
·
00B7
Œ
0152
¹
00B9
º
00BA
»
00BB
¼
00BC
½
00BD
¾
00BE
¿
00BF

  Lettera  Numero  Punteggiatura  Simbolo  Altro  Non definito  Differenze da Windows-1258

Guarda anche

Riferimenti

link esterno