VISCII - VISCII

VISCII
MIME / IANA VISCII
Le lingue) vietnamita , inglese
Creato da Gruppo Viet-Std
Definizioni RFC  1456
Classificazione SBCS a 8 bit
Basato su ASCII

VISCII è una codifica di caratteri ASCII modificata non ufficialmente definita per l' utilizzo della lingua vietnamita con i computer . Non deve essere confuso con la codifica VSCII ufficialmente registrata dal nome simile . VISCII mantiene i 95 caratteri stampabili di ASCII non modificati, ma sostituisce 6 dei 33 caratteri di controllo con caratteri stampabili. Aggiunge 128 caratteri precomposti . Unicode e la tabella codici di Windows-1258 sono ora utilizzati per quasi tutti i dati del computer vietnamita, ma i file VSCII e VISCII legacy potrebbero richiedere la conversione.

Storia e denominazione

VISCII è stato progettato dal Vietnamese Standardization Working Group (Viet-Std Group) guidato da Christopher Cuong T. Nguyen, Cuong M. Bui e Hoc D. Ngo con sede nella Silicon Valley , in California nel 1992 mentre stavano lavorando con il consorzio Unicode per includere caratteri vietnamiti precomposti nello standard Unicode. VISCII, insieme a VIQR , è stato pubblicato per la prima volta in un rapporto bilingue nel settembre 1992, in cui è stato soprannominato "Codice standard vietnamita per lo scambio di informazioni". Il rapporto ha rilevato una proliferazione nell'uso dei computer in Vietnam e il crescente volume di comunicazioni informatiche tra i vietnamiti all'estero, che le applicazioni esistenti utilizzavano codifiche specifiche del fornitore che non erano in grado di interagire tra loro e che era quindi necessaria la standardizzazione tra i fornitori. Il successo dell'inclusione del vietnamita composto e precomposto in Unicode 1.0 è stato il risultato delle lezioni apprese dallo sviluppo di VISCII a 8 bit e VIQR a 7 bit.

L'anno successivo, nel 1993, il Vietnam ha adottato il TCVN 5712 , il suo primo standard nazionale nel dominio della tecnologia dell'informazione . Questo ha definito una codifica dei caratteri denominata VSCII , che era stata sviluppata dal Comitato tecnico TCVN per la tecnologia dell'informazione (TCVN / TC1) e con il suo nome che sta per "Codice standard vietnamita per lo scambio di informazioni". VSCII è incompatibile con, e altrimenti non correlato, al VISCII pubblicato in precedenza. A differenza di VISCII, VSCII è uno "standard vietnamita" nel senso di uno standard nazionale .

VISCII e VIQR sono stati approvati come stato informativo RFC  1456 , attribuito al gruppo Viet-Std e datato maggio 1993. Come nel caso degli RFC IETF, RFC 1456 li rileva come "convenzioni" utilizzate dagli oratori vietnamiti d'oltremare su Usenet , e che "non specifica alcun livello di standard". Nonostante ciò, continua a chiamare VISCII il "codice standard vietnamita per lo scambio di informazioni" (lo stesso nome preso da VSCII). Le etichette VISCIIe csVISCIIsono registrate presso la IANA per VISCII, con riferimento a RFC 1456. (Non esiste, d'altra parte, nessuna etichetta IANA ufficiale per TCVN 5712/VSCII, sebbene x-viet-tcvn5712fosse precedentemente supportata da Mozilla Firefox .)

Design

Un tradizionale set di caratteri ASCII esteso è costituito dal set ASCII più un massimo di 128 caratteri. Il vietnamita richiede 134 combinazioni aggiuntive di lettere e segni diacritici, sei di troppo. Ci sono (a meno di eliminare il supporto del segno di tono per le lettere maiuscole, come in VSCII-3 ) essenzialmente quattro modi diversi per gestire questo problema:

  1. Usa la codifica a larghezza variabile (come fa UTF-8 )
  2. Includere la combinazione di segni diacritici per i segni di tono (come VSCII-2 e Windows-1258 ) o per i segni diacritici in generale (come ANSEL e VNI )
  3. Sostituisci un po' di punteggiatura ASCII, preferibilmente punteggiatura che non è invariante in ISO 646 (come fa VNI per DOS )
  4. Sostituisci almeno sei dei caratteri di controllo ASCII di base (come fanno VPS e VSCII-1 )

VISCII andato per l'ultima opzione, sostituendo sei dei meno problematico (ad esempio, meno probabilità di essere riconosciuto da un'applicazione e agito specialmente) codici di controllo C0 (STX, ENQ, ACK, DC4, EM, e RS) con sei dei combinazioni di lettere maiuscole-diacritiche meno utilizzate. Sebbene questa opzione possa causare il malfunzionamento dei programmi che utilizzano quei codici di controllo durante la gestione del testo VISCII, crea meno complicazioni rispetto alle altre due opzioni (i progettisti notano che è stato riscontrato che la trasmissione pulita non a 8 bit pone più difficoltà nella pratica rispetto al riutilizzo dei caratteri di controllo). Tuttavia, le posizioni dei caratteri di controllo C0 o C1 e dei codici utilizzati per lo spazio unificatore in ISO-8859-1 , Mac OS Roman e OEM-US sono stati deliberatamente assegnati a lettere maiuscole, con l'intenzione di utilizzare punti di codice minuscoli con un carattere tutto maiuscolo una soluzione utile se i caratteri grafici non potevano essere visualizzati per quei codici.

Tuttavia, l'utilizzo di tutti i punti di codice estesi per le lettere accentate non lasciava spazio per aggiungere simboli utili, numeri in apice, virgolette curve, trattini corretti, ecc., Come la maggior parte degli altri set di caratteri ASCII estesi.

La posizione dei caratteri segue deliberatamente per lo più ISO-8859-1 dove ci sono caratteri in comune tra le due code page (la Õ maiuscola viene annotata come eccezione), motivata da problemi di facilità d'uso.

Supporto

VISCII è parzialmente supportato dal TriChlor Software Group in California, che ha rilasciato vari pacchetti software, librerie e font conformi a VISCII per MS-DOS e Windows, Unix e Macintosh. Il software compatibile con VISCII è disponibile su molti siti FTP .

VISCII è stato storicamente offerto come codifica per la posta in uscita da Mozilla Thunderbird . È stato anche supportato dal software per tastiera Windows vietnamita, WinVNKey, creato da Christopher Cuong T. Nguyen e successivamente aggiornato tramite varie versioni di Windows da Hoc D. Ngo e altri.

VISCII è stato utilizzato principalmente dagli oratori vietnamiti d'oltremare, con VSCII (TCVN) più popolare nel Vietnam settentrionale e VNI più popolare nel Vietnam meridionale.

Set di caratteri

VISCII
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UN _B _C _D _E _F
0_
0
NUL
0000
SOH
0001
un
1EB2
ETX
0003
EOT
0004
un
1EB4
un
1EAA
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
ÿ
1EF6
NAK
0015
SIN
0016
ETB
0017
PU
0018
ÿ
1EF8
SUB
001A
ESC
001B
FS
001C
GS
001D
ÿ
1EF4
US
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
io
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
uno
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
ore
0068
io
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
tu
0075
v
0076
w
0077
x
0078
e
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
un
1EA0
un
1EAE
un
1EB0
un
1EB6
un
1EA4
un
1EA6
un
1EA8
un
1EAC
E
1EBC
E
1EB8
E
1EBE
E
1EC0
E
1EC2
E
1EC4
E
1EC6
Ô
1ED0
9_
144
Ô
1ED2
Ô
1ED4
Ô
1ED6
Ô
1ED8
Ô
1EE2
Ô
1EDA
Ô
1EDC
Ô
1EDE
ho
1ECA
Ô
1ECE
Ô
1ECC
ho
1EC8
ü
1EE6
×
0168
ü
1EE4
ÿ
1EF2
A_
160
Õ
00D5
un
1EAF
un
1EB1
un
1EB7
un
1EA5
un
1EA7
un
1EA9
un
1EAD
E
1EBD
E
1EB9
E
1EBF
E
1EC1
E
1EC3
E
1EC5
E
1EC7
Ô
1ED1
B_
176
Ô
1ED3
Ô
1ED5
Ô
1ED7
Ô
1EE0
Ô
01A0
Ô
1ED9
Ô
1EDD

1EDF
ho
1ECB
ü
1EF0
ü
1EE8
ü
1EEA
ü
1EEC
Ô
01A1
Ô
1EDB
ü
01AF
C_
192
À
00C0
Á
00C1
Â
00C2
Ã
00C3
un
1EA2
Ă
0102
un
1EB3
un
1EB5
È
00C8
É
00C9
Ê
00CA
E
1EBA
Ì
00CC
Í
00CD
¥
0128
ÿ
1EF3
D_
208
©
0110
ü
1EE9
Ò
00D2
Ó
00D3
Ô
00D4
un
1EA1
ÿ
1EF7
ü
1EEB
ü
1EED
Ù
00D9
Ú
00DA
ÿ
1EF9
ÿ
1EF5
Ý
00DD
Ô
1EE1
ü
01B0
E_
224
a
00E0
á
00E1
â
00E2
ã
00E3
un
1EA3
ă
0103
ü
1EEF
un
1EAB
è
00E8
é
00E9
ê
00EA
E
1EBB
ì
00EC
í
00ED
ĩ
0129
ho
1EC9
F_
240
¹
0111
ü
1EF1
ò
00F2
ó
00F3
ô
00F4
õ
00F5
Ô
1ECF
Ô
1ECD
ü
1EE5
ù
00F9
ú
00FA
÷
0169
ü
1EE7
ý
00FD
Ô
1EE3
ü
1EEE

  Lettera  Numero  Punteggiatura  Simbolo  Altro  Non definito

Le differenze rispetto a ISO-8859-1 sono mostrate in grigio.

Guarda anche

Riferimenti

Ulteriori letture

link esterno