VISCII - VISCII
MIME / IANA | VISCII |
---|---|
Le lingue) | vietnamita , inglese |
Creato da | Gruppo Viet-Std |
Definizioni | RFC 1456 |
Classificazione | SBCS a 8 bit |
Basato su | ASCII |
VISCII è una codifica di caratteri ASCII modificata non ufficialmente definita per l' utilizzo della lingua vietnamita con i computer . Non deve essere confuso con la codifica VSCII ufficialmente registrata dal nome simile . VISCII mantiene i 95 caratteri stampabili di ASCII non modificati, ma sostituisce 6 dei 33 caratteri di controllo con caratteri stampabili. Aggiunge 128 caratteri precomposti . Unicode e la tabella codici di Windows-1258 sono ora utilizzati per quasi tutti i dati del computer vietnamita, ma i file VSCII e VISCII legacy potrebbero richiedere la conversione.
Storia e denominazione
VISCII è stato progettato dal Vietnamese Standardization Working Group (Viet-Std Group) guidato da Christopher Cuong T. Nguyen, Cuong M. Bui e Hoc D. Ngo con sede nella Silicon Valley , in California nel 1992 mentre stavano lavorando con il consorzio Unicode per includere caratteri vietnamiti precomposti nello standard Unicode. VISCII, insieme a VIQR , è stato pubblicato per la prima volta in un rapporto bilingue nel settembre 1992, in cui è stato soprannominato "Codice standard vietnamita per lo scambio di informazioni". Il rapporto ha rilevato una proliferazione nell'uso dei computer in Vietnam e il crescente volume di comunicazioni informatiche tra i vietnamiti all'estero, che le applicazioni esistenti utilizzavano codifiche specifiche del fornitore che non erano in grado di interagire tra loro e che era quindi necessaria la standardizzazione tra i fornitori. Il successo dell'inclusione del vietnamita composto e precomposto in Unicode 1.0 è stato il risultato delle lezioni apprese dallo sviluppo di VISCII a 8 bit e VIQR a 7 bit.
L'anno successivo, nel 1993, il Vietnam ha adottato il TCVN 5712 , il suo primo standard nazionale nel dominio della tecnologia dell'informazione . Questo ha definito una codifica dei caratteri denominata VSCII , che era stata sviluppata dal Comitato tecnico TCVN per la tecnologia dell'informazione (TCVN / TC1) e con il suo nome che sta per "Codice standard vietnamita per lo scambio di informazioni". VSCII è incompatibile con, e altrimenti non correlato, al VISCII pubblicato in precedenza. A differenza di VISCII, VSCII è uno "standard vietnamita" nel senso di uno standard nazionale .
VISCII e VIQR sono stati approvati come stato informativo RFC 1456 , attribuito al gruppo Viet-Std e datato maggio 1993. Come nel caso degli RFC IETF, RFC 1456 li rileva come "convenzioni" utilizzate dagli oratori vietnamiti d'oltremare su Usenet , e che "non specifica alcun livello di standard". Nonostante ciò, continua a chiamare VISCII il "codice standard vietnamita per lo scambio di informazioni" (lo stesso nome preso da VSCII). Le etichette VISCII
e csVISCII
sono registrate presso la IANA per VISCII, con riferimento a RFC 1456. (Non esiste, d'altra parte, nessuna etichetta IANA ufficiale per TCVN 5712/VSCII, sebbene x-viet-tcvn5712
fosse precedentemente supportata da Mozilla Firefox .)
Design
Un tradizionale set di caratteri ASCII esteso è costituito dal set ASCII più un massimo di 128 caratteri. Il vietnamita richiede 134 combinazioni aggiuntive di lettere e segni diacritici, sei di troppo. Ci sono (a meno di eliminare il supporto del segno di tono per le lettere maiuscole, come in VSCII-3 ) essenzialmente quattro modi diversi per gestire questo problema:
- Usa la codifica a larghezza variabile (come fa UTF-8 )
- Includere la combinazione di segni diacritici per i segni di tono (come VSCII-2 e Windows-1258 ) o per i segni diacritici in generale (come ANSEL e VNI )
- Sostituisci un po' di punteggiatura ASCII, preferibilmente punteggiatura che non è invariante in ISO 646 (come fa VNI per DOS )
- Sostituisci almeno sei dei caratteri di controllo ASCII di base (come fanno VPS e VSCII-1 )
VISCII andato per l'ultima opzione, sostituendo sei dei meno problematico (ad esempio, meno probabilità di essere riconosciuto da un'applicazione e agito specialmente) codici di controllo C0 (STX, ENQ, ACK, DC4, EM, e RS) con sei dei combinazioni di lettere maiuscole-diacritiche meno utilizzate. Sebbene questa opzione possa causare il malfunzionamento dei programmi che utilizzano quei codici di controllo durante la gestione del testo VISCII, crea meno complicazioni rispetto alle altre due opzioni (i progettisti notano che è stato riscontrato che la trasmissione pulita non a 8 bit pone più difficoltà nella pratica rispetto al riutilizzo dei caratteri di controllo). Tuttavia, le posizioni dei caratteri di controllo C0 o C1 e dei codici utilizzati per lo spazio unificatore in ISO-8859-1 , Mac OS Roman e OEM-US sono stati deliberatamente assegnati a lettere maiuscole, con l'intenzione di utilizzare punti di codice minuscoli con un carattere tutto maiuscolo una soluzione utile se i caratteri grafici non potevano essere visualizzati per quei codici.
Tuttavia, l'utilizzo di tutti i punti di codice estesi per le lettere accentate non lasciava spazio per aggiungere simboli utili, numeri in apice, virgolette curve, trattini corretti, ecc., Come la maggior parte degli altri set di caratteri ASCII estesi.
La posizione dei caratteri segue deliberatamente per lo più ISO-8859-1 dove ci sono caratteri in comune tra le due code page (la Õ maiuscola viene annotata come eccezione), motivata da problemi di facilità d'uso.
Supporto
VISCII è parzialmente supportato dal TriChlor Software Group in California, che ha rilasciato vari pacchetti software, librerie e font conformi a VISCII per MS-DOS e Windows, Unix e Macintosh. Il software compatibile con VISCII è disponibile su molti siti FTP .
VISCII è stato storicamente offerto come codifica per la posta in uscita da Mozilla Thunderbird . È stato anche supportato dal software per tastiera Windows vietnamita, WinVNKey, creato da Christopher Cuong T. Nguyen e successivamente aggiornato tramite varie versioni di Windows da Hoc D. Ngo e altri.
VISCII è stato utilizzato principalmente dagli oratori vietnamiti d'oltremare, con VSCII (TCVN) più popolare nel Vietnam settentrionale e VNI più popolare nel Vietnam meridionale.
Set di caratteri
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
un 1EB2 |
ETX 0003 |
EOT 0004 |
un 1EB4 |
un 1EAA |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
ÿ 1EF6 |
NAK 0015 |
SIN 0016 |
ETB 0017 |
PU 0018 |
ÿ 1EF8 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
ÿ 1EF4 |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
io 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
uno 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
ore 0068 |
io 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
tu 0075 |
v 0076 |
w 0077 |
x 0078 |
e 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
un 1EA0 |
un 1EAE |
un 1EB0 |
un 1EB6 |
un 1EA4 |
un 1EA6 |
un 1EA8 |
un 1EAC |
E 1EBC |
E 1EB8 |
E 1EBE |
E 1EC0 |
E 1EC2 |
E 1EC4 |
E 1EC6 |
Ô 1ED0 |
9_ 144 |
Ô 1ED2 |
Ô 1ED4 |
Ô 1ED6 |
Ô 1ED8 |
Ô 1EE2 |
Ô 1EDA |
Ô 1EDC |
Ô 1EDE |
ho 1ECA |
Ô 1ECE |
Ô 1ECC |
ho 1EC8 |
ü 1EE6 |
× 0168 |
ü 1EE4 |
ÿ 1EF2 |
A_ 160 |
Õ 00D5 |
un 1EAF |
un 1EB1 |
un 1EB7 |
un 1EA5 |
un 1EA7 |
un 1EA9 |
un 1EAD |
E 1EBD |
E 1EB9 |
E 1EBF |
E 1EC1 |
E 1EC3 |
E 1EC5 |
E 1EC7 |
Ô 1ED1 |
B_ 176 |
Ô 1ED3 |
Ô 1ED5 |
Ô 1ED7 |
Ô 1EE0 |
Ô 01A0 |
Ô 1ED9 |
Ô 1EDD |
ở 1EDF |
ho 1ECB |
ü 1EF0 |
ü 1EE8 |
ü 1EEA |
ü 1EEC |
Ô 01A1 |
Ô 1EDB |
ü 01AF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
un 1EA2 |
Ă 0102 |
un 1EB3 |
un 1EB5 |
È 00C8 |
É 00C9 |
Ê 00CA |
E 1EBA |
Ì 00CC |
Í 00CD |
¥ 0128 |
ÿ 1EF3 |
D_ 208 |
© 0110 |
ü 1EE9 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
un 1EA1 |
ÿ 1EF7 |
ü 1EEB |
ü 1EED |
Ù 00D9 |
Ú 00DA |
ÿ 1EF9 |
ÿ 1EF5 |
Ý 00DD |
Ô 1EE1 |
ü 01B0 |
E_ 224 |
a 00E0 |
á 00E1 |
â 00E2 |
ã 00E3 |
un 1EA3 |
ă 0103 |
ü 1EEF |
un 1EAB |
è 00E8 |
é 00E9 |
ê 00EA |
E 1EBB |
ì 00EC |
í 00ED |
ĩ 0129 |
ho 1EC9 |
F_ 240 |
¹ 0111 |
ü 1EF1 |
ò 00F2 |
ó 00F3 |
ô 00F4 |
õ 00F5 |
Ô 1ECF |
Ô 1ECD |
ü 1EE5 |
ù 00F9 |
ú 00FA |
÷ 0169 |
ü 1EE7 |
ý 00FD |
Ô 1EE3 |
ü 1EEE |
Lettera Numero Punteggiatura Simbolo Altro Non definito
Le differenze rispetto a ISO-8859-1 sono mostrate in grigio.
Guarda anche
- ASCII
- Citato-leggibile vietnamita (VIQR)
- Codice standard vietnamita per lo scambio di informazioni (VSCII)
- Windows-1258
Riferimenti
Ulteriori letture
- Flohr, Guido (2016) [2006]. "Locale::RecodeData::VISCII - Routine di conversione per VISCII" . CPAN libintl-perl . Archiviato dall'originale il 14/01/2017 . Estratto il 14/01/2017 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
link esterno
- RFC 1456 - Convenzioni per la codifica della lingua vietnamita
- Gruppo di lavoro sulla standardizzazione vietnamita con sede in California
- Rapporto Viet-Std 1992
- Software AnGiang
- Software e font compatibili con VISCII per MS-DOS e Windows
- Software, librerie e font compatibili con VISCII per Unix
- WinVNKey , driver per tastiera vietnamita per Windows che supporta set di caratteri multinazionali, incluso VISCII
- MacVNKey , driver per tastiera compatibile con VISCII per Macintosh classic