Konverze formátů při přenosu
m (Přidán zdroj UTF-8 z Wikipedie.) |
(Přidán příklad na převod dat.) |
||
Řádka 1: | Řádka 1: | ||
[[Category:VSE]][[Category:Sítě]][[Category:Informatika]][[Category:Prezentační vrstva]] | [[Category:VSE]][[Category:Sítě]][[Category:Informatika]][[Category:Prezentační vrstva]] | ||
− | == | + | == Co je „konverze formátů“? == |
− | Jedním z úkolů prezentační vrstvy je převádět formát zápisu (způsob kódování) složitějších datových struktur. Může se jednat o čísla delší než 1 byte, ale také o obrázky a další datové struktury. | + | Jedním z úkolů prezentační vrstvy je převádět formát zápisu (způsob kódování) složitějších datových struktur při přenosu mezi dvěma počítači. Může se jednat o čísla delší než 1 byte, ale také o obrázky a další datové struktury. |
Pokud komunikující počítače používají odlišnou reprezentaci těchto dat, je třeba data při přenosu zkonvertovat. | Pokud komunikující počítače používají odlišnou reprezentaci těchto dat, je třeba data při přenosu zkonvertovat. | ||
* V modelu ISO/OSI to má na starosti prezentační vrstva. | * V modelu ISO/OSI to má na starosti prezentační vrstva. | ||
* Reálně používaný model TCP/IP prezentační vrstvu nemá, konverzi si musí provést aplikace sama. | * Reálně používaný model TCP/IP prezentační vrstvu nemá, konverzi si musí provést aplikace sama. | ||
+ | |||
+ | <div class="Priklad"> | ||
+ | ; Příklad – desetinná čísla | ||
+ | Jako příklad uveďme desetinná čísla. Pokud chceme desetinné číslo uložit v počítači, musíme ho převést na posloupnost nul a jedniček. Existují různé způsoby, jak toto provést. Pokud v síti komunikují dva počítače a každý z nich používá jiný způsob, nemohou prostě poslat odpovídající posloupnost bitů přes síť, protože na druhém počítači by stejná posloupnost znamenala jiné číslo. Je třeba provést konverzi. | ||
+ | |||
+ | ; Představme si následující situaci | ||
+ | Odesílatel a příjemce ukládají desetinná čísla tak, že číslo <code>0,083</code> převedou na <code>83*10<sup>-3</sup></code>. Číslu <code>83</code> se říká ''mantisa'' a <code>-3</code> je ''exponent''. | ||
+ | |||
+ | Odesilatel i příjemce použijí 16 bitů. Dále ale postupují různě: | ||
+ | * Odesilatel: | ||
+ | *# mantisu (číslo <code>83</code>) ukládá na 8 bitů: <code>0101 0011</code> | ||
+ | *# posléze využije další byte tak, že 1. bit bude reprezentovat znaménko (0..plus, 1..mínus) a dalších 7 bitů exponent <code>3</code>: <code>1</code> <code>000 0011</code> | ||
+ | *: <code>0,083</code> => číslo <code>83</code>: <code>0101 0011</code> + znaménko: <code>1</code> (mínus) + exponent <code>3</code>: <code>000 0011</code> => <code>0101 0011 1000 0011</code> | ||
+ | * Příjemce reprezentuje desetinná čísla jinak. Číslo <code>0,083</code> uloží tak, že: | ||
+ | *# nejprve uvede znaménko exponentu (1 bit): <code>1</code> (mínus) | ||
+ | *# poté exponent na 3 bity (to obvykle stačí): <code>011</code> | ||
+ | *# a posléze využije 12 bitů na zápis mantisy (číselné části). | ||
+ | *: <code>0,083</code> => znaménko: <code>1</code> (mínus) + exponent <code>3</code>: <code>011</code> + číslo <code>83</code>: <code>0000 0101 0011</code> => <code>1011 0000 0101 0011</code>) | ||
+ | |||
+ | Pokud by odesilatel prostě vzal 16 bitů, které reprezentují číslo a poslal je příjemci, ten by místo čísla <code>0,083</code> přečetl: | ||
+ | *: <code>0101 0011 1000 0011</code> => znaménko: <code>0</code> (plus) + exponent <code>5</code>: <code>101</code> + číslo <code>899</code>: <code>0011 1000 0011</code> => <code>899*10<sup>5</sup></code> => <code>89 900 000</code> | ||
+ | |||
+ | Aby se nedorozumění předešlo, musí buď odesilatel nebo příjemce data převést do formátu, který používá příjemce. To označujeme jako provedení konverze. | ||
+ | </div> | ||
Verze z 16. 3. 2020, 10:15
Obsah |
Co je „konverze formátů“?
Jedním z úkolů prezentační vrstvy je převádět formát zápisu (způsob kódování) složitějších datových struktur při přenosu mezi dvěma počítači. Může se jednat o čísla delší než 1 byte, ale také o obrázky a další datové struktury.
Pokud komunikující počítače používají odlišnou reprezentaci těchto dat, je třeba data při přenosu zkonvertovat.
- V modelu ISO/OSI to má na starosti prezentační vrstva.
- Reálně používaný model TCP/IP prezentační vrstvu nemá, konverzi si musí provést aplikace sama.
- Příklad – desetinná čísla
Jako příklad uveďme desetinná čísla. Pokud chceme desetinné číslo uložit v počítači, musíme ho převést na posloupnost nul a jedniček. Existují různé způsoby, jak toto provést. Pokud v síti komunikují dva počítače a každý z nich používá jiný způsob, nemohou prostě poslat odpovídající posloupnost bitů přes síť, protože na druhém počítači by stejná posloupnost znamenala jiné číslo. Je třeba provést konverzi.
- Představme si následující situaci
Odesílatel a příjemce ukládají desetinná čísla tak, že číslo 0,083
převedou na 83*10-3
. Číslu 83
se říká mantisa a -3
je exponent.
Odesilatel i příjemce použijí 16 bitů. Dále ale postupují různě:
- Odesilatel:
- mantisu (číslo
83
) ukládá na 8 bitů:0101 0011
- posléze využije další byte tak, že 1. bit bude reprezentovat znaménko (0..plus, 1..mínus) a dalších 7 bitů exponent
3
:1
000 0011
-
0,083
=> číslo83
:0101 0011
+ znaménko:1
(mínus) + exponent3
:000 0011
=>0101 0011 1000 0011
- mantisu (číslo
- Příjemce reprezentuje desetinná čísla jinak. Číslo
0,083
uloží tak, že:- nejprve uvede znaménko exponentu (1 bit):
1
(mínus) - poté exponent na 3 bity (to obvykle stačí):
011
- a posléze využije 12 bitů na zápis mantisy (číselné části).
-
0,083
=> znaménko:1
(mínus) + exponent3
:011
+ číslo83
:0000 0101 0011
=>1011 0000 0101 0011
)
- nejprve uvede znaménko exponentu (1 bit):
Pokud by odesilatel prostě vzal 16 bitů, které reprezentují číslo a poslal je příjemci, ten by místo čísla 0,083
přečetl:
-
0101 0011 1000 0011
=> znaménko:0
(plus) + exponent5
:101
+ číslo899
:0011 1000 0011
=>899*105
=>89 900 000
-
Aby se nedorozumění předešlo, musí buď odesilatel nebo příjemce data převést do formátu, který používá příjemce. To označujeme jako provedení konverze.
Kódování textů
- Veškerá data jsou v počítači ukládána a přenášena jako posloupnosti 0 a 1.
- Pro ukládání a přenášení textů je tedy nutno texty převést (zakódovat) na čísla.
ASCII a další
- Běžně se používá pro ukládání znaků kódování ASCII, které převádí každý písmeno na jeho 8bitový kód. (Viz třeba Wikipedia.org → ASCII.)
- Existují však i další kódování: UTF-8, UTF-16, nebo třeba EBCDIC.
ASCII a kódové stránky
- I u samotného ASCII ovšem dochází k nutnosti konverze.
- Problém je v tom, že 8 bitů umožňuje pouze 256 různých kombinací, což sice dostačuje pro základní latinskou abecedu, ale neumožňuje ukládat rozšířené národní abecedy (azbuka, znaky s diakritikou, čínská abeceda,...)
- Rozšířené národní abecedy (například znaky s diakritikou v češtině a dalších jazycích) používají různé tzv. „kódové stránky“, které přiřazují znakům ze 2. poloviny ASCII tabulky speciální významy.
- Například pro češtinu se běžně používají kódové stránky:
- Windows-1250 (kódová stránka 1250)... navržena a používána Microsoftem v grafickém prostředí Windows
- Latin II (kódová stránka 852)... starší standard, používá Microsoft při zápisu názvů souborů (je třeba používat při psaní skriptů pro Windows).
- ISO-8859-2... standard organizace ISO. Používán běžně většinou ostatních operačních systémů.
- Vzhledem k problémům s detekcí kódových stránek se dnes kódování ASCII postupně nahrazuje univerzálním kódováním UTF-8, které je s ASCII částečně kompatibilní (reprezentace prvních 128 znaků ASCII je stejná).
- Například ve většině linuxových distribucí je již UTF-8 standardem. Stejně tak je doporučenou volbou pro psaní webových stránek.
Pokud komunikují počítače, které používají odlišné způsoby kódování znaků, je třeba je převádět (konvertovat).
Typickým příkladem takové konverze je převod mezi kódovými stránkami ASCII v prohlížečích.
Little × Big Endian
Obrázky
ASN.1
Zdroje
- PETERKA, Jiří. Prezentační vrstva. eArchiv.cz [online]. 1996 [cit. 2017-06-26]. Dostupné z: http://www.earchiv.cz/a92/a226c110.php3
- ASCII. In: Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2016 [cit. 2017-06-26]. Dostupné z: https://cs.wikipedia.org/wiki/ASCII
- UTF-8. In: Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2016 [cit. 2017-06-26]. Dostupné z: https://cs.wikipedia.org/wiki/UTF-8