[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [A-DX] Zum Listenbetrieb




Am 08.08.2007 um 00:06 schrieb Juergen Fenn:

Nun, das Encoding sollte idealerweise der Client auswählen, je nachdem
welche Zeichen in der Mail vorkommen. Es sollte jeweils das minimale
Encoding gewählt werden (plain ASCII text, latin1, latin9,
utf-8...). Gnus macht das. Von festen Einstellungen durch den User
halte ich wenig.

Jo. Stümpt.

Für die, die bei dem gestrigen Disput um Unicode, UTF-8, 8-Bit-ASCII und Zeichensatzfestlegung nur Bahnhof und Abfahrt verstanden haben, hier noch eine recht witzige Erklärung im Stil der Sendung mit der Maus, die ich mal dazu im Netz gefunden habe:

<mausmodus>

Hallo. Heute erklären wir euch den Unterschied zwischen Zeichensatz
und Font.

Das ist ein Computer. Wir haben euch schon ein paar mal gezeigt, dass
ein Computer nur mit Einsen und Nullen umgehen kann.

Das ist der Reinhard. Er will einen Brief schreiben. Mit dem Computer.
Der kann nur mit Einsen und Nullen umgehen. Irgendwie wird das aber
ein komischer Brief, wenn der nur Einsen und Nullen haben darf. Aber
obwohl der Computer nur mit Einsen und Nullen umgehen kann, kann der
Reinhard trotzdem "Hallo" schreiben. Klingt komisch, ist aber so.

Wie macht der Computer das? Er verwendet für jeden Buchstaben einfach
8 Einsen oder Nullen. Beispielsweise nimmt er für ein A ein 01000001.
Woher weiß der Computer aber, dass das ein A ist? Dafür gibt es den
Zeichensatz. Der Zeichensatz legt fest, welcher Buchstabe mit welcher
Folge von Nullen und Einsen dargestellt wird.

Diejenigen von euch, die schon in der Schule sind, haben vielleicht
ausgerechnet, dass man mit diesen 8 Nullen und Einsen aber nur 256
Zeichen darstellen kann - es gibt aber auf der Welt viel mehr Zeichen.
Das ist der Grund, warum es verschiedene Zeichensätze gibt, die auch
nicht alle nur 8 Nullen und Einsen haben. Einer dieser Zeichensätze,
Unicode, verwendet ganz lange Folgen von Nullen und Einsen, um alle
Zeichen, die es gibt (Für die Star-Trek-Fans: Ja, auch Klingonisch),
darzustellen.

Das will man aber nicht, weil dann brauchen die Zeichen auf der
Festplatte so viel Platz. Deshalb gibt es noch andere Zeichensätze,
die nur einen Teil der Zeichen abdecken, und für jedes Zeichen 8
Nullen oder Einsen brauchen. Nachdem im Unicode-Zeichensatz alle
Zeichen drin sind, kann man diese Zeichensätze ineinander umrechnen,
indem man als Zwischenschritt Unicode nimmt. Dabei gehen aber, da
jeder Zeichensatz verschiedene Zeichen enthält (sonst bringt es
nichts), ein paar Zeichen verloren und werden durch Fragezeichen
ersetzt.

Nachdem es Leute gibt, die gaaanz viele Sprachen sprechen, brauchen
die auch einen Zeichensatz. Dafür hat ein ganz schlaues Kerlchen UTF-8
erfunden. Das verwendet für häufige Zeichen nur 8 Nullen oder Einsen,
genauso wie die anderen Zeichensätze; für seltenere Zeichen verwendet
es aber mehr Nullen und Einsen.


So, jetzt weißt du was ein Zeichensatz ist. Der Computer weiß jetzt
also, wenn er 01001000 01100001 01101100 01101100 01101111 sieht, dass
das Hallo heißen muss, und zwar indem er das nach Unicode umrechnet.
Der Reinhard weiß das, wenn er die Einsen und Nullen sieht, aber nicht
(und der Empfänger des Briefes genausowenig). Der würde sich viel
leichter tun, wenn er Buchstaben sehen würde, so ähnliche wie er mit
der Hand schreiben kann. Nachdem der Computer aber keine Hand hat,
braucht er eine Menge kleiner Bildchen [Schwenk auf einen Kasten mit
Karteikarten], für jede Unicode-Nummer eines. Okay, nicht für jede,
sondern nur für die Zeichen die der Reinhard benutzen will. Ein
solcher Karteikasten mit Bildchen für die Unicodenummern heißt
Schriftart oder Font. Die legt fest, wie die Buchstaben auf dem
Bildschirm oder Drucker nachher aussehn.

Verschiedene Schriftarten können verschiedene Zeichen darstellen. Das
hat aber nichts mit dem Zeichensatz zu tun, sondern einfach damit,
dass Schriftarten-Maler nicht so viel Zeit haben, um alle Zeichen zu
malen.

Nachdem der Reinhard eine Schriftart ausgewählt hat, kann er sein
"Hallo" sehen und in Ruhe seinen Brief fertigschreiben.

</mausmodus>



--
Tschüß,
Martin     http://webadresse.geloescht/


--
-----------------------------------------------------------------------
Diese Mail wurde ueber die A-DX Mailing-Liste gesendet.
Admin: Christoph Ratzer, OE2CRM  http://www.ratzer.at
-----------------------------------------------------------------------
Private Verwendung der A-DX Meldungen fuer Hobbyzwecke ist gestattet, jede
kommerzielle Verwendung bedarf der Zustimmung des A-DX Listenbetreibers.