Was ist «Gr%C3%A4chen»? 21.06.2021, 08:00 Uhr

Umlaute URL-gerecht kodieren oder dekodieren

Umlaute und Sonderzeichen werden in Webadressen durch andere Zeichen ersetzt und sind damit oft kaum mehr lesbar. Wie sehen Sie einem kodierten Link an, was z.B. mit «Gr%C3%A4chen» gemeint wäre?
(Quelle: PCtipp.ch)
Kennerinnen und Kenner von Franz Hohlers Werk dürften wohl trotzdem erraten, was mit einer Webadresse wie «www.amazon.de/Die-R%C3%BCckeroberung-Erz%C3%A4hlungen-Franz-Hohler/dp/3442743214/» gemeint ist. Aber manchmal sind solche Webadressen schwer zu entziffern. Und es kann auch vorkommen, dass Sie in einem bestehenden Link ein Wort durch ein korrekt kodiertes anderes Wort ersetzen wollen.
Bei beidem hilft die Webseite https://www.andre-jochim.de/url-encode.htm. Tippen Sie die kodierte Variante ins untere Feld oder die unkodierte ins obere. Je nach Bedarf klicken Sie auf codieren oder decodieren, schon zeigt Ihnen die Seite an, was damit gemeint ist. Ein weiteres Tool finden Sie hier. Damit enthüllen Sie leicht, dass das Wort «Gr%C3%A4chen» (oben, im Artikelvorspann) eigentlich «Grächen» ist; eine Ortschaft im Kanton Wallis.
So wird der «T%C3%BCr%C3%B6ffner» wieder zum «Türöffner»
Quelle: PCtipp.ch
Hintergrund: In URLs (Webadressen) dürfen nur bestimmte Zeichen vorkommen. Darum werden Umlaute, aber auch Leerzeichen und sonstige Sonderzeichen in der Regel automatisch durch deren codierte Zeichenfolgen ersetzt.



Kommentare

Avatar
karnickel
26.06.2021
... In URLs (Webadressen) dürfen nur bestimmte Zeichen vorkommen. ... Vorsicht @Gaby Salvisberg , dies sind hier sogar zwei Baustellen. Was Du beschrieben hast gilt für die Argumente hinter dem URL, was als Ganzes dann den URI (uniform resource identifier) ergibt. Diese Übergabeparameter müssen, wie Du richtig schreibst, mit Prozentzeichen plus ASCII-Code escaped werden. Als zweites kommt nun allerdings der sogenannte Punycode mit ins Spiel. Will man nämlich den (Sub-) Domainnamen selber mit Umlauten oder anderen Sonderzeichen bestücken, funktionieren die Prozentzeichen nicht. Stattdessen wird hier nicht pro Zeichen codiert, sondern schlicht ein Syntaxschema geschaltet, das man an den startenden Zeichenfolge "xn--" erkennen kann. Aus müller.ch wird also xn--mller-kva.ch . Benannt ist das Verfahren dann als "Internationalized Domain Names (IDN)". Möchtest Du nun übrigens solche codierten URI als Gesamtes zu Argumenten für einen weiteren Link machen, dass muss man zusätzlich HTML-verwendete Steuerzeichen wie das die einzelnen Parameter verkettende Kaufmannsund & HTML encoden, also & in diesem Fall. Uff. [CODE]https://xn--mller-kva.ch/?refer=xn--mller-kva.ch/redirect.php?arg1=1&arg2=2[/CODE] Da kann einem schon übel werden.

Avatar
Gaby Salvisberg
28.06.2021
Umlaut-Domains (Punycode) sind in der Tat ein anderes Thema. Kann je nach Browser (Firefox) auch gefährlich werden: https://www.pctipp.ch/praxis/firefox/stopfen-sie-die-ueble-zeichensatz-falle-im-firefox-2010358.html