Status van Internationale Domainnamen

Jaap Akkerhuis
Editorial note: this piece dates from late 2000, early 2001

Er zijn plannen om het DNS drastisch te wijzigen. Voor velen, zo niet de meerderheid van de wereldbevolking, beginnen de strakke regels voor hostnamen te knellen. Dat gevoel wordt versterkt door het gebruik van web adressen in reclame uittingen en dergelijke. Met de huidige regels kunnen velen niet de domeinnaam krijgen in de taal welke men begrijpt omdat die gebruik maakt van scripts welke niet of nauwelijks in een ``latijns'' alfabet zijn te vatten. Bijvoorbeeld, Katakana, Vietnamees, Farsi, Hebreeuws, Hiragana, Chinees, Grieks, Cyrillisch etc. Maar ook dichterbij huis zijn er afwijkende scripts die problemen geven, zoals de scandinavische talen en het Fries binnen onze eigen landsgrenzen. Voor een echt globaal internet is het nodig dat hier wat aan gebeurt. Het is nu bijvoorbeeld gebruikelijk om in China maar nummers te gebruiken als domeinnamen. Arabische cijfers is het enige wat redelijk overal herkend wordt in China.

Met het internationalizeren van DNS krijg je een hele discussie in huis. Internationalisatie van software is al jaren een bron van studies en ruzies en zijn standaard commite's bezig om tot een oplossing te komen over zaken als standaard encodering en dergelijke. Echt veel schot zit er niet in deze zaak, hoewel de Unicode pogingen in de jaren '80 de zaak weer wat op de rails hebben gezet. Om maar enkele problemen te noemen, al dan niet in DNS verband):

  • sommige karakters in sommige scripts zien er hetzelfde uit maar betekenen andere zaken in diverse talen. In het CJK, (Chinees,/Japans/Koreaans) zijn een aantal dingen gemeenschappelijk (en geaccepteerd) maar voor anderen karakters blijft daar een bron van problemen (Hangul Unificatie).
  • sommige scripts hebben optionele karakters (Hebreeuws), als een naam uniek moet zijn, wat doe je met dat optionele karakters in een woord, wanneer zijn die al dan niet significant in domeinnaam vergelijkingen
  • sommige scripts beschouwen letters met accent als een apart karakter, andere als bestaande uit twee elementen, bijvoorbeeld een als A met een corona.
  • boven en onderkast normalisatie. Het is maar goed dat we in nederland vaak slordig zijn met de taal en dat de ascii upper en lower case niet significant zijn in domainnamen, anders kregen we religieuze debatten over het correct spellen en al dan niet het zelfde zijn van brouwerij 't IJ.nl versus Ij.nl of iJ.nl. In dit verband willen de canadezen een e acute in upper case ook een acute accent geven, terwijl de franse dat met de hun bekende slag doen.

Zo zijn er nog veel meer ``interessante'' gevechten te leveren. Voor DNS zijn sommige niet interessant, tenslotte zijn we niet bezig poezie te bedrijven en ook niet een echte directory lookup systeem te maken. DNS is een heel pragmatisch oplossing voor een tamelijk rechttoe rechtaan problemen: welk IP-nummer hoort bij dit naampje.

Verschillende DNSsen

In Azie zijn diverse groepen al bezig om systemen te verzinnen voor Internationale Domeinnamen. Een van de vele drijfveren is het stimuleren van het Internet in hun area en het reageren op de vraag van de lokale gemeenschap, een andere is dat er waarschijnlijk veel geld te verdienen is in het creeren van een goede oplossing (al dan niet gepatenteerd). Voorstellen lopen van pseudo roots die vertalingen doen on the fly, ascii encoderingen, ``just talk UTF-8/BIG5/KOI-8/JIS/CJK and let the registries fix it'' etc. Dat resulteerde dus in veel tegenstrijdige voorstellen met een potentiele gevolg van balkanisering van het web.

IETF Werkgroup

De IETF heeft nu een werkgroep die zich met deze zaken bezig houdt en maakt vorderingen op dit gebied. Vele van de groepen die zich er mee bezig houden hebben zitting genomen in de werkgroep. De strijdbijlen zijn op dit moment redelijk begraven. De laatste hand wordt gelegd aan een requirements document (RFC) welke eisen formuleert waaraan een Internationaal (IDNS) moet voldoen. Waar deze eisen tegenstrijdig zijn wordt dit gesignaleerd en als belangrijk beslispunt voor een definitief protocol beschouwd. De volgende stap is een document waarin de diverse voorstellen vergeleken worden en aan de requirements getoetst. Dan zal een voorstel voor een IDNS standaard worden gedaan welke misschien een van de voorstellen zal zijn of een combinatie van elementen uit diverse voorstellen. Ook moeten dan implementatie plannen, overgangs problemen etc. worden opgelost.

Knuppel in 't hoenderhok

Op 24 augustus jongsleden maakte NSI bekend een ``sandbox'' (speeltuin) en een testbed te gaan openstellen voor het registreren van Internationale DNS namen (www.nsol.com/news/2000/pr_20000824.html). Zij stellen hierbij dat zijn zich volledig commiteren aan de RFC's van IETF en ook aan wat de IETF in de toekomst zal besluiten. Zij nemen wel een voorschot daar op en gaan RACE gebruiken. (RACE--Row Based Ascii Encoding). In die ascii vorm wordt de naam geregistreed. Ook wordt een Registry Registrar Protocol geupdated om multilingual namen aan te kunnen en zullen ze een multilingual whois service gaan doen, een DNS service welke aan de hand van de inkomende vraag de encoding voor het andtwoord verzinnen (hoe ze dat gaan doen is niet echt duidelijk) en andere test werkzaamheden. Men benadrukt het experimentele character, maar wat er met de namen gaat gebeuren na de test periode wordt gezegd. De ``sandbox'' is direct ingegaan, voor de testbed moeten de registrars zich accrediteren voordat ze medoen en zou begin oktober van start gaan. Reverse look-up (PTR records) worden niet gesupport voor .net .org en .com ``omdat er de gTLD servers nu eenmaal niet authorative zijn voor enige in-addr.arpa zones'' Waarmee men het probleem omzeilt ``als een resolver een reverse lookup doet en willekeurige binary troep binnenkrijgt die hij niet begrijpt en crashed, wiens schuld is dat'' en het probleem van de PTR records op het bordje van RIR's (ARIN, RIPE etc.) en de ISP's legt.

ICANN reageerde vrij laconiek op deze aankondiging (www.ICANN.org/- announcements/comment-25aug00.htm). Experimenten als deze zijn prachtig, maar men waarschuwde voor het gevaar van het uiteenvallen van het net en citeerde een van de principes van de IETF werkgroep

``A fundamental requirement in this work is to not disturb the current use and operation of the domain name system, and for the DNS to continue to allow any system anywhere to resolve any domain name.''

Mijn inschatting is dat ICANN het nogal prematuur vindt, maar dat ze daar natuurlijk verder weinig over te zeggen, voor zolang het ``experimenteel'' is.

Op de toch al niet zo rustige maillijst van de IETF werkgroep waren de reacties wat bloeddorstiger. Velen hebben het gevoel dat NSI ``een microsoft tactiek'' hanteert door als een monopolist te handelen ipv op een algemene standaard te wachten. En ook dat het een verdedigende sprong voorwaarts is om 't monopoly te handhaven tegen eventuele nieuwe concurerende gTLD's.

Reactie Bill Semich

{Die reageerde ook nog op de ccTLD maillijst en deze reactie is eigenlijk de aanleiding tot dit verhaal.} Bill Semich draait de .nu registry en heeft vorig jaar al aan diverse ccTLD registries een NUBIND aangeboden. Dat doet ook multilingual domeinnamen en hanteert de ``just talk UTF-8'' (UTF-8 is een methode voor Unicode encodering) methode type oplossing. (Detail puntje, het DNS protocol is op zich 8-bits ``schoon'', dus alles kan daarin gebruikt worden, alleen vanwege het hostnames RFC kan je er weinig mee. Maar dat maakt de ``just talk UTF-8'' stijl oplossing redelijk legitiem). Dat RFC 822 en vele andere dingen niet zouden werken lostte hij wel op om voor STMP naast een UNICODE domein ook een ascii versie te hebben. Hij zou dan wel voor de hele (UNICODE) wereld MX proxy doen en mail hersturen.

Al in Yokohama vertrouwde hij mij toe dat het een hopeloze mislukking was geworden. Vele dingen die voorspeld waren bleken uit te komen en uiteindelijk konden ze alleen maar A records doen, en zelfs dat met grote moeite. Veel services zoals mail, resolvers, secure shell etc. hielden op met werken, crashden of deden allerlei rare dingen. Ook Microsoft producten, die geacht werden UTF-8 te kunnen gebruiken. Het gebrek aan PTR records was ook een behoorlijke ramp. Uiteindelijk besloten ze het maar anders te doen, met een gehackte Apache webservices only aan te bieden onder de naam Worldnames. Dat was tenslotte wat ze aan de klanten ooit beloofd hadden

Op de IETF in Pittsburgh heeft hij over z'n ervaringen willen vertellen maar dat kwam nauwelijks over omdat hij soswieso een veel te commercieel figuur is, de antipatie die hij inmiddels had opgewekt met zijn woeste plannen en dergelijke. Hij was daar duidelijk teleurgesteld.

Na die aankondiging heeft hij nu NUBIND weer aangeboden aan de ccTLD's om mee te spelen. Ze hebben NUBIND kennelijk geupgrade zodat het nu ook RACE praat, de encoding die NSI intern gaat gebruiken. Op deze manier probeert hij een graatje mee te pikken in de hoop dat de ccTLD's NUBIND gaan draaien en dan ook NUBIND gaan aanbevelen in hun regio om maar veel exemplaren te verkopen aan domeinnam houders/gebruikers die nameservers draaien. Daarom is het ook een ``limited GPL'': het is gelimiteerd voor ccTLD managers only (en dan nog voor een testperiode).

Ook anderen zullen niet blij zijn met deze aankondiging, maar die zijn wat minder luidruchtig. Zo is er het Multilingual Internet Names Consortium (MINC) welke ook software uitbrengt op dit gebied. De MINC is de groep die in Cairo een ``besloten'' meeting had. In Yokohama waren ze iets opener. Zowel NSI als nominum doen ook mee met de MINC evenals Bill Semich. Zowel onder de naam NUBIND als onder de naam Worldnames. Een andere groep is het Chinese Domain Name Consortium (CDNC).

Relevantie van IDNS voor SIDN

Op dit moment supporten wij de klassieke karakters zoals gedefinieerd voor hostname in onze registry. Aan de ene kant zou je kunnen zeggen dat we hier rustig mee door kunnen gaan en het IDNS probleem ons niet raakt. Nederlands is tenslotte redelijk ASCII-achtig dus dat probleem hebben we niet. Andere overwegingen kunnen zijn dat de nederlandse sushi verkopers erop staan dat we ook japans registreren, maar dat is onwaarschijnlijk. Wel is het zo dat ik al benaderd ben door het Leeuwardens dagblad met de vraag waarom we geen ``Friese'' namen kunnen registreren en wanneer dat nu eindelijk kan. Behalve onze Friese landgenoten, zijn er natuurlijk ook buitenlandse namen die goed gespeld willen worden.

Wed Sep 25 2013

© Stichting NLnet Labs

Science Park 400, 1098 XH Amsterdam, The Netherlands

labs@nlnetlabs.nl, subsidised by NLnet and SIDN.