DNS
UDPを使ったプロトコルのひとつであるDNSを通して、UDPの理解を少しだけ深めてみましょう。 DNSは、日常のインターネット利用において非常に重要な役割を果たしています。DNSは、ドメイン名をIPアドレスに変換するためのシステムであり、インターネット上のリソースにアクセスする際に必要不可欠です。
DNSの基本
DNSは、ドメイン名をIPアドレスに変換するための階層的なシステムです。以下のような構成要素があります。
ルートDNSサーバ
TLD(トップレベルドメイン)サーバ
権威DNSサーバ
DNSリゾルバ(キャッシュサーバー)
クライアント
flowchart TD Client[クライアント] Resolver[DNSリゾルバ] Root[ルートDNSサーバー] TLD[TLDサーバー] Authoritative[権威DNSサーバー] DNS_Server[DNSサーバー] Client -->|DNSリクエスト| Resolver Resolver -->|問い合わせ| DNS_Server DNS_Server -->|応答| Resolver Root -->|TLDサーバー情報| DNS_Server TLD -->|権威サーバー情報| DNS_Server Authoritative -->|最終的な応答/ヒント| DNS_Server Resolver -->|応答| Client DNS_Server -->|問い合わせ| Root DNS_Server -->|問い合わせ| TLD DNS_Server -->|問い合わせ| Authoritative
少し仰々しい用語で書いているためわかりにくいですが、実は身近なところで動いています。
クライアントは、ウェブブラウザやアプリケーションなど、DNSを利用する端末です。
DNSリゾルバは、クライアントのリクエストを受け取り『どのようにそのリクエストに応えるか』を決定します。一般的な実装はシステムの提供するライブラリのようなもので、OSに組み込まれています。リゾルバでは、各種の手段が提供されており、その中からの選択を行っています。
静的ホストテーブル(
/etc/hosts
など)キャッシュされたDNS情報
DNSサーバーへの問い合わせ
WindowsなどではActive DirectoryのDNS情報も該当します
古いUNIX系統ではNIS[1]を利用していることもあります
DNSサーバーは、一番近いDNSのサーバーであり、プロバイダにより提供されます。
DNSサーバーの問い合わせは、必要に応じて繰り返し行われていきます。
このシーケンス図は、クライアントから始まるDNS問い合わせの流れを示しています。
ルートDNSサーバーはTLDサーバーの情報を提供し、TLDサーバーは権威DNSサーバーの情報を返します。
最終的に権威DNSサーバーから得られたIPアドレスがクライアントに返されます。
sequenceDiagram participant Client as クライアント participant Resolver as DNSリゾルバ participant DNS_Server as DNSサーバー participant Root as ルートDNSサーバー participant TLD as TLDサーバー participant Authoritative as 権威DNSサーバー Client->>Resolver: ドメイン名の問い合わせ Resolver->>DNS_Server: 問い合わせ DNS_Server->>Root: ルートDNSサーバーに問い合わせ Root-->>DNS_Server: TLDサーバー情報を返す DNS_Server->>TLD: TLDサーバーに問い合わせ TLD-->>DNS_Server: 権威DNSサーバー情報を返す DNS_Server->>Authoritative: 権威DNSサーバーに問い合わせ Authoritative-->>DNS_Server: 最終的なIPアドレスを返す DNS_Server-->>Resolver: 回答を返す Resolver-->>Client: 回答を返す
DNSリゾルバやDNSサーバーは『キャッシュ』が用意されており、以前の問い合わせ内容を覚えています。 各内容には「TTL(Time To Live)」と呼ばれる有効期限が設定されており、これが切れるまでの間は再度問い合わせを行う必要はありません。そのため、上記シーケンス図ではルートDNSサーバーへの問い合わせが含まれていますが、実際にはそんなに頻繁に使われることはありません。こういう上位のDNSサーバーの場合、非常に長いTTLが設定されていることが多い[4]です。
注釈
Windowsでは、DNS Clientというサービスが動いていることがあります。 これはローカルのキャッシュDNSサーバーみたいなもので、DNSリゾルバと実際に呼ぶDNS(キャッシュ)サーバーの間に入る形で機能します。 役割は『DNSサーバーからの応答をキャッシュする』です。
ドメインツリー構造
上記の説明でTLDといった用語が登場しました。これを理解するために、DNSが背景として持つ『ドメインツリー』という空間および構造について説明します。
私たちは、インターネット上のサービス(リソース)へアクセスする際、一般的に『ホスト名』『サーバー名』と言ったものを使って接続先を認識しています。この名前を正確に書くと、ピリオド(.)で区切られた名前になることはご存じだと思います。
例えば、www.example.com
という名前は、以下のように分解できます。
www
というホストは、example.com
というドメイン(組織)の一部である。example
はcom
というドメインの一部である。
このように、左にある部分は、右にある部分(組織)に属しているという関係を持っています。 これはツリー状に表現できます。
この時、最上位(表記上の一番右側のもの)をTLD(Top Level Domain)と呼びます。 あまり表記しませんが、TLD直下のものはSLD(Second Level Domain)と呼ばれたりもします。
graph TD B[TLD: com] C[example] D[www] B --> C C --> D
TLDは様々なものがあります。
国とは関係ない汎用TLD
com
(商用)org
(組織)net
(ネットワーク)info
(情報)
国別TLD
jp
(日本)us
(アメリカ)uk
(イギリス)de
(ドイツ)
最近では、一風変わったというべきものも増加していますね。
app
(アプリケーション)dev
(開発)shop
(ショップ)blog
(ブログ)tech
(テクノロジー)
たとえば日本の学校では、SLD部分に属性としてac
を用いることで「学校(もしくは教育機関)である」と示されます。
この場合、多数存在するTLDを階層構造の頂点としてまとめるのが、ルートドメインというものです。これは単純に".
"であり、TLDの右側に位置します。
ルートドメインの表記は『これ以上後はない』を意味するため、UNIXなどのOSで登場する『ルートディレクトリ』のような意味合いとなります。
www.example.com
のような末尾にピリオドがないホスト名は、リゾルバの設定によってはローカルの検索ドメインが付加されて解釈されることがあります。ですが、
www.example.com.
のように末尾にピリオドが付いている場合は『これ以上後はない』と判断されます。ルートドメインであることの判断は、検索を行う際の起点を正しく認識するために重要となります。
注釈
ただし、実際に私たちがホスト名表記を行うときは、ルートドメインの表記をすることはまずありません。 これは、リゾルバが渡された文字列(ホスト名と思われるもの)に対して、以下のルールを適用しているためです。
とりあえず渡された文字列そのもので判断してみる(
foo
->foo.
)判断できなかった場合、自分のコンピュータ内であらかじめ決めておいたドメインを付加して判断してみる(
foo
->foo.localdomain.
)それでも判断できないときは、ネットワークの構成時に得ていたドメインを付加して判断してみる
付加された文字列は一般的にルートドメインは付与されていませんが、暗黙で付与されたとみなして検索を行うようになっています。
これにより、各種TLDを含めてひとつのツリー構造に納めることができます。
例えば、DNSのドメインツリー構造は以下のように表現できます。
graph RL A[ルートドメイン] B[TLD: com] subgraph C[example] D[www] end E[TLD: jp] F[ac] subgraph G[example] H[www] end I[co] subgraph J[example] K[hogehoge] end subgraph L[someshop] M[www] end %% ツリー構造 A --> B B --> C A --> E E --> F F --> G E --> I I --> J J --> K I --> L L --> M
このツリーにキャッシュサーバーがアクセスする場合、以下のような形になります。
graph RL A[ルートドメイン] B[TLD: com] subgraph C[example] D[www] end E[TLD: jp] F[ac] subgraph G[example] H[www] end I[co] subgraph J[example] K[hogehoge] end subgraph L[someshop] M[www] end CacheServer[キャッシュサーバー] %% ツリー構造 A --> B B --> C A --> E E --> F F --> G E --> I I --> J I --> L %% キャッシュサーバーから各部への点線矢印(順序付き) CacheServer -.->|1| A CacheServer -.->|2| E CacheServer -.->|3| I CacheServer -.->|4| L CacheServer -.->|5| M
このように、キャッシュサーバーは順番に問い合わせを行います。
このように、キャッシュサーバーは必要に応じてルートドメインや各TLD、さらに下位のドメインへ問い合わせを行い、最終的に目的のホスト(ここでは www.someshop.co.jp
など)にたどり着きます。
権威サーバー
権威サーバーは、それ自身がなんらかの情報を持つサーバーです。 コンテンツサーバーとも言えます。 ルートサーバーも権威サーバーのひとつとなります。 権威サーバーの持つ情報は各種あります。
ドメイン名とIPアドレスの対応
自身の配下ドメインへの委任情報(NSレコードなど)
ドメイン名の所有者情報
といったものが該当します。 権威サーバーは自身が情報を持つということから『コンテンツサーバー』とも呼ばれることがあります。 リゾルバや末端の(問い合わせを受ける)DNSサーバーは、役割としてはコンテンツサーバーに対する『キャッシュサーバー』という立ち位置に扱われます。
NICの役割
ここで突然ですが、NIC(Network Information Center)という言葉が出てきます。
NICは、主に国別トップレベルドメイン(ccTLD)の管理指針を定めたり、ドメイン名の登録規則を策定したりする組織です。日本ではJPNICがこれに該当し、実際の.jp
ドメインの管理・運用は株式会社日本レジストリサービス(JPRS)が行っています。
NICは、ドメイン名の登録や管理を行う組織であり、各国に存在します。
NICの管理業務として、その国(管理範囲)におけるDNSの管理が含まれています。 TLDのサーバーとそこに含めるSLDの登録・保守が入ります。
自分のドメインを持ちたいとき、最終的にはNICに連絡が行き、登録が行われることになります。
この際に登録される情報がwhois情報であり、ドメインの所有者として公開されます。
たとえば kobedenshi.ac.jp
というドメインを取得している場合、このように公開されます[5]。
リソースレコード(RR)
DNSの権威サーバー(コンテンツサーバー)は、保有する情報に対して『それがなんの情報なのか』を示せるように、リソースレコードという形式で情報を保有しています。
私たちが問い合わせをするとき(もちろんキャッシュサーバーを通して)は、このリソースレコードを参照することになります。 例えるなら、DNSサーバーは関数みたいなもので、引数にリソースレコードの種類と、問い合わせたい情報を渡すようなものです。
result = DNS_Query("www.example.com", "A")
リソースレコードには、主に以下のようなものが存在します。
種類 |
説明 |
渡す情報 |
---|---|---|
A |
IPv4アドレス |
ホスト名 |
AAAA |
IPv6アドレス |
ホスト名 |
CNAME |
別名(エイリアス) |
ホスト名 |
MX |
メールサーバーの情報 |
ドメイン名 |
NS |
ネームサーバーの情報 |
ドメイン名 |
TXT |
任意のテキスト情報 |
ドメイン名 |
SOA |
スタートオブオーソリティ、権威サーバーの情報 |
ドメイン名 |
PTR |
逆引き(IPアドレスからホスト名) |
IPアドレス |
MXレコードは、メールを送る際に『どのメールサーバーがこのメールを受け取ってくれるのか』を調べるために使います。
冗長性のために複数のメールサーバーが取得できることがありますが、各メールサーバーには優先度が割り付けられており、それに従ってメールサーバーは選択されます。
PTRレコードは、IPアドレスからホスト名を調べるために使います。通常と逆向き(ホスト→IPアドレスではなくIPアドレス→ホスト)の問い合わせを行うことから逆引きとも呼ばれています。
逆引きをするときは、対象となるIPアドレスを逆順にして、末尾に
.in-addr.arpa
を付けて問い合わせます。例: 192.168.10.1 → 1.10.168.192 → 1.10.168.192.in-addr.arpa
通常これらはアプリケーション用のライブラリ(API)によって自動的にリゾルバに渡されて問い合わせが行われますが、直接DNSサーバーへ問い合わせるためのツールとして、nslookup
やdig
、host
といったコマンドラインツールが存在します。
Windowsでは
nslookup
が標準で用意されています。LinuxやmacOSでは
dig
やhost
が標準で用意されています。
dig
コマンドは情報を詳細に出します、そこまで詳細なものが必要ないときは一般的にhost
コマンドが使われます[6]。
Windowsでのnslookupの使用例はこのような形になります。
PS> nslookup www.kobedenshi.ac.jp
サーバー: dns.google
Address: 8.8.8.8
権限のない回答:
名前: www.kobedenshi.ac.jp
Address: 35.76.177.158
nslookup -type=mx kobedenshi.ac.jp
サーバー: dns.google
Address: 8.8.8.8
権限のない回答:
kobedenshi.ac.jp MX preference = 5, mail exchanger = alt2.aspmx.l.google.com
kobedenshi.ac.jp MX preference = 1, mail exchanger = aspmx.l.google.com
kobedenshi.ac.jp MX preference = 5, mail exchanger = alt1.aspmx.l.google.com
注釈
『権威のない回答』と出ていますが、これはキャッシュサーバーにあたるリゾルバが権威サーバーに問い合わせて得たキャッシュからのためです。 あくまで『他のサーバーから得た情報を出している』というキャッシュサーバー自身は『権威はない』ということで、このような表記になっています。
Linux(授業用のVMなど)で同様のクエリをhost
で行うと、以下のようになります。
$ host www.kobedenshi.ac.jp
www.kobedenshi.ac.jp has address 35.76.177.158
$ host -t mx kobedenshi.ac.jp
kobedenshi.ac.jp mail is handled by 5 alt2.aspmx.l.google.com.
kobedenshi.ac.jp mail is handled by 1 aspmx.l.google.com.
kobedenshi.ac.jp mail is handled by 5 alt1.aspmx.l.google.com.
DNSとUDP
DNSはUDPを使用して通信を行います。
UDPはコネクションレスのため、実際にクエリを送信できたのかはわかりません。
そのため『一定時間に返答があるか』で対応しています。
DNSはその役割上『素早く処理ができる』ことが求められています。そのため速度を重視したUDPとなります。
本当に求められているのはその後の通信のためです。
クエリや応答のパケットが途中で分割されてしまうと、残りのデータを待つ必要があるため、DNSメッセージの伝統的なUDPペイロードサイズ上限である512バイトに収まるように構造が設計されていました。
とはいえ、応答メッセージがUDPペイロードサイズの制限(伝統的には512バイト)を超える場合は、TCPに切り替えて通信を行います。よってDNSはUDPが基本ですが、TCPも使います。
通常クエリで512バイトを超えることはありませんが、DNSSECと呼ばれるセキュリティ拡張などでは超えてしまうことがあります。この場合、UDPでの応答時にフラグが立てられて、受信したクエリ側はTCPで再度問い合わせを行うことになります。
DNS間での情報の転送(ゾーン転送など)はTCPを使います。これは、DNSサーバー間での情報の完全な転送が必要なためです。