日本語のi18nフィクスチャ
このフィクスチャは、日本語のようなスペース無し言語における用語のマーク付けをテストします。英語のような単語境界(\b)が日本語には存在しないため、ウォーカーは別の戦略を取らなければなりません。
APIの基本
APIはサーバーとクライアントの間のインターフェースです。クライアントはリクエストを送信し、サーバーはレスポンスを返します。リクエストにはヘッダーとボディが含まれます。レスポンスも同じ構造を持ちます。
エンドポイントは具体的なAPIのアクセス先です。例えば/usersや/orders/123のようなパスです。
認証と認可
認証はユーザーが誰であるかを確認するプロセスです。認可はそのユーザーに何を許可するかを決定するプロセスです。両者は混同されがちですが、別物です。認証は認可の前提です。
認証情報の運搬にはトークンを使います。トークンはヘッダーに入れて送信するのが一般的です。クッキーを使う場合もありますが、クッキーはセッション管理に向いており、API認証には不向きとされることが多いです。
キャッシュ
キャッシュはレスポンスを一時保存して、同じリクエストに対する応答を高速化する仕組みです。サーバー側、クライアント側、中間プロキシ、それぞれがキャッシュを持ち得ます。
同期と非同期
同期処理は呼び出し元が結果を待ちます。非同期処理は呼び出し元が結果を待たずに次の処理に進みます。並列処理は同時に複数の処理を実行することです。分散処理は複数の機器に処理を分けることです。並列処理と分散処理は概念が異なります。
共有メモリを用いる並列処理もあれば、メッセージパッシングを用いる分散処理もあります。
単語境界のテスト
日本語にはスペースがないため、用語の境界判定が難しい。例えば「サーバー側のキャッシュ」という文中に、サーバーとキャッシュの両方がマークされなければならない。境界判定が甘いと、サーバー側全体がサーバーとして誤マークされる可能性がある。
「データ」は短くて頻出する用語の代表例です。データがサーバーからクライアントに渡る、データをキャッシュする、データの共有、データベース(この「データベース」全体は用語ではない;中の「データ」も用語ではない、と判定するのは難しい)。
カタカナ語と漢字語の混在
カタカナ語(サーバー、クライアント、リクエスト、レスポンス、ヘッダー、ボディ、クッキー、セッション、キャッシュ、トークン、エンドポイント、データ)と漢字語(認証、認可、同期、非同期、共有、分散処理、並列処理)が混在しています。ウォーカーはどちらも対応できなければなりません。
まとめ
二十の用語すべてがこの本文で少なくとも一回出現します。post-hydrationのDOMには、それぞれの用語IDに対応する<mark>が一つ以上存在することを期待します。