TTML2の吹替および音声解説プロファイル

概要

この仕様は、DAPT、すなわち、吹替台本、音声解説、翻訳字幕および聴覚障害者向け字幕（クローズドキャプションとも呼ばれる）の制作で使用される、文字起こしおよび翻訳ワークフローにおける時間付きテキストコンテンツの交換のための、TTMLベースのファイル形式を定義する。

この節は非規範的である。

一般的な用法では、scriptという語の意味の1つは、映画、テレビ番組、演劇などの書かれたテキストである。スクリプトは、完成した制作物の記録、すなわちトランスクリプトである場合もあれば、まだ作成されていない制作物の計画である場合もある。この文書では、分野固有の用語を用い、より具体的に次のように定義する:

トランスクリプトは、別の形態で存在する 既存のメディアのテキスト表現であり、たとえば動画内の対話である。
台本は、作成前のメディアの意図されたコンテンツのテキスト表現であり、たとえば音声トラックを録音する俳優を導くためのものである。

DAPTスクリプトという用語は、トランスクリプトとスクリプトの両方を指す総称として用いられ、この仕様の正式な要件に対する適合点である。 DAPTスクリプトは、時間付きテキストおよび関連するメタデータ、たとえば発話しているキャラクターなどで構成される。

吹替ワークフローでは、トランスクリプトが生成され、翻訳されてスクリプトが作成される。音声解説ワークフローでは、トランスクリプトが映像画像を記述し、それが音声相当物を録音するためのスクリプトとして直接使用される。

DAPTは、ローカライゼーションおよび音声解説パイプラインにおける、オーサリング、プロンプト提示、再生ツール間でのトランスクリプトおよびスクリプト（すなわちDAPTスクリプト）の交換のための TTMLベースの形式である。 DAPT文書は、 DAPTスクリプトの直列化可能な形式であり、吹替または音声解説に関連する情報、たとえばDAPTスクリプトの種別、台詞、記述、タイミング、メタデータ、元言語の文字起こしテキスト、翻訳テキスト、言語情報、音声ミキシング指示を運び、ユーザー定義の注釈または将来の追加機能を許可できるよう拡張可能であるように設計されている。

この仕様は、DAPTスクリプトのデータモデルおよび [TTML2] 文書としてのその表現（4. DAPTデータモデルおよび対応するTTML構文を参照）を、いくつかの制約および制限（5. 制約を参照）とともに定義する。

DAPTスクリプトは、視聴覚メディアを元の形で理解できないユーザーにとってアクセシブルまたはローカライズされたものにするために用いられ、 [media-accessibility-reqs] に記述されているアクセシビリティ上のニーズを含む、トランスクリプトに関するユーザーニーズを満たす解決策の一部として、また吹替によって台詞を別の言語に翻訳する必要があるユーザーを支援するために用いられることが期待される。

DAPTスクリプトコンテンツのすべての部分は、関連メディア内でそれが何を表すかを、表すものプロパティを介して何らかの表示でマークアップする必要がある。同様に、DAPTスクリプト全体は、それが表すすべてのコンテンツ種別、たとえば音声コンテンツまたは視覚コンテンツを表すかどうか、視覚であればテキストか非テキストか、などを列挙する必要がある。階層的なコンテンツ記述子のレジストリが提供される。

吹替および音声解説の両方のオーサリングワークフローには、 [DAPT-REQS] に記述されている共通の要件を共有する、類似した段階が含まれる。どちらの場合も、作成者はコンテンツをレビューし、台詞または映像画像の中で何が起きているかを、それが起きる時刻とともに書き留める。さらなる変換プロセスでは、テキストを別の言語に変更し、正確なタイミング制約に合うように文言を調整できる。その後、スクリプトの音声レンダリングが生成され、最終的に番組音声へミキシングされる段階がある。そのミキシングは配信前に行われることも、プレーヤー内で直接行われることもある。

吹き替えプロセスは、吹き替え台本の作成から成るものであり、以下を含む複雑な複数段階のプロセスです。

完成済み番組から、その言語での対話を書き起こし、タイミングを付けてトランスクリプトを作成すること。
登場人物情報およびその他の注釈を用いて対話を記述すること。
さらなる翻案を導くためのローカリゼーション注記を生成すること。
対話を対象言語の台本へ翻訳すること。
翻訳を吹き替えに適合させること。たとえば、吹き替えの場合には俳優の唇の動きに合わせること。

吹き替え台本は、非対話部分の番組音声とミックスされる翻訳済み対話を録音し、別の言語による番組のローカライズ版、すなわち吹き替え版、略して dub を生成するために使用されるトランスクリプトまたは台本（ワークフロー段階による）です。

吹き替え台本は、別言語の字幕またはクローズドキャプションを作成するための出発点として有用です。この仕様は、[ttml-imsc1.3] などの TTML の他のプロファイルにおける字幕およびキャプション文書の追加、ならびにそれらへの変換を容易にするよう設計されています。たとえば、字幕スタイリング構文をDAPT文書内に保持できるようにします。あるいは、スタイリングは、音声アーティストが台本付き対話を録音する際の補助として適用できます。

音声解説コンテンツの作成もまた、複数段階のプロセスです。音声解説は、 video description としても知られ、また [media-accessibility-reqs] では解説付き動画として知られており、視覚的な提示を十分に見ることができない視聴者がコンテンツを理解するのを支援するための音声サービスです。これは、メイン番組音声と各説明の音声レンディションをミックスした結果であり、対話と衝突しないタイミングになるよう作成され、音声解説をミックスした音声トラックを提供します。メイン番組音声とは、追加のミックスが行われる前に番組に関連付けられた音声を指します。説明とは、番組提示の一側面を説明する一連の語句であり、発声および録音によって音声としてレンダリングするのに適しているもの、または [WCAG22] で定義されているように、テキスト読み上げ変換のためのテキスト代替ソースとして使用されるものです。音声解説とは何か、およびそれがどのように機能するかについての詳細は、[BBC-WHP051] にあります。

音声解説台本の作成には、通常、以下が含まれます。

番組、または一連の番組の映像コンテンツを視聴すること。
説明を話す機会がある重要な瞬間を特定すること。
その時点での番組の重要な可視部分を説明するための説明テキストを書くこと。
人間の俳優を録音するか、テキスト読み上げを使用することにより、説明の音声版を作成すること。
音声を番組音声と組み合わせるためのミックス指示（[TTML2] の音声スタイリングを用いて適用される）を定義すること。

音声ミックスは、メディアの配信前に行われる場合も、クライアント内で行われる場合もあります。音声解説台本がプレーヤーに配信される場合、テキストは代替レンダリングを提供するために使用できます。たとえば、点字ディスプレイ上で、またはユーザーが設定したスクリーンリーダーを使用して提供できます。

DAPTスクリプトは、他のワークフローおよびシナリオでも有用であり得る。たとえば、元言語トランスクリプトは、次のように使用できる:

翻訳、字幕またはキャプションの制作を意図していない場合でも、音声認識システムの出力形式として。
放送業界で「ポストプロダクションスクリプト」として知られる文書として。主にプレビュー、編集レビュー、販売目的で使用される。

元言語トランスクリプトと翻訳済みトランスクリプトの両方は、次のように使用できる:

Webページまたはアプリケーション内で音声または動画と並べて提示されるアクセシブルなトランスクリプトとして。この用途では、タイミングを保持し、メディアとの同期やメディア内のナビゲーションに使用することも、破棄してタイムライン全体の平文版を提示することもできる。

文書の最上位構造は次のとおりである:

名前空間 http://www.w3.org/ns/ttml 内の <tt> ルート要素は、これがTTML文書であることを示し、 ttp:contentProfiles 属性は、この仕様で定義されるDAPTコンテンツプロファイルに準拠していることを示す。
daptm:scriptRepresents属性は、文書の内容が、元の番組内の何に対する代替であるかを示す。
daptm:scriptType属性は、トランスクリプトまたはスクリプトの種別を示す。ただし、この空の例では文書の構造のみを示しているため、関連しない。
daptm:langSrc属性は、既定のテキスト言語ソース、たとえばコンテンツの元言語を示す。一方、xml:lang属性は、このスクリプト内の既定の言語を示し、この場合は同じである。これらの属性はいずれも継承され、文書のコンテンツ内で上書きできる。

この構造は、吹替または音声解説のいずれであっても、すべての種別のDAPTスクリプトに適用できる。

例 1

<tt xmlns="http://www.w3.org/ns/ttml" 
    xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
    xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
    ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
    xml:lang="en"
    daptm:langSrc="en"
    daptm:scriptRepresents="audio"
    daptm:scriptType="originalTranscript">
  <head>
    <metadata>
      <!-- Additional metadata may be placed here -->
      <!-- Any characters must be defined here as a set of ttm:agent elements -->
    </metadata>
    <styling>
      <!-- Styling is optional and consists of a set of style elements -->
    </styling>
    <layout>
      <!-- Layout is optional and consists of a set of region elements -->
    </layout>
  </head>
  <body>
    <!-- Content goes here and consists of a div for each Script Event -->
    <div xml:id="d1" begin="..." end="..." daptm:represents="audio.dialogue">
      <p>
        <!-- Text blocks are contained in p elements -->
      </p>
      <p xml:lang="fr" daptm:langSrc="en">
        <!-- Translation text is related to the source language for the translation -->
      </p>
    </div>
  </body>
</tt>

次の例は、[DAPT-REQS] に記述されているワークフローの各段階で生成される時間付きテキストのトランスクリプトおよびスクリプトに対応する。

最初の例は、記述または文字起こしのための時間付き機会は特定されているが、まだテキストが書かれていない初期段階のトランスクリプトを示す。ここで<body>要素上に存在するdaptm:represents属性は、 <div>要素が別の値を指定していないため、それらの要素に継承される:

例 2

...
  <body daptm:represents="...">
    <div xml:id="id1" begin="10s" end="13s">
    </div>
    <div xml:id="id2" begin="18s" end="20s">
    </div>
  </body>
...

以降の例では、吹替および音声解説ワークフローにおけるさまざまな用途を示す。

記述が追加されると、これは録音前スクリプトになる。この場合、音声解説コンテンツの大部分が、固有の言語を持たない映像画像を文字起こしすることを反映するために、テキスト言語ソースが、daptm:langSrc属性によって表され、文書の最上位でzxxに設定されていることに注意されたい。これは [bcp47] によって、言語分類が適用されないコンテンツを識別するものとして定義された言語コードである:

例 3

<tt xmlns="http://www.w3.org/ns/ttml"
  xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
  xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
  xmlns:xml="http://www.w3.org/XML/1998/namespace"
  ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
  xml:lang="en"
  daptm:langSrc="zxx"
  daptm:scriptRepresents="visual.nonText"
  daptm:scriptType="preRecording">
  <body>
    <div begin="10s" end="13s" xml:id="a1" daptm:represents="visual.nonText">
      <p>
        A woman climbs into a small sailing boat.
      </p>
    </div>
    <div begin="18s" end="20s" xml:id="a2" daptm:represents="visual.nonText">
      <p>
        The woman pulls the tiller and the boat turns.
      </p>
    </div>
  </body>
</tt>

音声解説コンテンツには、視覚画像内に存在するテキスト、たとえば画像に書かれた標識、場所などが含まれることが多い。次の例はそのような場合を示す。スクリプトが表すものは、スクリプトの内容が非テキストの視覚情報に加えてテキストの視覚情報も表すことを示すために拡張されている。ここでは、スクリプトイベント上で、より正確な表すものの値が指定されており、そのテキストが実際には場所であることを反映している。これは、そのより正確な値が、スクリプトが表すもの内の新しい値のサブタイプであるため許可される。最後に、そのテキストには固有の言語があるため、テキスト言語ソースは、その言語を反映するよう設定されている。

例 4

<tt xmlns="http://www.w3.org/ns/ttml"
  xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
  xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
  xmlns:xml="http://www.w3.org/XML/1998/namespace"
  ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
  xml:lang="en"
  daptm:langSrc="zxx"
  daptm:scriptRepresents="visual.nonText visual.text"
  daptm:scriptType="preRecording">
  <body>
    <div begin="7s" end="8.5s" xml:id="at1"
         daptm:represents="visual.text.location" daptm:langSrc="en">
      <p>
        The Lake District, England
      </p>
    </div>
    <div begin="10s" end="13s" xml:id="a1"
         daptm:represents="visual.nonText">
      <p>
        A woman climbs into a small sailing boat.
      </p>
    </div>
    <div begin="18s" end="20s" xml:id="a2"
         daptm:represents="visual.nonText">
      <p>
        The woman pulls the tiller and the boat turns.
      </p>
    </div>
  </body>
</tt>

音声録音を作成した後、テキスト読み上げを使用しない場合は、再生ミキシングのための指示を挿入できる。たとえば、<span>要素の内側から再生される音声をミキシングする前に、「受信」音声のゲインを変更し、入るときに値を滑らかにアニメーションさせ、出るときに元に戻すことができる:

例 5

<tt ...
  daptm:scriptRepresents="visual.nonText"
  daptm:scriptType="asRecorded"
  xml:lang="en"
  daptm:langSrc="zxx">
  ...
    <div begin="25s" end="28s" xml:id="a3" daptm:represents="visual.nonText">
      <p>
        <animate begin="0.0s" end="0.3s" tta:gain="1;0.39" fill="freeze"/>
        <animate begin="2.7s" end="3s" tta:gain="0.39;1"/>
        <span begin="0.3s" end="2.7s">
          <audio src="clip3.wav"/>
          The sails billow in the wind.</span>
      </p>
    </div>
...

文書レベルでは、daptm:scriptRepresents属性は、関連メディア内で文書が視覚テキストおよび視覚非テキストコンテンツの両方を表すことを示す。たとえば映像画像内にテキストが存在しないために、実際には視覚テキストを表すスクリプトイベントがない可能性もある。

上の例では、<div>要素の begin属性がその子に対する「syncbase」となる時刻を定義しているため、ここでは<animate>要素および<span>要素上の時刻は 25sを基準に相対的である。最初の<animate>要素は、0.3sかけてゲインを1から0.39へ下げ、終了後にその値を固定し、 2つ目の要素はこの記述の最後の0.3sでゲインを元に戻す。その後、<span>要素は、最初の音声ディップが完了した後にのみ開始するようタイミング付けされている。

音声録音が長く、その一部だけを再生する必要がある場合は、 clipBeginおよびclipEndを使用して行うことができる。 5sから8sまでの音声ファイルの一部だけを再生したい場合は、次のようになる:

例 6

...
  <span><audio src="long_audio.wav" clipBegin="5s" clipEnd="8s"/>
  A woman climbs into a small sailing boat.</span>
...

または、テキストを発話させるために音声属性を追加することもできる:

例 7

...
    <div begin="18s" end="20s" xml:id="a2">
      <p>
        <span tta:speak="normal">
          The woman pulls the tiller and the boat turns.</span>
      </p>
    </div>
...

音声を直接埋め込むことも可能であり、それにより1つの文書にスクリプトと録音済み音声をまとめて含めることができる:

例 8

...
    <div begin="25s" end="28s" xml:id="a3">
      <p>
        <animate begin="0.0s" end="0.3s" tta:gain="1;0.39" fill="freeze"/>
        <animate begin="2.7s" end="3s" tta:gain="0.39;1"/>
        <span begin="0.3s" end="2.7s">
          <audio><source><data type="audio/wave">
            [base64-encoded audio data]
          </data></source></audio>
          The sails billow in the wind.</span>
      </p>
    </div>
...

例 1の基本構造から、音声を文字起こしすると、元言語の吹替トランスクリプトが生成され、次のようになり得る。特定のスタイルまたはレイアウトは定義されておらず、ここでは台詞の文字起こしに焦点を当てている。キャラクターは<metadata>要素内で識別される。言語とテキスト言語ソースは、それぞれxml:lang属性およびdaptm:langSrc属性を使用して定義され、トランスクリプトは翻訳されていないため、同じ値を持つことに注意されたい。

例 9

<tt xmlns="http://www.w3.org/ns/ttml" 
    xmlns:ttm="http://www.w3.org/ns/ttml#metadata"
    xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
    xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
    ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
    xml:lang="fr"
    daptm:langSrc="fr"
    daptm:scriptRepresents="audio.dialogue"
    daptm:scriptType="originalTranscript">
  <head>
    <metadata>
      <ttm:agent type="character" xml:id="character_1">
        <ttm:name type="alias">ASSANE</ttm:name>
      </ttm:agent>
    </metadata>
  </head>
  <body>
    <div begin="10s" end="13s" xml:id="d1" daptm:represents="audio.dialogue">
      <p ttm:agent="character_1">
        <span>Et c'est grâce à ça qu'on va devenir riches.</span>
      </p>
    </div>
  </body>
</tt>

テキストを翻訳した後、文書は変更される。翻訳テキストが含まれ、この場合は元のテキストが保持される。主文書の既定の言語は、焦点が翻訳後の言語にあることを示すように変更される。 xml:lang属性とdaptm:langSrc属性の組み合わせは、テキストが元のものか翻訳されたものかをマークするために用いられる。この場合、それらは例を読みやすくするために<tt>要素と<p> 要素の両方に存在するが、継承モデルを利用して、いくつかの場合には省略することも可能である:

例 10

<tt xmlns="http://www.w3.org/ns/ttml"
    xmlns:ttm="http://www.w3.org/ns/ttml#metadata"
    xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
    xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
    ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
    xml:lang="en"
    daptm:langSrc="fr"
    daptm:scriptRepresents="audio.dialogue"
    daptm:scriptType="translatedTranscript">
  <head>
    <metadata>
      <ttm:agent type="character" xml:id="character_1">
        <ttm:name type="alias">ASSANE</ttm:name>
      </ttm:agent>
    </metadata>
  </head>
  <body>
    <div begin="10s" end="13s" xml:id="d1" ttm:agent="character_1" daptm:represents="audio.dialogue">
      <p xml:lang="fr" daptm:langSrc="fr"> <!-- original -->
        <span>Et c'est grâce à ça qu'on va devenir riches.</span>
      </p>
      <p xml:lang="en" daptm:langSrc="fr"> <!-- translated -->
        <span>And thanks to that, we're gonna get rich.</span>
      </p>
    </div>
  </body>
</tt>

録音前の翻案プロセスでは、文言を調整したり、さらなるタイミングを追加したりして、録音を支援できる。 daptm:scriptType属性も、次の例のように変更される:

例 11

<tt xmlns="http://www.w3.org/ns/ttml"
    xmlns:ttm="http://www.w3.org/ns/ttml#metadata"
    xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
    xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
    ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
    xml:lang="en"
    daptm:langSrc="fr"
    daptm:scriptRepresents="audio.dialogue"
    daptm:scriptType="preRecording">
  <head>
    <metadata>
      <ttm:agent type="character" xml:id="character_1">
        <ttm:name type="alias">ASSANE</ttm:name>
      </ttm:agent>
    </metadata>
  </head>
  <body>
    <div begin="10s" end="13s" xml:id="d1" ttm:agent="character_1" daptm:onScreen="ON_OFF" daptm:represents="audio.dialogue">
      <p xml:lang="fr" daptm:langSrc="fr">
        <span>Et c'est grâce à ça qu'on va devenir riches.</span>
      </p>
      <p xml:lang="en" daptm:langSrc="fr">
        <span begin="0s">And thanks to that,</span><span begin="1.5s"> we're gonna get rich.</span>
      </p>
    </div>
  </body>
</tt>

この節は、DAPTのデータモデルと、それに対応する TTML構文を指定する。このモデルには、プロパティを持ち、他のオブジェクトと関連付けられるオブジェクトが存在する。 TTML構文では、これらのオブジェクトおよびプロパティは要素および属性として表現されるが、オブジェクトが常に要素として、プロパティが常に属性として表現されるわけではない。

図1は、DAPTデータモデルを示し、すべてのオブジェクトおよびプロパティをこの文書内の対応する節へハイパーリンクしている。共有プロパティは斜体で示される。図におけるその他すべての規約は、[uml] に従う。

図 1 （参考）DAPTデータモデルの主要エンティティを示すクラス図。

Issue 116: インライン化されていない埋め込み音声リソースをデータモデルに追加するか？ question CR-exit-must-have

#115 も参照してください - インラインではない埋め込み音声リソースをサポートするのであれば、それらのためのオブジェクトを作成し、データモデルに追加すべきでしょうか？

DAPT スクリプトとは、オーサリングワークフロー内で処理される文書、またはクライアントによって処理される文書に対応し、この仕様の制約に適合するトランスクリプトまたはスクリプトである。これは、次の節で定義されるプロパティおよびオブジェクトを持つ: スクリプトが表すもの、スクリプト種別、既定の言語、テキスト言語ソース、スクリプトイベントおよび、吹替スクリプトの場合は、キャラクターである。

DAPT文書とは、 DAPTスクリプトを表す [TTML2] 時間付きテキストコンテンツ文書インスタンスである。 DAPT文書は、この節および後続の節で定義される構造と制約を持つ。

注記

[TTML2] 時間付きテキストコンテンツ文書インスタンスは、 TT名前空間内にルート<tt>要素を持つ。

スクリプトが表すものプロパティは、DAPTスクリプトの必須プロパティであり、文書の内容が関連メディアオブジェクトのどの構成要素を表すかを示す。文書の内容は、それらの構成要素に対するアクセシブルな代替を提供するための仕組みの一部として使用できる。

注記

スクリプトイベントには、関連するプロパティである表すものがあり、そのプロパティで許可される値については、スクリプトが表すものの値に依存する制約がある。

このプロパティを表すために、daptm:scriptRepresents属性は <tt>要素上に存在しなければならず、次の構文に適合する値を持つ:

daptm:scriptRepresents
: <content-descriptor> ( <lwsp>+ <content-descriptor>)*

<lwsp>                # as TTML2

既定の言語は、DAPTスクリプトの必須プロパティであり、スクリプトイベントのテキストコンテンツに対する既定の言語を表す。この言語は、元の言語の1つである場合も、翻訳言語である場合もある。翻訳言語を表す場合、それは吹替または音声解説スクリプトが準備される最終的な言語であることがあり、目標録音言語と呼ばれる。または、ワークフローで使用される中間言語、すなわちピボット言語であることもある。

既定の言語は、DAPT文書では、次の構造および制約によって表される:

xml:lang属性は<tt>要素上に存在しなければならず、その値は空であってはならない。

注記

DAPTスクリプト内のすべてのテキストコンテンツには、指定された言語がある。複数の言語が使用される場合、既定の言語は、スクリプトイベントの大半の言語、最も長い時間話されている言語、または作者が任意に選んだ言語に対応できる。

例 13

デンマーク語とスウェーデン語の台詞を含む動画について、台詞の元言語トランスクリプトが作成される。既定の言語は、<tt>要素上に xml:lang="da"を設定することによってデンマーク語に設定される。スウェーデン語のテキストを含むスクリプトイベントは、 <p>要素上に xml:lang="sv"を設定することでこれを上書きする。デンマーク語のテキストを含むスクリプトイベントは、継承された言語が文書の既定の言語であるため、 xml:lang属性を設定することも、省略することもできる。どちらの場合も、スクリプトイベントのテキストオブジェクトは、固有の言語を持っていた未翻訳コンテンツ（この場合は台詞）を表す<p>要素であり、したがってdaptm:langSrc属性をそのソース言語に設定し、それらが元言語であることを含意する。

スクリプト種別プロパティは、DAPTスクリプトの必須プロパティであり、吹替および音声解説ワークフローで使用される文書の種別を、次のものの中から記述する: 元言語トランスクリプト、翻訳済みトランスクリプト、録音前スクリプト、録音済みスクリプト。

このプロパティを表すために、daptm:scriptType属性は<tt>要素上に存在しなければならない:

daptm:scriptType
  : "originalTranscript"
  | "translatedTranscript"
  | "preRecording"
  | "asRecorded"

文書の種別と、対応するdaptm:scriptType属性値の定義は次のとおりである:

元言語トランスクリプト:
daptm:scriptType属性値がoriginalTranscriptである場合、その文書は、台詞および／または画面上テキストをそれらの固有の発話／書記言語で文字どおりに文字起こししたもの、または非台詞音および非言語的な視覚コンテンツを文字起こししたものである。

この種別のトランスクリプト内のスクリプトイベントは:
- 元テキストオブジェクトを含むべきである。
- 翻訳テキストオブジェクトを含むべきではない。
例 14
番組が英語とヘブライ語の台詞を含む場合、元言語トランスクリプトには、英語のスクリプトイベントとヘブライ語のスクリプトイベントが含まれ、そのすべてに元テキストオブジェクトが含まれる。その文書には、翻訳テキストオブジェクトは含まれない。
翻訳済みトランスクリプト:
daptm:scriptType属性値がtranslatedTranscriptである場合、その文書は、共通言語における元言語トランスクリプトの翻訳を表す。

それは、録音前スクリプトを生成するために翻案でき、かつ／または目標録音言語へのさらなる翻訳の基礎として使用できる。

この種別のトランスクリプト内のスクリプトイベントは:
- 翻訳テキストオブジェクトを含むべきである。
- 元テキストオブジェクトも含んでよい。
例 15
番組が英語とヘブライ語の台詞を含む場合、フランス語の翻訳済みトランスクリプトには、少なくともすべてのスクリプトイベントのフランス語への翻訳が含まれる。さらなる処理を支援するために、ヘブライ語および英語のテキストコンテンツを保持してもよい。

例 16
音声解説の元言語トランスクリプトが、画像内テキストコンテンツを記述する元言語のスクリプトイベントを含み、望まれる音声解説出力が別の言語である必要がある場合、テキストオブジェクトは翻訳テキストオブジェクトであり得る。その場合、そのトランスクリプトを翻訳済みトランスクリプトとしてマークすることが適切である。また、翻訳作業の一部として、翻訳されたテキストコンテンツ内で、そのテキストの元言語を記述して視聴者に知らせることも適切な場合がある。たとえば、「日本語の新聞見出し。意味は: 船員が海洋横断を完了」のようにである。
録音前スクリプト:
daptm:scriptType属性値がpreRecordingである場合、その文書は、録音のために元言語トランスクリプトまたは翻訳済みトランスクリプトを翻案した結果を表す。たとえば、吹替ワークフローでより良いリップシンクを実現するため、または音声解説ワークフローで利用可能な時間内に語句が収まることを確実にするためである。

この種別のスクリプト内のスクリプトイベントは:
- 目標録音言語のテキストオブジェクトを含むべきである。
- その言語が目標録音言語ではない場合には、さらなる処理を支援する文脈として、元言語トランスクリプトからの元テキストオブジェクトも含んでよい。
- 音声オブジェクトを含む べきではない。
注記

DAPTスクリプトのスクリプト種別は、文書のテキストコンテンツを調べることによって必ずしも検出できるとは限らない。たとえば、翻訳済みトランスクリプトを録音前スクリプトへ翻案することは、文書の残りの部分を変更することなく、スクリプトイベントのテキストコンテンツ内の一部の語を置き換えるだけで構成されることがある。いずれの場合も、翻訳テキストオブジェクトは、それらが翻訳された元の言語にテキスト言語ソースプロパティを設定する。

注記

音声解説スクリプトイベント内の元テキストオブジェクトは、固有の言語を持たない場面の視覚要素を表す場合、空のテキスト言語ソースプロパティを持つ。それ以外で、画像内テキストなど、固有の言語を持つ視覚要素を表す場合は、言語を指定するテキスト言語ソースを持つ必要がある。音声解説スクリプトが翻訳される場合、その翻訳は翻訳テキストオブジェクトによって表される。
録音済みスクリプト:
daptm:scriptType属性値がasRecordedである場合、その文書は実際の音声録音を表す。

この種別のスクリプト内のスクリプトイベントは:
- 目標録音言語のテキストオブジェクトを含むべきである。
- 文脈および品質検証のために、元言語トランスクリプトからの元テキストオブジェクト、または他の言語の翻訳テキストオブジェクトも含んでよい。
- 録音を組み込んだ音声トラックを生成する目的で、音声へのリンクおよびミキシング指示も含んでよい。
- 音声録音オブジェクトを含むべきである。
- 合成音声オブジェクトを含む べきではない。
注記

録音済みスクリプト内の翻訳テキストオブジェクトは、それらのテキスト言語ソースを保持するため、翻訳元のソース言語が引き続き利用可能である。

編集者注記

次の例は孤立している――列挙されたスクリプト種別の前、節の先頭へ移動するか？

例 17

<tt daptm:scriptType="originalTranscript">
...
</tt>

DAPTスクリプトは、各々が特定の時間間隔の台詞、画面上テキスト、または記述に対応する、0個以上のスクリプトイベントオブジェクトを含んでよい。

いずれかのスクリプトイベントが存在する場合、DAPT文書は、 <tt>要素の子として1つの<body>要素を持たなければならない。

DAPTスクリプトは、それぞれがスクリプトイベントから参照できるキャラクターを記述する、0個以上のキャラクターオブジェクトを含んでよい。

いずれかのキャラクターオブジェクトが存在する場合、DAPT文書は、 <tt>要素の子として1つの<head>要素を持たなければならず、その<head>要素は、少なくとも1つの<metadata>要素の子を持たなければならない。

注記

4.2 キャラクターは、すべてのキャラクターオブジェクトを単一の<metadata>親要素内に配置すること、また<head>要素の子として複数の <metadata>要素がある場合には、キャラクターオブジェクトをその最初の子内に配置することを推奨している。

DAPTデータモデル内の一部のプロパティは、複数のオブジェクト型で共通しており、出現する場所すべてで同じ意味を持つ。これらの共有プロパティは、この節に列挙される。

DAPT内の一部の値集合は、複数のプロパティにわたって再利用され、出現する場所すべてで同じ制約を持つ。これらの共有値集合も、この節に列挙される。

編集者注記

「Timed Object」クラスを作成し、Script Event、Mixing Instruction、Audio Recordingをそこからサブクラス化する方がよいか？

次のタイミングプロパティは、それらを含むエンティティがいつアクティブであるかを定義する:

開始プロパティは、オブジェクトがいつアクティブになるかを定義し、親オブジェクトのアクティブ開始時刻を基準とする。 DAPTスクリプトは、メディアタイムライン上の時刻ゼロで開始する。
終了プロパティは、オブジェクトがいつアクティブでなくなるかを定義し、親オブジェクトのアクティブ開始時刻を基準とする。
継続時間プロパティは、オブジェクトの最大継続時間を定義する。

注記

終了プロパティと継続時間プロパティの両方が存在する場合、終了時刻は、[TTML2] で定義されるように、終了と開始 + 継続時間のうち早い方である。

注記

いずれかのタイミングプロパティが省略された場合、[TTML2] で定義されるタイミング意味論を言い換えると、次の規則が適用される:

開始の既定値はゼロ、すなわち親オブジェクトの開始時刻と同じである。
終了の既定値は不定であり、すなわち親の時間付きオブジェクトが存在する場合、その終了時刻と同じものとして解決される。
継続時間の既定値は不定であり、すなわち終了時刻は親オブジェクトの終了時刻と同じものとして解決される。

注記

DAPTスクリプトの終了時刻は、実用上、関連メディアオブジェクトの終端である。

スクリプトが表すものおよび表すものプロパティで許可される値は、 <content-descriptor> 構文定義と、それに関連付けられたレジストリ表に依存する。

<content-descriptor> は、次の構文に適合する値を持つ:

<content-descriptor>  # see registry table below
: <descriptor-token> ( <descriptor-delimiter> <descriptor-token> )*

<descriptor-token>
: (descriptorTokenChar)+

descriptorTokenChar  # xsd:NMtoken without the "."
: NameStartChar | "-" | [0-9] | #xB7 | [#x0300-#x036F] | [#x203F-#x2040]

<descriptor-delimiter>
: "."  # FULL STOP U+002E

<content-descriptor> は、区切り文字で区切られたトークンの順序付きリストである値を持つ。

<content-descriptor> 値Bは、Aのdescriptor-tokensの順序付きリストが、 Bのdescriptor-tokensの順序付きリストの先頭に存在する場合、別の<content-descriptor>値Aのコンテンツ記述子サブタイプ（サブタイプ）である。

例 18

`<content-descriptor>` の値の例と、それぞれがもう一方のサブタイプであるかどうかを示す表。
`<content-descriptor>` A	`<content-descriptor>` B	BはAのサブタイプか？
`visual.text`	`visual`	いいえ
`visual.text`	`visual.text`	はい
`visual.text`	`visual.text.location`	はい

たとえば、この表では、Aはスクリプトが表すものプロパティに列挙された値の1つであり得、 Bは表すものプロパティの値であり得る。

<content-descriptor> に許可される値は、次のレジストリ表に列挙されたもの、またはユーザー定義のもののいずれかである。

有効なユーザー定義値は、x-で始まるか、 content-descriptorレジストリ表の値のサブタイプであり、最初の追加 <descriptor-token> 構成要素がx-で始まらなければならない。

レジストリ表： `<content-descriptor>` コンポーネント用。そのレジストリ定義は H.2.2 `<content-descriptor>` レジストリ表定義にある
`<content-descriptor>`	状態	説明	使用例
`audio`	暫定	DAPT コンテンツが音声番組の任意の部分を表すことを示す。	吹き替え、翻訳、難聴者向け字幕およびキャプション、制作前および制作後の台本
`audio.dialogue`	暫定	DAPT コンテンツが音声番組内の言語コミュニケーション、たとえば話し言葉による会話を表すことを示す。	吹き替え、翻訳、難聴者向け字幕およびキャプション、制作前および制作後の台本
`audio.nonDialogueSounds`	暫定	DAPT コンテンツが言語コミュニケーションではない音、たとえば怒ってドアを強く閉める音のような重要な音に対応する、音声番組の一部を表すことを示す。	翻訳、難聴者向け字幕およびキャプション、制作前および制作後の台本
`visual`	暫定	DAPT コンテンツが番組の視覚画像の任意の部分を表すことを示す。	音声解説
`visual.dialogue`	暫定	DAPT コンテンツが番組の視覚画像内における言語コミュニケーション、たとえば手話による会話を表すことを示す。	吹き替えまたは音声解説、翻訳、難聴者向け字幕およびキャプション、制作前および制作後の台本
`visual.nonText`	暫定	DAPT コンテンツが番組の視覚画像の非テキスト部分、たとえばシーン内の重要な物体を表すことを示す。	音声解説
`visual.text`	暫定	DAPT コンテンツが番組の視覚画像内のテキストコンテンツ、たとえば標識、時計、新聞の見出し、インスタントメッセージなどを表すことを示す。	音声解説
`visual.text.title`	暫定	関連メディアのタイトルであるテキストを表す `visual.text` のサブタイプ。	音声解説
`visual.text.credit`	暫定	テキストがクレジット、たとえば俳優の名前である `visual.text` のサブタイプ。	音声解説
`visual.text.location`	暫定	テキストがコンテンツの発生している場所を示す `visual.text` のサブタイプ。	音声解説

注記

レジストリ項目は、バージョン管理システム内の /registries/content-descriptor.json に JSON 形式で提供されている。

データモデル内の一部のエンティティには、一意識別子が含まれます。一意識別子には、以下の要件があります。

これはDAPTスクリプト内で一意である。すなわち、一意識別子の値は、それがどの特定の種類の識別子であるかに関係なく、文書内で一度だけ使用できる。

Character Identifier が値 "abc" を持ち、同じ文書内のScript Event Identifier が同じ値を持つ場合、それはエラーである。
その値は、[XML] で定義される Name の要件に適合しなければならない。
注記
これは、数字、結合用発音区別符号（アクセント）、または以下の文字のいずれかで始めることはできない。
```
    .
    -
    ·  // #xB7
    ‿  // #x203F
    ⁀  // #x2040
```
ただし、これらの文字は他の位置では使用できる。

あるエンティティの一意識別子は、 DAPT文書内で、対応する要素上の xml:id 属性によって表現される。

注記

xml:id の意味論および処理に関する正式な要件は、 [xml-id] で定義されている。

この節は主に吹替ワークフローに関連する。

番組内のキャラクターは、次のプロパティを持つキャラクターオブジェクトを使用して記述できる:

必須のキャラクター識別子。これは、文書内の他の場所からキャラクターを参照するために使用される一意識別子であり、たとえばキャラクターがスクリプトイベントに参加する時を示すために用いられる。
必須の名前。これは番組内のキャラクターの名前である。
任意のタレント名。これは、このキャラクターの台詞を発話する俳優の名前である。

キャラクターは、DAPT文書において、次の構造および制約によって表される:

キャラクターは、DAPT文書において、パス/tt/head/metadata/ttm:agentに存在する<ttm:agent>要素によって表され、次の制約を持つ:
- type属性はcharacterに設定しなければならない。
- xml:id属性は<ttm:agent>要素上に存在しなければならず、キャラクター識別子に設定されなければならない。
- <ttm:agent>要素は、type属性がaliasに設定され、その内容がキャラクター名に設定された<ttm:name>要素を含まなければならない。
- キャラクターがタレント名を持つ場合、それは<ttm:actor>子要素を含まなければならない。その子要素は、別個の<ttm:agent>要素のxml:id属性の値に設定されたagent属性を持たなければならない。その<ttm:agent>要素は、タレント名に対応し、すなわち、そのtype属性がpersonに設定されているものである。
  
  注記
  
  タレント名に対応する追加の<ttm:agent>要素に対する要件は、次の箇条書きリストで定義される。
例 19
```
...
<metadata>
  <ttm:agent type="character" xml:id="character_1">
    <ttm:name type="alias">DESK CLERK</ttm:name>
  </ttm:agent>
</metadata>
...
```
例 20
```
...
<metadata>
  <ttm:agent type="person" xml:id="actor_A">
    <ttm:name type="full">Matthias Schoenaerts</ttm:name>
  </ttm:agent>
  <ttm:agent type="character" xml:id="character_2">
    <ttm:name type="alias">BOOKER</ttm:name>
    <ttm:actor agent="actor_A"/>
  </ttm:agent>
</metadata>
...
```
キャラクターがタレント名プロパティを持つ場合:
- タレント名に対応する <ttm:agent>要素は、パス/tt/head/metadata/ttm:agentに存在しなければならず、次の制約を持つ:
  - そのtype属性はpersonに設定しなければならない
  - そのxml:id属性は設定しなければならない。
  - それは、 typeがfullに設定されなければならず、その内容がタレント名に設定された<ttm:name>子要素を持たなければならない。
- 複数のキャラクターが同じタレント名に関連付けられる場合、そのタレント名に対応する単一の <ttm:agent>要素が存在すべきであり、それぞれのキャラクターから個別に参照される。
- タレント名に対応する各<ttm:agent>要素は、それを参照する<ttm:actor>子要素を持つキャラクター <ttm:agent>要素より前に出現すべきである。
すべての<ttm:agent>要素は、<head>要素内の最初の<metadata>要素に含められるべきである。

注記

<head>要素内には複数の<metadata>要素が存在できる。たとえば独自メタデータを含めるためである。ただし、上記では、キャラクターを定義するために1つだけを使用することを推奨している。

編集者注記

グループは、どのメタデータ要素を使用してDAPT 情報を運ぶかに関する規則の更新を検討している。グループは、実装の単純さ（たとえばDAPT メタデータを1か所に配置すること）と、オーサリングの柔軟性（たとえばシリーズ用とエピソード用に異なるメタデータ要素を持つこと）とのバランスを取りたいと考えている。 1つのアプローチは現在のもの: 「メタデータ要素は1つだけ、それは最初のもの」。別のアプローチは「メタデータ要素は1つだけ、属性で識別されるもの」。別のアプローチは「任意の数のメタデータ要素」である。グループは実装者およびユーザーからのフィードバックを歓迎する。

注記

5.2.1 認識されない語彙で示されているように、 ttm:agent要素は外来の属性および要素を持つことができる。これは、追加の独自キャラクター情報を提供するために使用できる。

Issue 44: DAPT固有の適合実装種別を定義する CR must-have

汎用的な「プレゼンテーションプロセッサ」または「変換プロセッサ」を使用することを避けるため、適合実装種別の独自のクラスを定義すべきである。それらへリンクできる。
現時点では、次のクラスを考えられる:

DAPT Authoring Tool: 適合するDAPT文書を生成する、またはDAPT適合文書を消費するツール。これらがTTML2プロセッサに対応するとは思わない。
DAPT Audio Recorder/Renderer: ミキシング指示を持つものなど、DAPT音声解説スクリプトを受け取り、音声出力、たとえばWAVEファイルを生成するツール。これは「プレゼンテーションプロセッサ」だと思う。
DAPT Validator: DAPT文書が仕様に適合していることを検証するツール。TTML2用語で何に対応するかは確信がない。

スクリプトイベントオブジェクトは、発話される台詞、画面上テキスト、または音声解説を表し、次のプロパティを持つ:

必須のスクリプトイベント識別子。これは一意識別子である。
任意の開始プロパティ、任意の終了プロパティ、および任意の継続時間プロパティ。これらは共に、番組タイムライン内におけるスクリプトイベントの時間間隔を定義する。

注記

通常、スクリプトイベントは時間的に重ならない。しかし、重なる場合もあり得る。たとえば、吹替スクリプトにおいて、異なるキャラクターが同時に異なるテキストを話す場合である。
表すものプロパティ。これは、そのイベントがどのコンテンツを表すか（たとえば台詞、画面上テキストなど）を識別するために使用される。すべてのスクリプトイベントは、有効な表すものプロパティを持たなければならない。

注記

表すものプロパティは継承可能であるため、その値をすべてのスクリプトイベント上で明示的に指定する必要はない。
このスクリプトイベントに関与するキャラクターを示す、0個以上のキャラクター識別子。

注記

通常、スクリプトイベントは単一のキャラクターに対応する。しかし、複数のキャラクターがスクリプトイベントに関連付けられる場合もある。これは、すべてのキャラクターが同時に同じテキストを話す場合である。

注記

トランスクリプトにおいて、イベントが画像内コンテンツ、たとえば音声解説に対応する場合、キャラクター識別子は不要である。しかし、録音前スクリプトまたは録音済みスクリプトの文脈では、誰が録音に声を当てるかを示すキャラクターを示すことが役立つ場合がある。
0個以上のテキストオブジェクト。それぞれは元または翻訳のいずれかである。

注記

テキストオブジェクトを持たないスクリプトイベントは、何らかのコンテンツが存在し得る時間間隔を大まかに割り当てることが役立つワークフローにおける、オーサリングの初期段階の一部として作成できる。たとえば、タイミングプロパティを持つ空のスクリプトイベントを作成して、音声解説を作成する機会を識別できる。 [DAPT-REQS] プロセスステップ1も参照。

注記

空のテキストオブジェクト、すなわちテキスト内容を持たないものは、テキスト内容がないことを明示的に示すために使用できる。空のテキストオブジェクトは、未完了の作業を示すワークフローのプレースホルダーとして使用しないことが推奨される。
0個以上のスクリプトイベント記述オブジェクト。それぞれはスクリプトイベントの人間可読な記述である。
任意の画面上プロパティ。これはスクリプトイベントの対象（たとえばキャラクター）の位置を示す注釈である。
スクリプトイベント中の番組音声の再生を調整するために使用される、 0個以上のミキシング指示オブジェクト。

スクリプトイベントは、DAPT文書において、パス/tt/head/body//divで表され、次の構造および制約を持つ:

Issue 233: スクリプトイベントに対応するdivの識別の改善を検討する CR must-have

#216（コメント）での議論に基づくと、 divがスクリプトイベントを表す時を示す明示的なシグナルを持つべきだと思う。

<body> 要素と、スクリプトイベントに対応する <div> 要素との間のパスには、任意の数のネストされた <div> 要素の祖先が存在して MAY である。そのような要素について、これ以上の意味論は定義されない。
スクリプトイベントに対応する <div> 要素が 1 つ存在 MUST であり、以下の制約を満たす。
- xml:id 属性が存在し、そこにスクリプトイベント識別子を含んでい MUST。
  
  注記
  
  xml:id 属性を持たないためスクリプトイベントとは見なされない <div> 要素をプロセッサがどのように扱うかの詳細については、 6.3 <div> および <p> 要素の処理を参照。
- begin、end および dur 属性は、それぞれ開始、終了および継続時間を表す。これはスクリプトイベントのものである。
  
  begin および end 属性は存在 SHOULD である。 dur 属性は存在して MAY である。
  
  注記
  
  タイミングプロパティに関する追加の注記については、4.1.6.1 タイミングプロパティを参照。
- ttm:agent 属性は存在して MAY であり、存在する場合は、関連付けられたキャラクターを表す各 ttm:agent 属性への参照を含んで MUST である。
  
  注記
  
  複数の参照は、空白で区切られたリストを用いて指定される。
  例 21
```
...
<div xml:id="event_1"
     begin="9663f" end="9682f"
     ttm:agent="character_4">
...
</div>
...
```
- daptm:represents 属性は存在して MAY であり、表す対象プロパティを表す。
  例 22
```
...
<div xml:id="event_1"
     begin="9663f" end="9682f"
     daptm:represents="audio.dialogue">
...
</div>
...
```
- daptm:represents 属性の算出値は、有効な空でない値で MUST である。
  
  注記
  
  表す対象は継承可能なプロパティであるため、祖先要素上に daptm:represents 属性を指定できる。
- これは、各テキストオブジェクトを表す 0 個以上の <p> 要素を含んで MAY である。
- これは、画面上プロパティを表す <metadata> 要素を含んで MAY である。
- これは、いかなる <div> 要素の子も含んで MUST NOT である。

テキストオブジェクトは、通常は単一言語のテキストコンテンツを含む。この言語は、原文言語、または翻訳言語であってよい。

テキストは、以下のいずれかである場合、原文として定義される。

番組音声内の対話を書き起こしたものであり、その対話と同じ言語であるもの。
番組映像内に表示されるテキストを書き起こしたものであり、そのテキストと同じ言語であるもの。
非対話音の未翻訳の表現。
番組映像内のシーンの未翻訳の説明。
言語が判定されていないコンテンツの未翻訳の表現（これは推奨されない）。

注記

テキストは、異なる言語での原文テキストオブジェクトの表現である場合、翻訳として定義される。

テキストは、その言語とテキスト言語ソースをあわせて調べることにより、テキスト言語ソースで定義された意味論に従って、原文または翻訳であるものとして識別できる。

翻訳テキストオブジェクト、および該当する場合には原文テキストオブジェクトのソース言語は、テキスト言語ソースプロパティを用いて示される。

テキストオブジェクト、またはその一部が、親のスクリプトイベントよりも具体的なもの、または異なるものを表す場合、それは異なる表す対象プロパティを持つことができる。

テキストオブジェクト、およびそのすべての部分は、有効な表す対象プロパティを持たなければMUSTならない。このプロパティ自体の存在は任意と見なされる。なぜなら、テキストオブジェクトがこのプロパティを省略した場合、そのプロパティは親のスクリプトイベントから継承されるからである。

注記

可能な場合には、関連メディアオブジェクトの異なる部分を表すテキストは、それぞれ独自の表す対象プロパティを持つ異なるスクリプトイベント内のテキストオブジェクトに入れるべきである。表す対象をテキストオブジェクトまたはテキストオブジェクトの一部に直接割り当てる選択肢は、これが実用的でない場合のために提供されている。

たとえば、映像画像の非テキスト部分と視覚的テキストコンテンツの両方を説明するよう作成され、 1 回で発声されることを意図したスクリプトイベントを考える。これを 2 つ以上のスクリプトイベントに分割すると、 1 つ目に終了時刻を、2 つ目に開始時刻を割り当てる必要があり、それは単純でない場合がある。

この場合、精度を維持するために、テキストを、別々のテキストオブジェクト、またはサブパートに分割し、それぞれに独自の異なる表す対象プロパティを持たせることもできる。

テキストオブジェクトはスタイル付けできる。

テキストの間に番組音声を変更するために使用される 0 個以上のミックス指示オブジェクトが存在しても MAY よい。

テキストオブジェクトは、 DAPT文書内では、パス /tt/head/body//div/p にある <p> 要素によって表現され、以下の制約を伴う。

スクリプトイベントのテキストは、 <metadata> 要素および外来要素が取り除かれた後、 <br> 要素が改行に置き換えられた後、かつ [XML] で定義される空白処理を適用した後の、 <p> 要素およびそのすべての <span> 子孫要素の文字コンテンツによって表現される。

注記

段落のテキストコンテンツは、 <br> または <span> などの TTML 要素を用いて構造化できる。これらは、各段落内のテキストの一部のレイアウトまたはスタイルを変更するために使用される tts:ruby などの TTML スタイル属性を含めたり参照したりできる。混在方向のテキスト、たとえば左から右（ltr）と右から左（rtl）のテキストが交互に現れる場合は、 <span> 要素上の tts:direction 属性を用いて指定できる。同様に、メタデータは属性または <metadata> 要素を用いて追加できる。
<p> 要素は、daptm:langSrc 属性を持つべき SHOULD であり、これはテキストオブジェクトのテキスト言語ソース、すなわち、テキストが原文であるか翻訳であるか、またそのソースが固有の言語を持っていたかを示す。

注記

<p> 要素がdaptm:langSrc 属性を省略した場合、その算出値は親要素からの継承によって導かれ、それはルート <tt> 要素まで続く。

ソース言語の変動が非常に少ない台本では、 daptm:langSrc 属性をルート要素上に設定し、その値が異なる場合を除いて <p> 要素から省略できる。

この手法を使用する場合、特に台本タイプ間を移動する場合には注意すべきである。ルート要素でこれを変更すると、子孫要素の解釈に予期せず影響する可能性があるからである。細かな制御を可能にするツールでは、作成者はすべての <p> 要素上にdaptm:langSrc 属性を明示的に設定することで、このリスクを軽減できる。

実装者は、要素上のdaptm:langSrc 属性を変更する場合、ツリーを下方向に確認し、適切であれば子孫要素上にその属性を指定して、それらの意味が意図せず変化しないよう注意すべきである。

注記

固有の言語を持たないコンテンツを表すには、たとえば画像内テキストが書き起こされない原文の音声解説の場合、値 zxx を使用できる。

その音声解説が後で翻訳される場合、その翻訳は、daptm:langSrc を原文の xml:lang に設定することになる。
daptm:langSrc の算出値は、空文字列または und であるべきでは SHOULD NOT ない。

注記

daptm:langSrc 属性をまったく指定しない文書は、既定値として空文字列を持ち、これはテキストによって表されるコンテンツの言語が判定されていないことを意味する。
<p> 要素は、テキストオブジェクトの言語に対応する xml:lang 属性を持つべき SHOULD である。

注記

<p> 要素が xml:lang 属性を省略した場合、その算出言語は親要素からの継承によって導かれ、それはルート <tt> 要素まで続く。このルート要素は、その xml:lang 属性を介して既定言語を設定することが要求される。

DAPTスクリプトの既定言語を変更する場合には、そうすることで子孫要素に予期せず影響する可能性があるため、注意すべきである。細かな制御を可能にするツールでは、作成者はすべての <p> 要素上に xml:lang 属性を明示的に設定することで、このリスクを軽減できる。

実装者は、要素上の xml:lang 属性を変更する場合、ツリーを下方向に確認し、適切であれば子孫要素上にその属性を指定して、それらの意味が意図せず変化しないよう注意すべきである。
例 23
```
<div xml:id="event_3"
     begin="9663f" end="9682f"
     ttm:agent="character_3">
  <p xml:lang="pt-BR">Você vai ter.</p>
  <p xml:lang="fr" daptm:langSrc="pt-BR">Bah, il arrive.</p>
</div>
```
注記

場合によっては、未翻訳の対話の単一セクションに、複数の言語のテキストが含まれることがある。これに対処するためにスクリプトイベントを複数のスクリプトイベントに分割するのではなく、 1 つの言語のテキストオブジェクトに、別の言語の語句を含めることもできる。これはDAPT文書内で、内側の <span> 要素上に xml:lang および daptm:langSrc 属性を設定することによって表現される。

注記

<span> 要素は、関連するテキスト部分の音声レンダリングのタイミングを示すため、例 10に示すように、特定のタイミングを追加するために使用できる。[TTML2] に従い、 <span> 要素のタイミングは、親要素の算出開始時刻に対する相対値である。
daptm:represents 属性は、 <p> 要素またはその任意の子孫 <span> 要素上に存在しても MAY よく、表す対象プロパティを表す。
これは、各音声録音オブジェクトを表す 0 個以上の <audio> 要素を含んでもMAYよい。
これは、各ミックス指示オブジェクトを表す 0 個以上の <animate> 要素を含んでもMAYよい。

テキスト言語ソースプロパティは、該当する場合にはテキストオブジェクトのソース言語を示し、またはソースコンテンツが固有の言語を持たなかったことを示す注釈である。

それが空である場合、テキストは、視覚シーンの未翻訳の説明や非対話音を表すキャプションなど、固有の言語を持たないコンテンツを表す。
空文字列、und または zxx など、言語を表さない値を持つ場合、テキストは原文である。

注記

固有の言語がまだ判定されていないコンテンツを表すには、値 und の代わりに空文字列を使用すべきである。

注記

値 zxx は、視覚シーンの未翻訳の説明や非対話音を表すキャプションなど、固有の言語を持たないコンテンツを表す。 [bcp47] は、その使用を次のように説明している。

「zxx」（非言語、該当なし）一次言語サブタグは、言語分類が不適切である、または適用されないコンテンツを識別する。例としては、器楽または電子音楽、非言語音から成る録音、ナレーション、対話、印刷された題名、字幕を持たない視聴覚資料、機械語または文字コードから成る機械可読データファイル、またはプログラムのソースコードなどがある。
それ以外の場合（言語を表す値を持つ場合）:
- その値がテキストオブジェクトの言語と同じである場合、テキストは原文である。
- それ以外の場合（その値がテキストの言語と異なる場合）、テキストは翻訳であり、そのソース言語はテキスト言語ソースプロパティの値である。

テキスト言語ソースは継承可能なプロパティである。

テキスト言語ソースプロパティは、DAPT文書内では、次の構文、制約および意味論を持つ daptm:langSrc 属性によって表現される。

daptm:langSrc
: <empty-string> | <language-identifier>

<empty-string>
: ""                    # default

<language-identifier>   # well-formed BCP-47 language tag

値は、[BCP47] で定義される空文字列または整形式の言語識別子で MUST ある。
これは <p> および <span> 要素に適用される。
これは、以下の要素上に指定されても MAY よい。 <tt>, <body>, <div>, <p> and <span>.
daptm:langSrc 属性の継承モデルは次のとおりである。
- それが要素上に存在する場合、算出値は指定値である。
- それ以外の場合（要素上に存在しない場合）、その要素上の属性の算出値は、その要素の親における同じ属性の算出値であり、または要素に親がない場合は既定値である。
注記

daptm:langSrc 属性の継承モデルは、 xml:lang 属性 [XML] の継承モデルに合わせることを意図している。
算出値の意味論は次のとおりである。
- 算出値が言語的コンテンツを表さない値である場合、それはテキストが原文であることを示す。このカテゴリの値の例は次のとおりである。
  - 言語が判定されていないコンテンツ用の空文字列。
  - 固有の言語を持たないコンテンツ用の zxx。
- それ以外の場合、算出値が言語的コンテンツを表す場合は、次のとおりである。
  - 算出値が xml:lang 属性の算出値と同じである場合、それはテキストが原文であり、固有の言語を持つコンテンツをソースとしていることを示す。
  - それ以外の場合（算出値が xml:lang 属性の算出値と異なる場合）、それはテキストが翻訳であり、算出値がテキストが翻訳された元の言語であることを示す。

注記

文書内でのテキスト言語ソースの使用例は、テキストセクションにある。

例 24

異なる原文トランスクリプトソースとそれらの固有言語に対する `xml:lang` および `daptm:langSrc` 属性の例示値を列挙する表。
トランスクリプトソース	トランスクリプトソースの固有言語	`xml:lang`	`daptm:langSrc`
画像内テキスト	英語	`en`	`en`
映像画像（非テキスト）	なし	`en`	`zxx`
効果音	なし	`en`	`zxx`
対話	アラビア語	`ar`	`ar`

これらのトランスクリプトのいずれかが翻訳された場合、結果のテキストは、そのdaptm:langSrc 属性をソースの xml:lang 属性の算出値に設定することになる。

たとえば、アラビア語の対話が日本語に翻訳された場合、その結果は xml:lang="ja" および daptm:langSrc="ar" になる。

画面上プロパティは、スクリプトイベントの対象に関連するシーン内の位置を示す注釈であり、たとえば発話しているキャラクターの位置を示す:

ON - スクリプトイベントの対象が全継続時間にわたって画面上にいる
OFF - スクリプトイベントの対象が全継続時間にわたって画面外にいる
ON_OFF - スクリプトイベントの対象は画面上で始まるが、ある時点で画面外へ出る
OFF_ON - スクリプトイベントの対象は画面外で始まるが、ある時点で画面上へ入る

省略された場合、既定値は「ON」である。

注記

daptm:represents属性値が visualで始まる場合、各スクリプトイベントの対象、すなわち記述されているものは、映像画像内にあることが期待される。したがって、既定値「ON」により、そのような場合に意味を歪めることなくこのプロパティを省略できる。

画面上プロパティは、DAPT文書では、次の制約を持つ、<div>要素上の daptm:onScreen属性によって表される:

画面上スクリプトイベントプロパティに対応する次の属性が存在してよい:
```
daptm:onScreen
  : "ON"     # default
  | "OFF"
  | "ON_OFF"
  | "OFF_ON"
```

表すものプロパティは、関連メディアオブジェクトのどの構成要素を、スクリプトイベントまたはテキスト（またはその一部）が表すかを示す。

表すものプロパティは、DAPT文書では daptm:represents属性によって表され、その値は単一の <content-descriptor> でなければならない。

daptm:represents属性は、次のいずれの要素上にも存在してよい: <tt>、 <body>、 <div>、 <p>および <span>。

表すものプロパティは継承可能である。それが要素に存在しない場合、その算出値は親要素上の表すものプロパティの算出値であり、親要素がない場合は空文字列である。要素上に存在する場合、その算出値は指定された値である。

注記

空の <content-descriptor> は存在しないため、これは、空の算出表すものプロパティが決して有効になり得ないことを意味する。有効なDAPT文書を構築する1つの方法は、 DAPTスクリプト上に表すものプロパティを指定し、表すものプロパティを持たないすべての子孫へ継承させることである。

表すものプロパティ値が、スクリプトが表すものプロパティ内の値の少なくとも1つのコンテンツ記述子サブタイプでないことはエラーである。

スクリプトイベント記述オブジェクトは、スクリプトイベントの内容の何らかの側面について、人間可読な記述を提供する注釈である。スクリプトイベント記述は、それ自体を記述種別で分類できる。

スクリプトイベント記述オブジェクトは、 DAPT文書では、 <div>要素レベルの<ttm:desc>要素によって表される。

0個以上の<ttm:desc>要素が存在してよい。

スクリプトイベント記述は空であるべきではない。

注記

スクリプトイベント記述は一意である必要はない。すなわち、各スクリプトイベントごとに異なる値を持つ必要はない。たとえば、特定の値を再利用して、一緒に処理されることが意図された1つ以上のスクリプトイベントを人間可読な方法で識別できる。たとえば一括録音の場合である。

<ttm:desc>要素は、 xml:lang属性を使用してその言語を指定してよい。

注記

xml:lang属性がない場合、スクリプトイベント記述の言語は、親スクリプトイベントオブジェクトから継承される。

例 25

...
  <body daptm:langSrc="zxx">
    <div begin="10s" end="13s" xml:id="a1">
      <ttm:desc>Scene 1</ttm:desc>
      <p xml:lang="en">
        <span>A woman climbs into a small sailing boat.</span>
      </p>
      <p xml:lang="fr" daptm:langSrc="en">
        <span>Une femme monte à bord d'un petit bateau à voile.</span>
      </p>
    </div>
    <div begin="18s" end="20s" xml:id="a2">
      <ttm:desc>Scene 1</ttm:desc>
      <p xml:lang="en">
        <span>The woman pulls the tiller and the boat turns.</span>
      </p>
      <p xml:lang="fr" daptm:langSrc="en">
        <span>La femme tire sur la barre et le bateau tourne.</span>
      </p>
    </div>
  </body>
...

各スクリプトイベント記述には、スクリプトイベント記述の目的をさらに分類するために、1つ以上の記述種別で注釈を付けることができる。

各記述種別は、DAPT文書では、 <ttm:desc>要素上のdaptm:descType属性によって表される。

<ttm:desc>要素は、0個または1個の daptm:descType属性を持ってよい。 daptm:descType属性は以下で定義される。

daptm:descType : string

daptm:descTypeに許可される値は、次のレジストリ表に列挙されたもの、またはユーザー定義のもののいずれかである:

レジストリ表： `daptm:descType` 属性用。そのレジストリ定義は H.2.1 `daptm:descType` レジストリ表定義にある
`daptm:descType`	状態	説明	注記
`pronunciationNote`	暫定	コンテンツをどのように発音するかについての注記。
`scene`	暫定	シーン識別子を含む。
`plotSignificance`	暫定	コンテンツが筋書きに対してどれほど重要であるかの尺度を定義する。	内容は未定義であり、低・中・高、または数値スケールであってよい。

注記

レジストリ項目は、バージョン管理システム内の /registries/descType.json に JSON 形式で提供されている。

有効なユーザー定義値は、x-で始まらなければならない。

例 26

...
  <body>
    <div begin="10s" end="13s" xml:id="a123">
      <ttm:desc daptm:descType="pronunciationNote">[oːnʲ]</ttm:desc>
      <p>Eóin looks around at the other assembly members.</p>
    </div>
  </body>
...

<ttm:desc>要素の兄弟グループ内では、 daptm:descType属性の一意性に関する制約はない。ただし、次の例に示すように、区別子として有用な場合がある。

例 27

...
  <body daptm:langSrc="zxx">
    <div begin="10s" end="13s" xml:id="a1">
      <ttm:desc daptm:descType="scene">Scene 1</ttm:desc>
      <ttm:desc daptm:descType="plotSignificance">High</ttm:desc>
      <p xml:lang="en">
        <span>A woman climbs into a small sailing boat.</span>
      </p>
      <p xml:lang="fr" daptm:langSrc="en">
        <span>Une femme monte à bord d'un petit bateau à voile.</span>
      </p>
    </div>
    <div begin="18s" end="20s" xml:id="a2">
      <ttm:desc daptm:descType="scene">Scene 1</ttm:desc>
      <ttm:desc daptm:descType="plotSignificance">Low</ttm:desc>
      <p xml:lang="en">
        <span>The woman pulls the tiller and the boat turns.</span>
      </p>
      <p xml:lang="fr" daptm:langSrc="en">
        <span>La femme tire sur la barre et le bateau tourne.</span>
      </p>
    </div>
  </body>
...

音声オブジェクトは、テキストの音声レンダリングを指定するために使用される。音声レンダリングは、録音済み音声リソースである音声録音オブジェクトである場合も、テキスト読み上げエンジンを介してテキストのレンダリングを合成する指令である合成音声オブジェクトである場合もある。どちらも音声オブジェクトの種別である。

音声がそのテキストと同じ言語でないことはエラーである。

音声をサポートするプレゼンテーションプロセッサは、音声を関連メディアオブジェクトのタイムライン上の指定時刻で再生または挿入する。

注記

音声オブジェクトは「抽象的」である。すなわち、そのサブタイプである音声録音または合成音声のいずれかとしてのみ存在できる。

音声録音とは、音声リソースを参照する音声オブジェクトである。これは次のプロパティを持つ:

1つ以上の代替ソース。各々は、 1) 外部音声リソースへのリンクまたは 2) 埋め込み音声録音のいずれかである。
各ソースについて、音声リソースの型（[MIME-TYPES]）、たとえばaudio/basicを指定する、必須の型が1つ。
任意の開始プロパティ、任意の終了プロパティ、および任意の継続時間プロパティ。これらは共に、親要素の時間間隔に関連して、番組タイムライン内における音声録音の時間間隔を定義する。
音声リソースの時間的な一部分を共に定義する、任意のイン時刻および任意のアウト時刻プロパティ。
既定のイン時刻は音声リソースの開始である。

既定のアウト時刻は音声リソースの終端である。

音声リソースの時間的な一部分が、音声録音の時間間隔の継続時間より長い場合、再生は、音声録音の時間間隔が終了した時点で終了するように切り詰められなければならない。

注記

「拡張解説」（[media-accessibility-reqs] で「拡張映像解説」として知られるもの）は、関連メディア内に割り当てられた時間より長い。拡張解説をサポートするプレゼンテーションプロセッサは、音声リソースの有効再生速度を関連メディアオブジェクトの再生速度と異ならせることを許可できる。それにより、結果として得られる間隔が、音声リソースの時間的な一部分を収容するのに十分な長さの継続時間を持つようにできる。たとえば、音声リソースの再生を継続しながら関連メディアオブジェクトの再生を一時停止または低速化することもでき、または音声リソースの再生を高速化して、音声録音の時間間隔が、音声リソースの時間的な一部分より前に終了しないようにすることもできる。この挙動は現在未指定であり、したがって実装定義である。

音声リソースの時間的な一部分が、音声録音の時間間隔の継続時間より短い場合、音声リソースは1回再生される。
音声録音の再生特性を変更する、 0個以上のミキシング指示。

ソースのリストが提供される場合、プレゼンテーションプロセッサは、各音声録音について、ソースの 1つ以下を再生しなければならない。

この機能はブラウザのフィンガープリント可能性に寄与する可能性がある。実装は、型、および存在する場合は関連する追加の形式情報を使用して、どのソースを再生するかを決定できる。たとえば、2つのソースが与えられ、一方がWAVファイルで、もう一方がMP3である場合、それらの形式のうち1つしか再生できない実装、またはいずれか一方への選好を持つように構成された実装は、再生可能または選好されたバージョンを選択することになる。

音声録音は、DAPT文書において、それが適用されるテキストに対応する<p>要素または <span>要素の子である <audio> 要素によって表される。 <audio>要素には次の制約が適用される:

begin、endおよびdur属性は、それぞれ開始、終了および継続時間プロパティを表す。
clipBeginおよびclipEnd属性は、例 5で示されるように、それぞれイン時刻およびアウト時刻プロパティを表す。
各ソースについて、それが外部音声リソースへのリンクである場合、ソースおよび型プロパティは、正確に次のいずれか1つによって表される:
1. フラグメント識別子ではないsrc属性、およびそれぞれtype属性。
  この仕組みは、複数のソースが存在する場合には使用できない。
  例 28
```
<audio src="https://example.com/audio.wav" type="audio/wave"/>
```
2. フラグメント識別子ではないsrc属性、およびそれぞれtype属性を持つ、 <source>子要素。
  例 29
```
<audio>
  <source src="https://example.com/audio.wav" type="audio/wave"/>
  <source src="https://example.com/audio.aac" type="audio/aac"/>
</audio>
```
フラグメント識別子ではないsrc属性は、外部音声リソース、すなわち DAPTスクリプト内に埋め込まれていない音声リソースを参照するURLである。そのリソースを所在確認できることの検証は、DAPTでは指定されない。

編集者注記

ここで両方の仕組みが必要か？この場合、子<source>要素がどのような意味上の利点を持つのかは明確でない。その子<source>要素の使用を「at risk」としてマークすることを検討するか？
Issue 113: `@src`と `<audio>`の`<source>`子（外部リソース）の両方をサポートするか？ question CR-exit-must-have
```
          While working on the specification for adding audio recordings I reminded myself of the various ways in which an audio recording can be embedded and referenced, of which there are at least 5 in total. Requirement R15 of [DAPT](https://www.w3.org/TR/dapt-reqs/#requirements) is clear that both referenced and embedded options need to be available, but should we be syntactically restricting the options for each? Will raise as separate issues.
```
もともと@nigelmegittにより#105 （コメント）に投稿されたもの

TTML2では、外部音声リソースを参照するための次の2つの選択肢が存在する:
1. <audio>要素内のsrc属性。
```
<audio src="https://example.com/audio_recording.wav" type="audio/wave"/>
```
1. <audio>要素の子である<source>要素。
```
<audio>
    <source src="https://example.com/audio_recording.wav" type="audio/wave"/>
</audio>
```
この2番目の選択肢には、typeが不十分な場合にformat属性を指定する追加の可能性がある。また、複数の <source>子要素を許可し、この場合、実装は1つ以下を選択しなければならないと指定している。

[Issueが開かれた後に追加された「1つ以下を再生する」という制約を反映するため、 2023-03-29に編集]
Issue 218: At-risk: 外部リソース向けの `<audio>`における`src`属性のサポート CR-exit-must-have At risk feature

#113に対する可能な解決。

Issue 219: At-risk: 外部リソース向けの `<audio>`の`<source>`子要素のサポート CR-exit-must-have At risk feature

#113に対する可能な解決。
各ソースについて、それが埋め込み音声リソースである場合、ソースおよび型プロパティは、正確に次のいずれか1つによって一緒に表される:
1. <audio>要素を参照するフラグメント識別子であるsrc属性。ここで、参照される要素は/tt/head/resourcesの子であり、 type属性およびそれを参照するために使用される xml:id属性を指定する。
  この仕組みは、複数のソースが存在する場合には使用できない。
  例 30
```
<tt>
  <head>
    <resources>
      <audio type="audio/wave" xml:id="audio1">
        <source><data>[base64-encoded WAV audio resource]</data></source>
      </audio>
    </resources>
  </head>
  <body>
    ..
    <audio src="#audio1"/>
    ..
  </body>
</tt>
```
2. <source>子要素。これは、<data>要素を参照するフラグメント識別子であるsrc属性を持つ。ここで、参照される要素は/tt/head/resourcesの子であり、 type属性およびそれを参照するために使用される xml:id属性を指定する。
  例 31
```
<tt>
  <head>
    <resources>
      <data type="audio/wave" xml:id="audio1wav">
        [base64-encoded WAV audio resource]
      </data>
      <data type="audio/mpeg" xml:id="audio1mp3">
        [base64-encoded MP3 audio resource]
      </data>
    </resources>
  </head>
  <body>
    ..
    <audio>
      <source src="#audio1wav"/>
      <source src="#audio1mp3"/>
    </audio>
    ..
  </body>
</tt>
```
3. type属性を指定し、音声録音データを含む <data>要素の子を持つ <source>子要素。
  例 32
```
<audio>
  <source>
    <data type="audio/wave">
        [base64-encoded WAV audio resource]
    </data>
  </source>
</audio>
```
上記の各場合において、type属性は型プロパティを表す。

フラグメント識別子であるsrc属性は、DAPTスクリプト内に埋め込まれた音声リソースへのポインタである。

<data>要素が定義される場合、それぞれは #PCDATAまたは <chunk>子要素のいずれかを含まなければならず、いかなる<source>子要素も含んではならない。

<data>要素および<source>要素は、 format属性を含んでよい。その値は、適切な音声リソースを選択する際に、実装がtype属性値に加えて使用してよい。

編集者注記

ここで3つの仕組みすべてが必要か？いずれかが必要か？埋め込み音声データにはユースケースがあるかもしれない。それにより、単一の文書が、リソース欠落を心配することなく交換および転送できる、可搬な（ただし大きな）エンティティとなり、たとえばマニフェストファイルも不要になるためである。参照される埋め込み音声をサポートする必要がない場合、最後の選択肢だけが必要であり、おそらく実装するのが最も単純である。参照される埋め込み音声を支持する1つの理由は、同じ音声を文書内の異なる場所でより容易に再利用できることである。ただし、このユースケースではそのような要件はありそうにない。もう1つは、すべての埋め込み音声が文書内のtt/head/resourcesという見つけやすい部分にあることを意味し、実装上の利点をもたらす可能性があることか？埋め込みデータ機能を「at risk」としてマークすることを検討するか？
Issue 114: `@src`と `<audio>`の`<source>`子（埋め込みリソース）の両方をサポートするか？ question CR-exit-must-have
```
          While working on the specification for adding audio recordings I reminded myself of the various ways in which an audio recording can be embedded and referenced, of which there are at least 5 in total. Requirement R15 of [DAPT](https://www.w3.org/TR/dapt-reqs/#requirements) is clear that both referenced and embedded options need to be available, but should we be syntactically restricting the options for each? Will raise as separate issues.
```
もともと@nigelmegittにより#105 （コメント）に投稿されたもの

いくつかの埋め込み音声リソースが与えられる場合:
```
<head>
  <resources>
    <audio xml:id="audioRecording1" type="audio/wave">
      <source>
        <data>[base64 encoded audio data]</data>
      </source>
    </audio>
    <data xml:id="audioRecording2" type="audio/wave">
      [base64 encoded audio data]
    </data>
  </resources>
</head>
```
TTML2では、埋め込み音声リソースを参照するための次の2つの選択肢が存在する:
1. 埋め込み<audio>または<data>を参照する、<audio>要素内のsrc属性:
```
<audio src="#audioRecording1"/>
...
<audio src="#audioRecording2"/>
```
1. <audio>要素の子である<source>要素。
```
<audio>
    <source src="#audioRecording1"/>
</audio>
```
この2番目の選択肢には、typeが不十分な場合にformat属性を指定する追加の可能性がある。また、複数の <source>子要素を許可する。ただし、複数のリソースが指定された場合に意図される意味が何であるかは不明である――おそらく実装が何らかの方法で1つを選ぶ。
Issue 115: 参照される埋め込み音声録音とインライン埋め込み音声録音の両方をサポートするか？ question CR-exit-must-have
```
          While working on the specification for adding audio recordings I reminded myself of the various ways in which an audio recording can be embedded and referenced, of which there are at least 5 in total. Requirement R15 of [DAPT](https://www.w3.org/TR/dapt-reqs/#requirements) is clear that both referenced and embedded options need to be available, but should we be syntactically restricting the options for each? Will raise as separate issues.
```
もともと@nigelmegittにより#105 （コメント）に投稿されたもの

埋め込み音声リソースをサポートするなら、それらは /tt/head/resources内で定義してから参照することも、データをインラインで含めることもできる。

両方の選択肢が必要か？

埋め込みの例:
```
<head>
  <resources>
    <audio xml:id="audioRecording1" type="audio/wave">
      <source>
        <data>[base64 encoded audio data]</data>
      </source>
    </audio>
    <data xml:id="audioRecording2" type="audio/wave">
      [base64 encoded audio data]
    </data>
  </resources>
</head>
```
これは、bodyコンテンツ内で次のようなものを使用して参照されることになる（#114も参照）:
```
<audio src="#audioRecording2"/>
```
インラインの例:
```
<audio type="audio/wave">
  <source type="audio/wave">
    <data>[base64 encoded audio data]</data>
  </source>
</audio>
```
Issue 220: At-risk: 埋め込みリソースを指す `<audio>` 要素の `src` 属性のサポート CR-exit-must-have At risk feature

#114 および #115 に対する可能な解決策。

#115 への関連は、これが参照可能な埋め込み音声リソースの存在も意味することであり、それは #115 で説明されている選択肢の 1 つである。

Issue 221: At-risk: 埋め込みリソースを指す `<audio>` 要素の子である `<source>` のサポート CR-exit-must-have At risk feature

#114 および #115 に対する可能な解決策。

#115 への関連は、これが参照可能な埋め込み音声リソースの存在も意味することであり、それは #115 で説明されている選択肢の 1 つである。

Issue 222: At-risk: インライン音声リソースのサポート CR-exit-must-have At risk feature

#115 に対する可能な解決策。

Issue 116: インライン化されていない埋め込み音声リソースをデータモデルに追加するか？ question CR-exit-must-have

#115 も参照。インラインではない埋め込み音声リソースをサポートするのであれば、それらのためのオブジェクトを作成し、データモデルに追加すべきか？
Issue 117: 埋め込みデータ: 許可されたすべてのエンコーディングをサポートする必要があるか？ length はどうか？ question CR-exit-must-have

TTML2 の <data> 要素では、encoding を指定でき、それは以下のいずれかである。
- base16
- base32
- base32hex
- base64
- base64url
それらすべてについてプロセッサのサポートを要求する必要があるか、それとも既定の base64 で十分か？

また、デコードされたデータは指定されたバイト長でなければならないため、エラーチェックの一定の実現可能性を提供する length 属性を指定できる。このサポートを要求することは正味の利点になるか？使用されるか？
Issue 223: At-risk: `<data>` における `encoding` の潜在的な各値 CR-exit-must-have At risk feature

#117 に対する可能な解決策。

Issue 224: At-risk: `<data>` 上の `length` 属性のサポート CR-exit-must-have At risk feature

#117 に対する可能な解決策。
ミキシング指示は、それらの TTML 表現で指定されるように適用してよい。
xml:lang属性の算出値は、親要素、および任意の子<source>要素、ならびに参照される任意の埋め込み<data>要素のxml:lang属性の算出値と同一でなければならない。

合成音声とは、親テキスト内容の機械生成された音声レンダリングを表す音声オブジェクトである。これは次のプロパティを持つ:

発話速度を指定する必須の速度。値はnormal、 fastまたは slowである。
発話のピッチ調整を可能にする任意のピッチ。

合成音声は、DAPT文書において、発話されるテキストオブジェクトを表す要素上に tta:speak スタイル属性を適用することによって表され、その属性の算出値は normal、fastまたはslowである。この属性は速度プロパティも表す。

tta:pitch スタイル属性はピッチプロパティを表す。

合成音声のTTML表現は、例 7で示される。

注記

tta:rate属性の算出値がnoneである要素上の tta:pitch属性は効果を持たない。そのような要素は、関連付けられた合成音声を持つとは見なされない。

注記

DAPTの合成音声語彙の意味論は、 [TTML2] で示されるように、 [SSML] の同等の機能から派生している。このバージョンの仕様は、[SSML] の他の機能を DAPTから生成する方法、または DAPT文書へ埋め込む方法を指定しない。この仕様の将来バージョンで[SSML] サポートを拡張する選択肢は、意図的に開かれたままである。

ミキシング指示オブジェクトは、包含するオブジェクトに関連する音声の、静的またはアニメーション化された調整である。これは次のプロパティを持つ:

0個以上のゲインプロパティ。ゲインは、関連する音声に適用される乗数として機能する。
0個以上のパンプロパティ。パンは立体（左／右）位置を調整する。
任意の開始、任意の終了、および任意の継続時間プロパティ。これらは共に、ミキシング指示が適用される時間間隔を定義する。
任意のフィルプロパティ。これは、アニメーション化されたミキシング指示の終了時刻に、指定されたゲインおよびパンプロパティを保持する（freeze）か、元に戻す（remove）かを指定する。

ミキシング指示は、関連するオブジェクトに対応する要素に、インラインで、<style>要素への参照によって、または子（インライン）の <animate>要素内で、音声スタイル属性を適用することによって表される:

tta:gain 属性はゲインプロパティを表す。
tta:pan 属性はパンプロパティを表す。

ミキシング指示がアニメーション化されている場合、すなわち、調整プロパティが包含するオブジェクトのアクティブ時間間隔中に変化する場合、それは1つ以上の子<animate>要素によって表される。この表現は、複数のゲインまたはパンプロパティが必要な場合、またはいずれかのタイミングプロパティが必要な場合に必須である。

<animate> 要素は、包含するオブジェクトに対応する要素の子でなければならず、次の制約を持つ:

begin、endおよびdur属性は、それぞれ開始、終了および継続時間プロパティを表す。
fill属性はフィルプロパティを表す。
tta:gain 属性はゲインプロパティを表し、アニメーション期間中に適用される値のリストを表現するために animation-value-list 構文を使用する。
tta:pan 属性はパンプロパティを表し、アニメーション期間中に適用される値のリストを表現するために animation-value-list 構文を使用する。

アニメーション化されたミキシング指示のTTML表現は、例 4で示される。

E. 音声ミキシングも参照。

DAPT文書は、[xml] の整形式XML 1.0文書として直列化されなければならず、 [UNICODE] で指定される UTF-8文字エンコーディングを使用して符号化される。

結果として得られる [xml] 文書は、次の物理構造のいずれも含んではならない:

実体宣言。および
事前定義済み実体への参照以外の実体参照。

注記

結果として得られる [xml] 文書は、文字参照、および実体参照を事前定義済み実体に対して含むことができる。

事前定義済み実体は次のとおりである（先頭のアンパサンドと末尾のセミコロンを含む）:

& はアンパサンド &（Unicodeコードポイント U+0026）を表す
' はアポストロフィ '（Unicodeコードポイント U+0027）を表す
> は大なり記号 >（Unicodeコードポイント U+003E）を表す
< は小なり記号 <（Unicodeコードポイント U+003C）を表す
" は引用符 "（Unicodeコードポイント U+0022）を表す

注記

DAPT文書は、処理用のインメモリモデルとしても使用できる。この場合、直列化要件は適用されない。

この節の要件は、前方互換性および後方互換性を容易にすることを意図しており、具体的には次を許可する:

仕様のあるバージョンを対象とするDAPTプロセッサが、将来のバージョンで定義される語彙または意味論を含む DAPT文書を、後続機能をサポートしないものの処理できるようにすること。
仕様のあるバージョンを対象とするDAPTプロセッサが、より以前のバージョン向けに作成されたDAPT文書を、その以前のバージョンを対象とするDAPTプロセッサと類似または同一の挙動で処理できるようにすること。

仕様の複数のバージョンに適合するDAPT文書は、複数のDAPTコンテンツプロファイルへの適合を指定できる。

認識されない語彙とは、プロセッサがサポートする機能に関連付けられていない要素および属性の集合である。

変換プロセッサは、属性でも<metadata>要素の子孫でもない認識されない語彙を刈り込まなければならない。

変換プロセッサは、属性または<metadata>要素の子孫のいずれかである認識されない語彙を保持すべきである。

注記

5.6.2 ttp:contentProfilesも参照。これは、変換プロセッサがサポートしないプロファイルへのプロファイル適合のシグナルを禁止している。

属性値の算出の後、プレゼンテーションプロセッサは、認識されない語彙を無視すべきである。

注記

上記の制約が属性値の算出後として指定されているのは、実装が、たとえばDAPTデータモデルに対応するものなど、特定の要素上にのみ存在する属性を認識しサポートする可能性があるためである。 6.4 算出属性値の使用で説明されるように、プロセッサ実装が、そのような属性が他の要素上に存在する場合に無視しないことが重要である。

外来語彙とは、認識されない語彙の部分集合であり、その名前空間が5.3 名前空間に列挙されている名前空間のいずれでもない要素および属性、ならびに名前空間に値を持たず、DAPTまたは [TTML2] で別途定義されていない属性から成る。

DAPT文書は、 ttp:contentProfilesでシグナルされるプロファイルによって特に許可も禁止もされていない外来語彙を含んでよい。

注記

検証目的では、DAPT文書内で使用されるすべての外来語彙について、たとえばコンテンツプロファイルなどの仕様を定義し使用することが良い実践である。

多くの吹替および音声解説ワークフローでは、スクリプトイベントまたは文書に独自メタデータで注釈を付けることを許可している。この仕様または [TTML2] で定義されるメタデータ語彙を含んでよい。外来語彙も、 <metadata>要素の属性として、または <metadata>要素の子孫要素として含んでよい。

注記

[TTML2] の構成要素を使用して、番組のタイトルなどの情報を追加することが可能である。

例 33

...
  <head>
    <metadata>
      <ttm:title>A example document title</ttm:title>
    </metadata>
  </head>
...

注記

外来名前空間を使用して、ワークフロー固有の情報を追加することが可能である。次の例では、「example vendor」からの架空の名前空間vendormを使用して、 DAPTで定義されていない文書レベルの情報を提供している。

例 34

...
  <metadata xmlns:vendorm="http://www.example-vendor.com/ns/ttml#metadata">
    <vendorm:programType>Episode</vendorm:programType>
    <vendorm:episodeSeason>5</vendorm:episodeSeason>
    <vendorm:episodeNumber>8</vendorm:episodeNumber>
    <vendorm:internalId>15734</vendorm:internalId>
    <vendorm:information>Some proprietary information</vendorm:information>
  </metadata>
...

意味論が文書の内容に依存するデータを <metadata>要素内に配置しないことが強く推奨される。

そのようなデータは、文書の内容を変更する一方でメタデータを保持し、その意味論を認識していない変換プロセッサによって無効化される可能性がある。

この節は非規範的である。

外来語彙が<metadata>要素以外の場所に含まれている場合、 5.2.1 認識されない語彙で要求されるように、その語彙に関連付けられた機能をサポートしない変換プロセッサによって刈り込まれる。

そのような刈り込みを防ぎ、そのような外来語彙の意味論を定義する仕組みが提供される。これにより、それを<metadata>要素の外側に配置しても刈り込まれないようにし、コンテンツおよびプロセッサの適合を示すことができる:

その意味論および語彙の機能定義を含むプロファイルを、プロファイル指定子付きで定義する。
5.6.2 ttp:contentProfilesを使用して、そのプロファイルへの文書適合をシグナルする。

これにより、その機能をサポートするプロセッサは、その語彙を適切な任意の方法で処理し、刈り込みを避けることができる。また、その機能をサポートしないプロセッサは、たとえば一部の機能が失われる可能性があることをユーザーに警告するなど、適切な措置を講じることができる。

この仕様では、次の名前空間（[xml-names] を参照）が使用される:

名前	接頭辞	値	定義仕様
XML	`xml`	`http://www.w3.org/XML/1998/namespace`	[xml-names]
TT	`tt`	`http://www.w3.org/ns/ttml`	[TTML2]
TTパラメータ	`ttp`	`http://www.w3.org/ns/ttml#parameter`	[TTML2]
TT音声スタイル	`tta`	`http://www.w3.org/ns/ttml#audio`	[TTML2]
TTメタデータ	`ttm`	`http://www.w3.org/ns/ttml#metadata`	[TTML2]
TT機能	なし	`http://www.w3.org/ns/ttml/feature/`	[TTML2]
DAPTメタデータ	`daptm`	`http://www.w3.org/ns/ttml/profile/dapt#metadata`	この仕様
DAPT拡張	なし	`http://www.w3.org/ns/ttml/profile/dapt/extension/`	この仕様
EBU-TTメタデータ	`ebuttm`	`urn:ebu:tt:metadata`	[EBU-TT-3390]

上で定義された名前空間接頭辞値は便宜上のものであり、DAPT文書は、[xml-names] に適合する任意の接頭辞値を使用してよい。

この仕様で定義される名前空間は、[namespaceState] で説明されるように可変であり、これらの名前空間内の未定義のすべての名前は、W3Cによる将来の標準化のために予約される。

DAPT内では、一般的な言語用語である audioおよびvideoは番組の文脈で使用される。音声および映像はそれぞれ、[TTML2] で関連メディアオブジェクトとして定義されるものの一部である。これはメディアタイムラインを提供し、主番組音声のソースであり、リップシンクなど、映像画像に関連するタイミングを調整する際に必要な視覚的タイミング参照も提供する。

注記

DAPT文書は、関連メディアオブジェクトとして機能する番組を、メタデータを使用して識別できる。たとえば、[EBU-TT-3390] で定義される <ebuttm:sourceMediaIdentifier>要素を使用することが可能である。

例 35

<tt xmlns="http://www.w3.org/ns/ttml" 
    xmlns:ttp="http://www.w3.org/ns/ttml#parameter"
    xmlns:daptm="http://www.w3.org/ns/ttml/profile/dapt#metadata"
    xmlns:ebuttm="urn:ebu:tt:metadata"
    xml:lang="en" 
    ttp:contentProfiles="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
    daptm:scriptRepresents="audio.dialogue"
    daptm:scriptType="originalTranscript">
  <head>
    <metadata>
      <ebuttm:sourceMediaIdentifier>https://example.org/programme.mov</ebuttm:sourceMediaIdentifier>
    </metadata>
  </head>
  <body>
    ...
  </body>
</tt>

DAPT 文書が [ttml-imsc1.3] 文書を生成するための基礎として使用されることを意図している場合、 [ttml-imsc1.3] の同期規定が映像との関係で適用される。

DAPT 文書内の時間指定コンテンツは、特定の音声サンプル上で開始および終了するようにレンダリングされることを意図している。

注記

この仕様の文脈では、レンダリングとは、たとえば俳優に話すべき言葉を示すためのテキストの視覚的提示である場合もあれば、音声リソースの可聴再生である場合もあり、また点字ディスプレイのような物理的または触覚的なものである場合もある。

リアルタイム音声ミックスおよび再生などの制約のあるアプリケーションでは、レンダリングされた出力において音声サンプルへの正確な同期を達成できない場合、提示における時間指定された変更について、作成時および再生時の不正確さを合わせた影響は [EBU-R37] の同期要件を満たすべきである SHOULD。すなわち、音声の変更は画像の変更より 40ms を超えて先行してはならず、また 60ms を超えて遅れてはならない。

同様に、作成アプリケーションは、映像画像に関連付けられた任意の変更の後 15ms 未満、および映像画像に関連付けられた任意の変更の前 5ms 未満となる精度で時刻を定義することにより、作成者が [EBU-R37] の要件を満たせるようにすべきである SHOULD。

上記の 2 つの制約、すなわち全体的な提示に関する制約と、リアルタイム再生を意図したDAPT 文書に関する制約をあわせて考えると、コンテンツプロセッサは、 DAPT 文書で指定された時刻より 35ms を超えて前に音声提示の変更を完了せず、かつ指定された時刻より 45ms を超えて後に完了しないようにすべきである SHOULD。

この節は、TTML 文書インスタンスが、それがDAPT文書であることをどのようにシグナルするか、および適用される処理要件をどのようにシグナルするかを定義する。 7.1 DAPT文書の適合性も参照。これは、DAPT文書がこの仕様に適合することを確立する方法を定義する。

このプロファイルは、次のプロファイル指定子に関連付けられる:

プロファイル名	プロファイル種別	プロファイル指定子
DAPT 1.0コンテンツプロファイル	コンテンツプロファイル	`http://www.w3.org/ns/ttml/profile/dapt1.0/content`
DAPT 1.0 プロセッサプロファイル	プロセッサプロファイル	`http://www.w3.org/ns/ttml/profile/dapt1.0/processor`

ttp:contentProfiles 属性は、文書が適合する [TTML2] プロファイルを宣言するために使用される。

DAPT文書は、 <tt>要素上に ttp:contentProfiles 属性を指定しなければならず、 5.6.1 プロファイル指定子で指定されたコンテンツプロファイル指定子と等しい値を少なくとも1つ含める。他の値は、[TTML2] の他のプロファイルへの適合を宣言するために存在してよく、独自名前空間内のプロファイル指定子を含んでよい。

DAPT文書が、適合していないコンテンツプロファイルへの適合をシグナルすることはエラーである。

変換プロセッサは、それら（プロセッサ）がサポートしないプロファイルに関連付けられた値を、 ttp:contentProfiles 属性内に含めてはならない。定義上、それらはコンテンツがそれらのプロファイルに適合することを検証できないためである。

ttp:profile属性は、 [TTML1] 内の、文書インスタンスに対する処理要件を宣言するための仕組みである。これは [TTML2] において、実質的にttp:processorProfilesに置き換えられている。

DAPT文書は、 <tt>要素上にttp:profile属性を指定してはならない。

ttp:processorProfiles 属性は、文書インスタンスに対する処理要件を宣言するために使用される。

DAPT文書は、 <tt>要素上に ttp:processorProfiles 属性を指定してよい。存在する場合、 ttp:processorProfiles 属性は、5.6.1 プロファイル指定子で指定されたプロセッサプロファイル指定子と等しい値を少なくとも1つ含まなければならない。他の値は追加の処理制約を宣言するために存在してよく、独自名前空間内のプロファイル指定子を含んでよい。

注記

ttp:processorProfiles 属性は、文書インスタンスを正常に処理するために、追加プロファイル内の機能および拡張をサポートする必要があることをシグナルするために使用できる。たとえば、ローカルワークフローが特定のメタデータ要件を導入し、追加のプロセッサプロファイル指定子を使用して、それらをサポートする必要があることをプロセッサにシグナルする場合がある。

注記

コンテンツ作者が、DAPTで定義されたものより追加のプロセッサ要件が DAPT文書を処理するために必要であることをシグナルする必要がない場合、 ttp:processorProfiles 属性は存在しないことが期待される。

[TTML2] は、文書インスタンスが使用できる、またはプロセッサがサポートする必要がある機能の集合を定義するために使用できる語彙および意味論を指定しており、これはプロファイルとして知られる。

指定されている場合を除き、このプロファイル語彙をプロセッサがサポートすることは DAPTの要件ではない。ただし、そのようなサポートは許可される。

このプロファイル語彙の大部分は、文書インスタンスを正常に処理するためにプロセッサがサポートする必要のある機能集合をどのように計算できるかを示すために使用される。この語彙自体はTTML2機能の観点から定義される。それらのプロファイル関連機能は、F. プロファイル内で任意として列挙されている。これらはプロセッサに実装してよく、関連する語彙はDAPT文書内に存在してよい。

注記

これらの機能および語彙に対するプロセッササポートが（帯域外プロトコルを使用して）手配されていない限り、この語彙は存在しないことが期待される。

DAPTにおいてプロセッササポートが要求されない（ただし許可される）追加のプロファイル関連語彙は次のとおりである:

DAPTスクリプト内では、時間属性および時間式に関して次の制約が適用される:

許可される唯一のttp:timeBase属性値はmediaである。なぜなら、F. プロファイルが、 #timeBase-media以外のすべての timeBase機能を禁止しているためである。

これは、文書タイムラインの始点、すなわち時刻「ゼロ」が、関連メディアオブジェクトの開始であることを意味する。

timeContainer属性の唯一許可される値は既定値、 parである。

文書は、すべての要素上でtimeContainer属性を省略すべきである。

文書は、いかなる要素上でもtimeContainer属性をpar以外の値に設定しては ならない。

注記

これは、すべての時間付き要素のbegin属性値が、その親要素の算出開始時刻を基準とし、 <body>要素については時刻ゼロを基準とすることを意味する。

文書がfメトリックを使用する時間式、またはフレーム構成要素を含む時間式をいずれか含む場合、 ttp:frameRate属性は<tt>要素上に存在しなければならない。

注記

[TTML2] は、非整数フレームレートを定義するためのttp:frameRateMultiplier属性を指定している。

文書がtメトリックを使用する時間式をいずれか含む場合、 ttp:tickRate属性は<tt>要素上に存在しなければならない。

文書内のすべての時間式は、[TTML2] で定義され、 DAPT制約が適用された clock-timeまたはoffset-timeのいずれかの同じ構文を使用すべきである。

注記

DAPT clock-timeは次の形式のいずれかを持つ:

hh:mm:ss.sss
hh:mm:ss

ここで、 hhは時、 mmは分、 ssは秒、そして ss.sssは秒の小数部を伴う秒（任意の精度）である。

注記

フレーム構成要素を使用するclock time式は、「タイムコード」に似て見えるが、特に非整数フレームレート、「ドロップモード」およびサブフレームレートとともに使用された場合に他所で観察されている意味上の混乱のため、禁止される。

注記

offset-timeは次の形式のいずれかを持つ:

nn metric
nn.nn metric

ここで、 nnは整数、 nn.nnは小数部を伴う数（任意の精度）、そして metricは次のいずれかである:

h は時。
m は分。
s は秒。
ms はミリ秒。
f はフレーム。
t はティック。

メディア時間式Mを映像のフレームFへ対応付ける場合、たとえばリップシンクのタイミングを正確に行う目的では、コンテンツプロセッサは、 M未満ではない最も近い提示時刻を持つフレームFへMを対応付けすべきである。

メディア時間式00:00:05.1は、フレームレートが1000 / 1001 × 30 ≈ 29.97である映像の ceiling( 5.1 × ( 1000 / 1001 × 30) ) = 153番目のフレームに対応する。

この仕様は、[ttml-imsc1.3] で定義されるレイアウトおよびレンダリングの機能に追加の制約を課さない。

注記

段落のレイアウトは、既定の TTML 領域（すなわち、<head> 要素内で <layout> 要素が使用されていない場合）に依存してもよく、または region 属性を使用して、 /tt/head/layout/region に存在する <region> 要素を参照することにより、明示的であってもよい。

スタイル参照またはインラインスタイルは、[TTML2] または [ttml-imsc1.3] で定義される、 style 属性、 <style> 要素、およびインラインスタイル属性の任意の組み合わせを使用して、使用して MAY である。

次のメタデータ要素は、DAPTで許可され、 [TTML2] で #PCDATA、すなわち要素内容を持たないテキストデータのみを含むものとして指定されている。そのような要素内の文字内容で双方向テキストが必要な場合、 Unicode制御文字を使用して、任意のテキスト範囲内の基底方向を定義できる。

<ttm:copyright>
<ttm:desc>
<ttm:item>
<ttm:name>
<ttm:title>

注記

この仕組みの使用に関する詳しいガイダンスは、HTMLにおけるインラインマークアップと双方向テキストで利用できる。

<p>および<span>内容要素は、 tts:directionおよびtts:unicodeBidi属性を使用してテキストの方向を指定することを許可する。文書作者は、Unicode制御文字を使用するのではなく、このより堅牢な仕組みを使用すべきである。

注記

[TTML2] から取られた次の例は、 <p>および<span>要素内の双方向テキストマークアップの構文を示している。

例 36

<p>
The title of the book is
"<span tts:unicodeBidi="embed" tts:direction="rtl">نشاط التدويل، W3C</span>"
</p>

上記断片のレンダリング例を以下に示す。

4. DAPTデータモデルおよび対応する TTML構文は、 DAPTデータモデルのオブジェクトおよびプロパティが、 [TTML2]、すなわちDAPT文書でどのように表されるかを定義する。しかし、DAPTデータモデルインスタンスは、複数の [TTML2] 文書インスタンスによって表すことができる。

たとえば、4. DAPTデータモデルおよび対応する TTML構文は、スクリプトイベントを表す <div>要素が <body>要素の直接の子であることを要求しない。その<div>要素は別の<div>要素内に入れ子にされてもよい。したがって、DAPTスクリプトのオブジェクトおよびプロパティを、さまざまなDAPT文書へ直列化することが可能である。この節は、DAPT文書から、相互運用可能かつ曖昧でない方法で DAPTモデルインスタンスを再構築する方法を定義する。

注記

DAPTは、拡張性の理由により、 DAPTデータモデルの完全な直列化を定義しない。必要であれば将来のバージョンでそうできるようにするためである。さらに、DAPT文書は、 DAPTオブジェクトまたはプロパティの表現において言及されていない要素または属性を含むことができる。これは、DAPTの将来バージョンに適合するプロセッサによって生成されたためである場合も、汎用的な [TTML2] 処理を通じたためである場合も、スタイリングまたはレイアウトを追加するなどの任意機能を使用しているためである場合もある。この節は、それらの要素または属性を処理する方法を定義する。

注記

汎用的な [TTML2] プロセッサを使用して DAPT文書を処理することも可能である。そのようなプロセッサは、必ずしも文書をDAPTデータモデルへ対応付けるとは限らない。たとえば、汎用的なTTML2プレゼンテーションプロセッサは、スクリプトイベントをそれ自体としてモデル化する必要なく、 DAPT文書に基づいて音声ミックスをレンダリングできる。その場合、この節は無視できる。

この節は非規範的である。

この節に関する規範的規定は、[TTML2] で定義される。

DAPTでは、 DAPT文書がルート要素上に ttp:contentProfiles属性を含み、かつその属性が、5.6.2 ttp:contentProfilesで指定されるように、 DAPTコンテンツプロファイル指定子を含むことが要件であるため、そのような属性を含まない、またはそのようなプロファイル指定子を含まない任意のTTML文書は、 DAPT文書ではないと見なすことができる。したがって、DAPTへの厳密な準拠を要求するプロセッサは、そのような文書の処理を停止できる。

入力として、サポートしている機能に関連する語彙を含むDAPT文書を受け取るプロセッサは、その文書が適合を主張するコンテンツプロファイルからそれらの機能のサポートが除外されている場合、その文書の文脈ではそれらの機能を実装すべきではない。

[TTML2] は、 <div>要素が <div>要素および<p>要素の任意の組み合わせを含むことを許可する。 DAPTデータモデルは、各スクリプトイベントが、 0個以上の<p>要素を含む<div>要素によってどのように表されるかを記述している。また、<body>要素とそれらのスクリプトイベント<div> 要素との間のパスに、他の中間<div>要素を置くことも許可している。さらに、DAPTデータモデル内のプロパティに対応しない属性も許可される。

これにより、次のような可能性が生じる:

テキストオブジェクトではない子、たとえば他の<div>要素や<metadata>要素を含む <div>要素。
スクリプトイベントに必要な属性、たとえばxml:idを持たない <div>要素。
スクリプトイベントについて、DAPTデータモデルには存在しない属性、たとえばxml:spaceを持つ<div>要素。
親<div>要素がスクリプトイベントであるように見えない <p>要素。

次の処理規則により、これらの場合が解決される。

スクリプトイベントを識別するための規則:

<div>要素の子に<div>要素がなく、かつスクリプトイベントの非メタデータの必須プロパティすべてのTTML表現を含む場合、その<div>要素はスクリプトイベントへ対応付けなければならない。たとえば、スクリプトイベント識別子を表す有効な xml:idを持つ場合であり、たとえ追加の認識されない語彙を含んでいても同様である。

この条項の目的において、あるプロパティは、そのTTML表現が daptm名前空間またはttm名前空間にある場合、メタデータであると見なされる。
任意の<div>要素の子に<div>要素が含まれる場合、その<div>要素はスクリプトイベントへ対応付けてはならない。代わりにプロセッサは、それらの<div>要素の子を（深さ優先走査で再帰的に）反復処理し、それぞれがスクリプトイベントの要件を満たすかどうかを考慮しなければならない。
残りの未対応付けの<div>要素は、スクリプトイベントへ対応付けてはならない。

テキストオブジェクトを識別するための規則:

スクリプトイベントへ対応付けられる<div>要素の子である <p>要素は、テキストオブジェクトへ対応付けなければならない。
スクリプトイベントへ対応付けられる<div>要素の子ではない <p>要素は、テキストオブジェクトへ対応付けてはならない。

注記

DAPTの将来バージョンは、これらの構造的可能性を異なる方法で使用する機能を含むことがあり、したがって、ここで定義された規則と相互排他的な他の処理規則を定義する可能性がある。

例 37

この例は、上記の可能性と規則の適用を示している:

<body>
    <div xml:id="d1"> <!-- This is a Script Event -->
        <p> <!-- This is a Text --> </p>
    </div>
    <div> <!-- This cannot be a Script Event because it has no xml:id -->
        <p> <!-- Would be a Text if its parent were a Script Event --> </p>
    </div>
    <div xml:id="d2_1"> <!-- div parent of another div -->
        <div xml:id="d2"> <!-- Possibly a Script Event --></div>
    </div>
    <div xml:id="d3_1"> <!-- double layer of nesting -->
        <div xml:id="d3_1_1">
            <div xml:id="d3" begin="..." end="..." xml:lang="ja" foo:bar="baz">
                <!-- A Script Event with possibly unexpected attributes -->
            </div>
        </div>
    </div>
    <div xml:id="d4_1"> <!-- mixed div and p children -->
        <div xml:id="d4_2"> <!-- This possible Script Event has a sibling <p> --> </div>
        <p> <!-- Possible Text, but not if its parent is not a Script Event --> </p>
    </div>
</body>

この例に上記の規則を適用した結果は次のとおりである:

d1はスクリプトイベントであり、その子<p> 要素はテキストオブジェクトである。
d1とd2の親<div>要素との間にある <div>要素はスクリプトイベントではなく、その子<p>要素はテキストオブジェクトではない。
d2はスクリプトイベントであり、その親<div> 要素はそうではない。
d3はスクリプトイベントであり、その親および祖父母 <div>要素はそうではない。
d4_1はスクリプトイベントではなく、その子<p> 要素はテキストオブジェクトではない。
d4_2はスクリプトイベントである。

一部の属性には、その値を算出する意味論があり、その算出は他のある要素上の属性の算出値に依存する。たとえば、xml:lang属性が要素上に指定されていない場合、その算出値はその要素の親上の同じ属性の算出値である。

DAPTデータモデル実体に対応する要素以外の要素上にも指定できる属性の表。追加で許可される属性、たとえばスタイリング属性（`fill`、`tta:gain`および`tta:pan`を含む）は、ここには列挙されないことに注意。
属性	DAPTデータモデル実体	指定可能な要素	子または子孫要素への効果
`xml:lang`	既定の言語、言語	任意の要素	[XML] で定義されるように継承される
`xml:id`	一意識別子	任意の要素	なし
`begin`	開始	`<body>`、 `<div>`、 `<p>`、 `<span>`、 `<audio>`、 `<animate>`	[TTML2] で定義されるように、その子上のタイミングプロパティのエポックを設定する
`end`	終了	`<body>`、 `<div>`、 `<p>`、 `<span>`、 `<audio>`、 `<animate>`	[TTML2] で定義されるように、その子孫の算出終了時刻を制約する
`dur`	継続時間	`<body>`、 `<div>`、 `<p>`、 `<span>`、 `<audio>`、 `<animate>`	[TTML2] で定義されるように、その子孫の算出終了時刻を制約する
`daptm:langSrc`	テキスト言語ソース	`<tt>`、 `<body>`、 `<div>`、 `<p>`、 `<span>`	この節で定義されるように継承される
`daptm:represents`	表すもの	`<tt>`、 `<body>`、 `<div>`、 `<p>`、 `<span>`	この節で定義されるように継承される

daptm:scriptRepresents、 daptm:onScreenおよび daptm:descType属性は、特定の要素上に指定された場合にのみ定義される。

また、別の例として、DAPT文書内の要素の算出時刻は、その要素の親の開始時刻に相対的である。 <div>要素がbegin属性を指定する場合、その子<div>要素の算出時刻は、その親<div>要素の開始時刻に相対的であり、階層を下るにつれて同様である。処理対象が、それらに直接対応するものを持たないDAPT データモデルのインスタンスである場合でも、それらの「中間」<div>要素の時刻を計算に含めることが重要である。そうしなければ、スクリプトイベントの開始および終了時刻が誤ったものになる。

この状況をより一般的に考えると、 DAPT文書内には、 DAPTデータモデル内のオブジェクトに直接対応しないTTML要素が存在する可能性があり、それらの要素は、DAPTデータモデル内のオブジェクトに対応する要素に適用される属性値の算出に影響する属性を指定できる。

[TTML2] によって定義される意味論、またはここで定義される語彙についてはこの仕様によって定義される意味論が、このシナリオでは優先される。実装は、算出された値をDAPTデータモデルオブジェクトに適用する前に、文書インスタンスの内容に基づいて属性値を算出しなければならない。たとえば、TTML2スタイリング機能をサポートするプロセッサは、 tts:fontSizeなどの属性の継承および相対値の算出に関するTTML2意味論を実装する必要がある。

例 38

この例は、プロセッサが処理する必要があるかもしれないこれらの可能性を示している:

<tt ... xml:lang="en">
    <body>
        <div xml:id="d1" begin="00:01:00" end="00:01:10">
            <!-- Script Event beginning at 1 minute, duration 10 seconds -->
            <p> <!-- This is a Text, language "en" --> </p>
        </div>
        <div begin="00:10:00" xml:lang="fr"> <!-- div that is not a Script Event -->
            <div xml:id="d2" begin="00:01:00" end="00:01:10">
                <!-- Script Event beginning at 11 minutes, duration 10 seconds -->
                <p> <!-- This is a Text, language "fr" --> </p>
            </div>
        </div>
    </body>
</tt>

ここでは、スクリプトイベントに対応し、id d1およびd2を持つ<div>要素は、それ以外は（識別子を除き）同一であるが、 d2の親<div>要素上に指定された属性により、それらの言語および開始プロパティは異なる算出値を持つ。

実装が内部的に、上の例に示されたスクリプトイベントなどの DAPTデータモデルオブジェクトを作成する場合、相互運用性のためには、それらが算出値を使用することが重要である。

この節は非規範的である。

5.2.1 認識されない語彙に従い、 DAPTプロセッサの実装者は、 DAPT文書内の<metadata>要素における認識されない語彙を維持することが推奨される。実際には、DAPT文書を入力し、 DAPT文書を出力する実装が、入力文書の構造および内容を変更し、その際に、認識されない語彙を持つそれらの実体を出力文書から実質的に刈り込むことがあり得る。

この節に関する規範的規定は、[TTML2] で定義される。

[TTML2] は検証プロセッサを定義する。これは、文書インスタンスを評価し、それが有効かどうかを判断することを目的とする実装のクラスである。通常これは、文書が後続の使用に受け入れ可能であることを確認するために、処理ワークフロー内で使用される。現実世界の例では、単に「良い」または「悪い」を返すのではなく、入力文書内の通常でない、予期しない、または問題のある内容を記述する情報、警告およびエラーメッセージも出力する可能性が高い。

DAPT文書向けに検証プロセッサを実装する場合、厳密な [TTML2] 検証処理規則を適用できる。これを行うには、プロファイル内で定義された必須または任意の機能に関連する構文および内容の存在と意味的妥当性を確認し、禁止された機能に関連する構文が存在しないことを確認する。

[TTML2] における、認識されない名前空間の語彙を扱う仕組みは、検証の前にそれを刈り込むことである。このアプローチは使用できる。さらに、実装が刈り込まれた属性および要素を情報として報告することも合理的であり得る。

注記

ここでいう「語彙」という用語は、XML要素および属性を指す。

認識済み名前空間内のサポートされていない、または非推奨の語彙が刈り込み後に遭遇された場合、あるいはサポートされる語彙が予期しないが無効ではない内容を含む場合には、検証警告が発行される可能性があるが、これらのシナリオではエラーは期待されない。

禁止された語彙が存在する場合、または許可された語彙内で意味的に無効な内容に遭遇した場合には、検証エラーが期待される。

この節は、 [TTML2] コンテンツプロファイルおよびプロセッサプロファイルを、機能および拡張の集合に対する処置を表現することによって定義する。 DAPT拡張は、G. 拡張で定義される。

[TTML2] で指定されるプロファイル意味論が適用される。

TTML プロファイル仕様とは、「文書インスタンス」（ファイル）および「プロセッサ」（ファイルを処理するもの）内で必須／任意／禁止とされるTTMLのすべての機能、ならびに任意の拡張または制約を列挙する文書である。

ここで定義されるコンテンツプロファイルに適合する時限テキストコンテンツ文書インスタンスは:

プロファイルによって指定されるすべての規範的規定を満たさなければならない。
プロファイル内で処置が許可または任意とされている機能または拡張に関連付けられる任意の語彙、構文または属性値を含んでよい。
プロファイル内で処置が必須とされている機能または拡張に関連付けられる任意の語彙、構文または属性値を含まなければならない。
プロファイル内で処置が禁止とされている機能または拡張に関連付けられる任意の語彙、構文または属性値を含んではならない。

注記

時限テキストコンテンツ文書インスタンスは、定義上、[TTML2] の3.1節の要件を満たすため、ここで定義されるプロファイルに適合する時限テキストコンテンツ文書インスタンスは、適合するTTML2文書インスタンスでもある。

この仕様で定義されるプロセッサプロファイルに適合するプレゼンテーションプロセッサは:

[TTML2] の3.2.1節における一般プロセッサ適合性要件を満たさなければならない。
プロファイルによって指定されるすべての規範的規定を満たさなければならず、かつ
プロファイルによって許可または必須として指定されるすべての機能または拡張について、各機能に対してプロファイルで指定される任意の追加制約に従い、プレゼンテーション意味論サポートを実装しなければならない。
プロファイルによって任意または禁止として指定されるすべての機能または拡張について、各機能に対してプロファイルで指定される任意の追加制約に従い、プレゼンテーション意味論サポートを実装してよい。

この仕様で定義されるプロセッサプロファイルに適合する変換プロセッサは:

[TTML2] の3.2.1節における一般プロセッサ適合性要件を満たさなければならない。
プロファイルによって指定されるすべての規範的規定を満たさなければならず、かつ
プロファイルによって許可または必須として指定されるすべての機能または拡張について、各機能に対してプロファイルで指定される任意の追加制約に従い、変換意味論サポートを実装しなければならない。
プロファイルによって任意または禁止として指定されるすべての機能または拡張について、各機能に対してプロファイルで指定される任意の追加制約に従い、変換意味論サポートを実装してよい。

この仕様で使用されるrequired、permitted、optionalおよびprohibitedの処置は、 [TTML2] の<ttp:feature> および<ttp:extension>要素の value属性値へ次のように対応付けられる:

DAPTの処置	`<ttp:feature>`または `<ttp:extension>` 要素の`value`属性値（次における値）
DAPTの処置	コンテンツプロファイル	プロセッサプロファイル
required	required	required
permitted	optional	required
optional	optional	optional
prohibited	prohibited	optional

注記

この文書内でプレゼンテーションプロセッサおよび変換プロセッサという用語を使用しても、 [TTML2] で定義される標準プロファイルのいずれかへの適合を それ自体として意味するものではない。言い換えれば、プレゼンテーションプロセッサまたは変換プロセッサが、 TTML2プレゼンテーションプロファイルまたはTTML2変換プロファイルにも適合することなく、この文書で定義されるプロファイルに適合することはエラーとは見なされない。

注記

この仕様内でDAPT適合性を記述するために [TTML2] のプロファイリングサブシステムを使用することは、 DAPTプロセッサが、 DAPTによってサポートが明示的に要求されるもの以外のそのシステムの機能をサポートする必要があることを意味する意図ではない。

注記

この文書は、不適合の時限テキストコンテンツ文書インスタンスを処理または変換する際の、プレゼンテーションプロセッサまたは変換プロセッサの挙動を指定しない。

注記

permittedおよびprohibitedの処置は、 <ttp:profile>要素内で <ttp:feature>または<ttp:extension>要素が許可または禁止されるものとして指定されていることを指すものではない。

この節に列挙される機能および拡張は、 DAPT文書、プレゼンテーションプロセッサ、および変換プロセッサに対する最小要件を表現する。 DAPT文書は、追加で他のプロファイルに適合してよく、 DAPTコンテンツプロファイルによって禁止されていない構文を含んでよい。プレゼンテーションプロセッサおよび変換プロセッサは、他のプロファイルに関連する追加の構文および意味論をサポートしてよい。

注記

たとえば、DAPTスクリプトは、音声を録音する俳優に対する台本の提示を強化するため、または字幕もしくはキャプション作成での後の使用に重要なスタイルを追加するために、 [TTML2] の IMSC（[ttml-imsc1.3]）Text Profile によって許可される構文を含めることができる。

編集者注

編集作業: この機能一覧を確認し、それぞれの扱いを確認すること。 IMSC で許可されている禁止機能があってはならない。

機能または拡張	処置	追加規定
TT機能名前空間を基準とする
`#animate-fill`	permitted
`#animate-minimal`	permitted
`#animation-out-of-line`	prohibited	4.10 ミキシング指示を参照。
`#audio`	permitted
`#audio-description`	permitted
`#audio-speech`	permitted
`#bidi`	permitted
`#bidi-version-2`	permitted
`#chunk`	permitted
`#clockMode`	prohibited
`#clockMode-gps`	prohibited
`#clockMode-local`	prohibited
`#clockMode-utc`	prohibited
`#content`	permitted
`#contentProfiles`	permitted	5.6.2 `ttp:contentProfiles` およびG.3 #contentProfiles-rootを参照。
`#contentProfiles-combined`	optional	5.6.5 その他のTTML2プロファイル語彙を参照。
`#core`	permitted
`#data`	permitted
`#direction`	permitted
`#dropMode`	prohibited
`#dropMode-dropNTSC`	prohibited
`#dropMode-dropPAL`	prohibited
`#dropMode-nonDrop`	prohibited
`#embedded-audio`	permitted
`#embedded-data`	permitted
`#frameRate`	permitted	5.7.3 `ttp:frameRate`を参照。
`#frameRateMultiplier`	permitted
`#gain`	permitted
`#markerMode`	prohibited
`#markerMode-continuous`	prohibited
`#markerMode-discontinuous`	prohibited
`#metadata`	permitted
`#metadata-item`	permitted
`#metadata-version-2`	permitted
`#pan`	permitted
`#permitFeatureNarrowing`	optional	5.6.5 その他のTTML2プロファイル語彙を参照。
`#nested-div`	permitted	これは、4.3 スクリプトイベントで説明される `<div>`要素の入れ子を許可することのプロファイル表現である。
`#permitFeatureWidening`	optional	5.6.5 その他のTTML2プロファイル語彙を参照。
`#pitch`	permitted
`#presentation-audio`	permitted
`#processorProfiles`	optional	5.6.4 `ttp:processorProfiles`を参照。
`#processorProfiles-combined`	optional	5.6.5 その他のTTML2プロファイル語彙を参照。
`#profile`	partially permitted	5.6.3 `ttp:profile`を参照。
`#profile-full-version-2`	partially permitted	5.6.5 その他のTTML2プロファイル語彙を参照。
`#profile-version-2`	partially permitted	5.6.5 その他のTTML2プロファイル語彙を参照。
`#resources`	permitted
`#set`	permitted
`#set-fill`	permitted
`#set-multiple-styles`	permitted
`#source`	permitted
`#speak`	permitted
`#speech`	permitted
`#structure`	required
`#styling`	permitted
`#styling-chained`	permitted
`#styling-inheritance-content`	permitted
`#styling-inline`	permitted
`#styling-referential`	permitted
`#subFrameRate`	prohibited
`#tickRate`	permitted	5.7.4 `ttp:tickRate`を参照。
`#time-clock`	permitted
`#time-clock-with-frames`	prohibited
`#time-offset-with-frames`	permitted	5.7.3 `ttp:frameRate`を参照。
`#time-offset-with-ticks`	permitted	5.7.4 `ttp:tickRate`を参照。
`#time-offset`	permitted
`#time-wall-clock`	prohibited
`#timeBase-clock`	prohibited
`#timeBase-media`	required	5.7.1 `ttp:timeBase`を参照。注記: [TTML1] は、 `ttp:timeBase`属性が`<tt>`要素上に指定されていない場合、既定の時間基準が`"media"`であることを指定している。
`#timeBase-smpte`	prohibited
`#timeContainer`	prohibited	5.7.2 `timeContainer`を参照。
`#timing`	permitted	5.7.5 時間式を参照。
`#transformation`	permitted	#profileの制約を参照。
`#unicodeBidi`	permitted
`#unicodeBidi-isolate`	permitted
`#unicodeBidi-version-2`	permitted
`#xlink`	permitted
DAPT拡張名前空間を基準とする
`#agent`	permitted	これは4.2 キャラクターのプロファイル表現である。
`#contentProfiles-root`	required	これは5.6.2 `ttp:contentProfiles`のプロファイル表現である。
`#daptOriginTimecode`	permitted	これはD.1 DAPT原点タイムコードのプロファイル表現である。
`#descType`	permitted	これは`daptm:descType`のプロファイル表現である。
`#onScreen`	permitted	これは4.6 画面上のプロファイル表現である。
`#profile-root`	prohibited	これは、5.6.3 `ttp:profile`で指定される、 `<tt>`要素上の`ttp:profile`属性の禁止のプロファイル表現である。
`#represents`	required	これは、スクリプトイベントへ適用される表すもののプロファイル表現である。
`#scriptEventMapping`	optional	これは6.3 `<div>`および `<p>`要素の処理のプロファイル表現である。
`#scriptRepresents-root`	required	これはスクリプトが表すもののプロファイル表現である。
`#scriptType-root`	required	これは4.1.3 スクリプト種別のプロファイル表現である。
`#serialization`	required	これは5.1 文書エンコーディングのプロファイル表現である。
`#source-data`	prohibited	これは、4.9.1 音声録音で指定される、 `<data>`要素の`<source>` 子要素の禁止のプロファイル表現である。
`#textLanguageSource`	permitted	これは、4.4 テキストで要求される、 4.5 テキスト言語ソースのプロファイル表現である。
`#xmlLang-audio-nonMatching`	prohibited	これは、4.9.1 音声録音で指定される、 `<audio>`要素上の`xml:lang`属性が、親要素および子孫または参照先の`<source>` および`<data>`要素と異なる算出値を持つことの禁止のプロファイル表現である。
`#xmlLang-root`	required	これは4.1.2 既定の言語のプロファイル表現である。

DAPTコンテンツプロファイルは、 [TTML2] のプロファイル機構を使用して、 DAPTスクリプトの適合性要件を表現する。これは、DAPTプロセッサプロファイルをサポートする検証プロセッサが、 DAPT文書を検証するために使用できる。

DAPT文書内にDAPTコンテンツプロファイルを含める要件はない。

<?xml version="1.0" encoding="utf-8"?>
<!-- This file is the TTML Profile Document representing
  the DAPT 1.0 Content Profile defined 
  by DAPT at https://www.w3.org/TR/dapt/ -->
<profile xmlns="http://www.w3.org/ns/ttml#parameter"
  designator="http://www.w3.org/ns/ttml/profile/dapt1.0/content"
  combine="mostRestrictive"
  type="content">
  <features xml:base="http://www.w3.org/ns/ttml/feature/">
    <!-- required (mandatory) feature support -->
    <feature value="required">#structure</feature>
    <feature value="required">#timeBase-media</feature>
    <!-- optional (voluntary) feature support -->
    <feature value="optional">#animate-fill</feature>
    <feature value="optional">#animate-minimal</feature>
    <feature value="optional">#audio</feature>
    <feature value="optional">#audio-description</feature>
    <feature value="optional">#audio-speech</feature>
    <feature value="optional">#bidi</feature>
    <feature value="optional" extends="#bidi">#bidi-version-2</feature>
    <feature value="optional">#chunk</feature>
    <feature value="optional">#content</feature>
    <feature value="optional">#contentProfiles</feature>
    <feature value="optional">#contentProfiles-combined</feature>
    <feature value="optional">#core</feature>
    <feature value="optional">#data</feature>
    <feature value="optional">#direction</feature>
    <feature value="optional">#embedded-audio</feature>
    <feature value="optional">#embedded-data</feature>
    <feature value="optional">#frameRate</feature>
    <feature value="optional">#frameRateMultiplier</feature>
    <feature value="optional">#gain</feature>
    <feature value="optional">#metadata</feature>
    <feature value="optional">#metadata-item</feature>
    <feature value="optional">#nested-div</feature>
    <feature value="optional" extends="#metadata">#metadata-version-2</feature>
    <feature value="optional">#pan</feature>
    <feature value="optional">#permitFeatureNarrowing</feature>
    <feature value="optional">#permitFeatureWidening</feature>
    <feature value="optional">#pitch</feature>
    <feature value="optional">#presentation-audio</feature>
    <feature value="optional">#processorProfiles</feature>
    <feature value="optional">#processorProfiles-combined</feature>
    <feature value="optional">#resources</feature>
    <feature value="optional" extends="#animation">#set</feature>
    <feature value="optional">#set-fill</feature>
    <feature value="optional">#set-multiple-styles</feature>
    <feature value="optional">#source</feature>
    <feature value="optional">#speak</feature>
    <feature value="optional">#speech</feature>
    <feature value="optional">#styling</feature>
    <feature value="optional">#styling-chained</feature>
    <feature value="optional">#styling-inheritance-content</feature>
    <feature value="optional">#styling-inline</feature>
    <feature value="optional">#styling-referential</feature>
    <feature value="optional">#tickRate</feature>
    <feature value="optional">#time-clock</feature>
    <feature value="optional">#time-offset</feature>
    <feature value="optional">#time-offset-with-frames</feature>
    <feature value="optional">#time-offset-with-ticks</feature>
    <feature value="optional">#timing</feature>
    <feature value="optional">#transformation</feature>
    <feature value="optional">#unicodeBidi</feature>
    <feature value="optional">#unicodeBidi-isolate</feature>
    <feature value="optional" extends="#unicodeBidi">#unicodeBidi-version-2</feature>
    <feature value="optional">#xlink</feature>
    <!-- prohibited feature support -->
    <feature value="prohibited">#animation-out-of-line</feature>
    <feature value="prohibited">#clockMode</feature>
    <feature value="prohibited">#clockMode-gps</feature>
    <feature value="prohibited">#clockMode-local</feature>
    <feature value="prohibited">#clockMode-utc</feature>
    <feature value="prohibited">#dropMode</feature>
    <feature value="prohibited">#dropMode-dropNTSC</feature>
    <feature value="prohibited">#dropMode-dropPAL</feature>
    <feature value="prohibited">#dropMode-nonDrop</feature>
    <feature value="prohibited">#markerMode</feature>
    <feature value="prohibited">#markerMode-continuous</feature>
    <feature value="prohibited">#markerMode-discontinuous</feature>
    <feature value="prohibited">#subFrameRate</feature>
    <feature value="prohibited">#time-clock-with-frames</feature>
    <feature value="prohibited">#time-wall-clock</feature>
    <feature value="prohibited">#timeBase-clock</feature>
    <feature value="prohibited">#timeBase-smpte</feature>
    <feature value="prohibited">#timeContainer</feature>
  </features>
  <extensions xml:base="http://www.w3.org/ns/ttml/profile/dapt/extension/">
    <!-- required (mandatory) extension support -->
    <extension value="required">#contentProfiles-root</extension>
    <extension value="required">#represents</extension>
    <extension value="required">#scriptRepresents-root</extension>
    <extension value="required">#scriptType-root</extension>
    <extension value="required">#serialization</extension>
    <extension value="required">#xmlLang-root</extension>
    <!-- optional (voluntary) extension support -->
    <extension value="optional">#agent</extension>
    <extension value="optional">#daptOriginTimecode</extension>
    <extension value="optional">#descType</extension>
    <extension value="optional">#onScreen</extension>
    <extension value="optional">#scriptEventMapping</extension>
    <extension value="optional">#textLanguageSource</extension>
    <!-- prohibited extension support -->
    <extension value="prohibited">#profile-root</extension>
    <extension value="prohibited">#source-data</extension>
    <extension value="prohibited">#xmlLang-audio-nonMatching</extension>
</extensions>
</profile>

DAPTプロセッサプロファイルは、 [TTML2] のプロファイル機構を使用して、 DAPTスクリプトの処理要件を表現する。 DAPTプロセッサプロファイルの必須の機能および拡張をサポートするプロセッサは、最小限、DAPT文書内のすべての許可された機能を処理できる。

DAPT文書内にDAPTプロセッサプロファイルを含める要件はない。

<?xml version="1.0" encoding="utf-8"?>
<!-- This file is the TTML Profile Document representing
  the DAPT 1.0 Processor Profile defined 
  by DAPT at https://www.w3.org/TR/dapt/ -->
<profile xmlns="http://www.w3.org/ns/ttml#parameter"
  designator="http://www.w3.org/ns/ttml/profile/dapt1.0/processor"
  combine="mostRestrictive"
  type="processor">
  <features xml:base="http://www.w3.org/ns/ttml/feature/">
    <!-- required (mandatory) feature support -->
    <feature value="required">#animate-fill</feature>
    <feature value="required">#animate-minimal</feature>
    <feature value="required">#audio</feature>
    <feature value="required">#audio-description</feature>
    <feature value="required">#audio-speech</feature>
    <feature value="required">#bidi</feature>
    <feature value="required" extends="#bidi">#bidi-version-2</feature>
    <feature value="required">#chunk</feature>
    <feature value="required">#content</feature>
    <feature value="required">#contentProfiles</feature>
    <feature value="required">#core</feature>
    <feature value="required">#data</feature>
    <feature value="required">#direction</feature>
    <feature value="required">#embedded-audio</feature>
    <feature value="required">#embedded-data</feature>
    <feature value="required">#frameRate</feature>
    <feature value="required">#frameRateMultiplier</feature>
    <feature value="required">#gain</feature>
    <feature value="required">#metadata</feature>
    <feature value="required">#metadata-item</feature>
    <feature value="required">#nested-div</feature>
    <feature value="required" extends="#metadata">#metadata-version-2</feature>
    <feature value="required">#pan</feature>
    <feature value="required">#pitch</feature>
    <feature value="required">#presentation-audio</feature>
    <feature value="required">#resources</feature>
    <feature value="required" extends="#animation">#set</feature>
    <feature value="required">#set-fill</feature>
    <feature value="required">#set-multiple-styles</feature>
    <feature value="required">#source</feature>
    <feature value="required">#speak</feature>
    <feature value="required">#speech</feature>
    <feature value="required">#structure</feature>
    <feature value="required">#styling</feature>
    <feature value="required">#styling-chained</feature>
    <feature value="required">#styling-inheritance-content</feature>
    <feature value="required">#styling-inline</feature>
    <feature value="required">#styling-referential</feature>
    <feature value="required">#tickRate</feature>
    <feature value="required">#time-clock</feature>
    <feature value="required">#time-offset</feature>
    <feature value="required">#time-offset-with-frames</feature>
    <feature value="required">#time-offset-with-ticks</feature>
    <feature value="required">#timeBase-media</feature>
    <feature value="required">#timing</feature>
    <feature value="required">#transformation</feature>
    <feature value="required">#unicodeBidi</feature>
    <feature value="required">#unicodeBidi-isolate</feature>
    <feature value="required" extends="#unicodeBidi">#unicodeBidi-version-2</feature>
    <feature value="required">#xlink</feature>
    <!-- optional (voluntary) feature support -->
    <feature value="optional">#animation-out-of-line</feature>
    <feature value="optional">#clockMode</feature>
    <feature value="optional">#clockMode-gps</feature>
    <feature value="optional">#clockMode-local</feature>
    <feature value="optional">#clockMode-utc</feature>
    <feature value="optional">#contentProfiles-combined</feature>
    <feature value="optional">#dropMode</feature>
    <feature value="optional">#dropMode-dropNTSC</feature>
    <feature value="optional">#dropMode-dropPAL</feature>
    <feature value="optional">#dropMode-nonDrop</feature>
    <feature value="optional">#markerMode</feature>
    <feature value="optional">#markerMode-continuous</feature>
    <feature value="optional">#markerMode-discontinuous</feature>
    <feature value="optional">#permitFeatureNarrowing</feature>
    <feature value="optional">#permitFeatureWidening</feature>
    <feature value="optional">#processorProfiles</feature>
    <feature value="optional">#processorProfiles-combined</feature>
    <feature value="optional">#subFrameRate</feature>
    <feature value="optional">#time-clock-with-frames</feature>
    <feature value="optional">#time-wall-clock</feature>
    <feature value="optional">#timeBase-clock</feature>
    <feature value="optional">#timeBase-smpte</feature>
    <feature value="optional">#timeContainer</feature>
  </features>
  <extensions xml:base="http://www.w3.org/ns/ttml/profile/dapt/extension/">
    <!-- required (mandatory) extension support -->
    <extension value="required">#agent</extension>
    <extension value="required">#contentProfiles-root</extension>
    <extension value="required">#daptOriginTimecode</extension>
    <extension value="required">#descType</extension>
    <extension value="required">#onScreen</extension>
    <extension value="required">#represents</extension>
    <extension value="required">#scriptRepresents-root</extension>
    <extension value="required">#scriptType-root</extension>
    <extension value="required">#serialization</extension>
    <extension value="required">#textLanguageSource</extension>
    <extension value="required">#xmlLang-root</extension>
    <!-- optional (voluntary) extension support -->
    <extension value="optional">#profile-root</extension>
    <extension value="optional">#scriptEventMapping</extension>
    <extension value="optional">#source-data</extension>
    <extension value="optional">#xmlLang-audio-nonMatching</extension>
</extensions>
</profile>

TTML2の吹替および音声解説プロファイル

概要

この文書の状態

1. 範囲

2. 導入

2.1 トランスクリプトとスクリプト

2.1.1 吹替スクリプト

2.1.2 音声解説スクリプト

2.1.3 その他の用途

2.2 例示文書

2.2.1 基本的な文書構造

2.2.2 音声解説の例

2.2.3 吹替の例

3. 文書化規約

4. DAPTデータモデルおよび対応する TTML構文

4.1 DAPTスクリプト

4.1.1 スクリプトが表すもの

4.1.2 既定の言語

4.1.3 スクリプト種別

4.1.4 スクリプトイベント

4.1.5 キャラクター

4.1.6 共有プロパティ および値集合

4.1.6.1 タイミングプロパティ

4.1.6.2 <content-descriptor>値

4.1.6.3 一意識別子

4.2 キャラクター

4.3 スクリプトイベント

4.4 テキスト

4.5 テキスト言語ソース

4.6 画面上

4.7 表すもの

4.8 スクリプトイベント記述

4.9 音声

4.9.1 音声録音

4.9.2 合成音声

4.10 ミキシング指示

5. 制約

5.1 文書エンコーディング

5.2 認識されない要素および属性、または外来要素および属性の処理

5.2.1 認識されない語彙

5.2.2 外来語彙に関する特別な考慮事項

5.2.3 独自メタデータおよび外来語彙

5.2.3.1 メタデータではない外来語彙の定義および使用

5.3 名前空間

5.4 関連メディアオブジェクト

5.5 同期

5.6 プロファイルシグナリング

5.6.1 プロファイル指定子

5.6.2 ttp:contentProfiles

5.6.3 ttp:profile

5.6.4 ttp:processorProfiles

5.6.5 その他のTTML2プロファイル 語彙

5.7 タイミング制約

5.7.1 ttp:timeBase

5.7.2 timeContainer

5.7.3 ttp:frameRate

5.7.4 ttp:tickRate

5.7.5 時間式

5.8 レイアウトおよびスタイル

5.9 双方向テキスト

6. TTMLからDAPTデータモデルへのマッピング

6.1 不適合文書の 早期識別

6.2 コンテンツプロファイルによって除外された機能を サポートしないこと

6.3 <div> および<p>要素の処理

6.4 算出属性 値の使用

6.5 変換プロセッサおよび検証プロセッサに関する考慮事項

6.5.1 認識されない語彙の 保持

6.5.2 検証警告 およびエラー

7. 適合性

7.1 DAPT文書の適合性

7.2 DAPTプロセッサの適合性

A. 索引

A.1 この仕様で定義される用語

A.2 参照により定義される用語

B. プライバシーに関する考慮事項

B.1 個人情報

B.2 音声形式の選好

C. セキュリティに関する考慮事項

D. タイムコード関連メタデータ

D.1 DAPT原点タイムコード

4.1.6 共有プロパティおよび値集合

4.1.6.2 `<content-descriptor>`値

5.6.2 `ttp:contentProfiles`

5.6.3 `ttp:profile`

5.6.4 `ttp:processorProfiles`

5.6.5 その他のTTML2プロファイル語彙

5.7.1 `ttp:timeBase`

5.7.2 `timeContainer`

5.7.3 `ttp:frameRate`

5.7.4 `ttp:tickRate`

6.1 不適合文書の早期識別

6.2 コンテンツプロファイルによって除外された機能をサポートしないこと

6.3 `<div>` および`<p>`要素の処理

6.4 算出属性値の使用

6.5.1 認識されない語彙の保持

6.5.2 検証警告およびエラー

H.1.2.2 変更要求の評価プロセス

H.2.1 `daptm:descType`レジストリ表定義

H.2.2 `<content-descriptor>`レジストリ表定義