領域キャプチャ

概要

この文書は、現在のタブのディスプレイキャプチャから派生したビデオトラックを切り抜くための API を紹介する。

この節は非規範的である。

複雑なアプリケーションは、多くの場合、別個の文書を、同一の iframe 内の複数の閲覧コンテキスト内に表示して構成される。そのようなアプリケーションを考える。これらの文書の 1 つである CAPTURING-DOC が、getDisplayMedia() または getViewportMedia を用いて、現在の閲覧コンテキスト全体をキャプチャすると仮定する。次にこの文書が、協調する文書 CAPTURED-DOC の一部のサブセクション CAPTURE-TARGET の座標にビデオトラックを切り抜きたい場合、 CAPTURING-DOC はどのようにすれば高性能かつ信頼性高くそれを行えるか。特に、スクロール、ズーム、またはウィンドウのサイズ変更によるレイアウトの変化が追加の課題をもたらすことを思い出されたい。

同一タブ内の異なる iframe にホストされる 2 つの主要な部分、すなわちビデオ会議アプリケーションと生産性スイートアプリケーションからなる複合アプリケーションを考える。ビデオ会議側が getDisplayMedia() および/または getViewportMedia などの既存/今後の API を用い、タブ全体をキャプチャすると仮定する。今度は、生産性スイートの特定のセクション以外のすべてを切り抜いて除去する必要がある。結果として得られる切り抜かれたビデオをリモートに送信する前に、自身のビデオ会議コンテンツ、発表者ノート、および生産性スイート内のその他の私的および/または無関係なコンテンツを切り抜いて除去する必要がある。

さらに、協調する 2 つのアプリケーションは互いにクロスオリジンである可能性が高いことを考慮する。それらはメッセージを投稿できるが、すべての通信は非同期であり、かつそれらの間で情報を控えめに送信する方が容易で高性能である。これは、フレーム全体を投稿する解決策や、レイアウトの変化（例: スクロール、ズーム、ウィンドウサイズの変更）への反応が遅すぎる解決策を排除する。

ほとんどのアプリケーションは、そのようなシナリオでは getViewportMedia を使うことを好むであろう点は注目に値する。しかし、この執筆時点では、 getViewportMedia はまだ仕様化されておらず、実装もされていない。それには採用にいくらかの時間と労力を要する、些細でない要件がある。そのため、多くのアプリケーションは、今後しばらくの間、getDisplayMedia() と Region Capture の組み合わせを使用する可能性が高い。

この文書で提示される切り抜き機構 (cropTo) は、直接的なノード参照ではなく、 Crop-session Target に依存する。これは二重の目的を果たす。

ある文書による切り抜きを、別の文書で指定された座標に基づいて行えるようにする。
タグ付けにより、Element を潜在的な切り抜きターゲットとして指定することで、ユーザーエージェントは境界ボックスの計算や、そのような座標をプロセス間で送信することなど、他のすべての要素に対する不要な作業を避けられる。

CropTarget は、意図的に空で不透明な識別子である。その目的は、入力として cropTo に渡されることである。

WebIDL[Exposed=(Window,Worker), Serializable]
interface CropTarget {
  [Exposed=Window, SecureContext] static Promise<CropTarget> fromElement(Element element);
};

注記

fromElement をセキュアコンテキストを越えて公開すべきかどうかについては、まだ合意がない。

fromElement()

サポートされる型の Element を指定して fromElement を呼び出すと、その Element は CropTarget に関連付けられる。この CropTarget は、 cropTo への入力として使用できる。 CropTarget.fromElement() の呼び出しによって返され、かつまだアクティブな文書内にあるものを、有効な CropTarget と定義する。

指定された element で fromElement が呼び出されたとき、ユーザーエージェントは element を入力として CropTarget を作成する。ユーザーエージェントは Promise p を返さ MUST。ユーザーエージェントは、新しい CropTarget に関連付けられた状態の必要な内部伝播をすべて完了した後に限って p を解決し MUST、その時点でユーザーエージェントは、新しい CropTarget を cropTo への有効なパラメーターとして受け取る準備ができていなければ MUST ならない。

以前に fromElement が呼び出された Element をクローンする場合、そのクローンはいかなる CropTarget とも関連付けられない。後でそのクローンに対して fromElement が呼び出された場合、新しい CropTarget がそれに割り当てられる。

注記

CropTarget の生成を、 CropTarget.fromElement() のような非同期メソッドの呼び出しによって行うべきか、それとも入力として Element を受け取る CropTarget コンストラクターによって行うべきかについては、まだ合意がない。これは issue #17 でさらに議論されている。

element を入力として CropTarget を作成するには、次の手順を実行する:

cropTarget を、型 CropTarget の新しいオブジェクトとする。
weakRef を element への弱参照とする。

weakRef に初期化された cropTarget.[[Element]] を作成する。

注記

cropTarget は、それが表す要素への弱参照を保持する。言い換えると、 cropTarget はその要素のガベージコレクションを妨げない。

CropTarget オブジェクトはシリアライズ可能である。 value、serialized、および真偽値 forStorage が与えられたときのシリアライズ手順は次のとおりである:

forStorage が true の場合、 name 属性の値が "DataCloneError" である新しい DOMException オブジェクトで例外を投げる。
serialized.[[CropTargetElement]] を value.[[Element]] に設定する。

serialized および value が与えられたときのデシリアライズ手順は次のとおりである:

value.[[Element]] を serialized.[[CropTargetElement]] に設定する。

[SCREEN-CAPTURE] によれば、 getDisplayMedia() が呼び出されたとき、それは Promise<MediaStream> を返し、この MediaStream には、型が MediaStreamTrack であるビデオトラックが正確に 1 つ含まれることを思い出されたい。

ユーザーが browser display-surface のキャプチャを選択した場合、ユーザーエージェントはビデオトラックを MediaStreamTrack、または MediaStreamTrack の何らかのサブクラスとしてインスタンス化しなければ MUST ならず、かつ cropTo はこのトラックで公開されなければ MUST ならない、と規定する。簡単のため、この文書では、ユーザーエージェントによって BrowserCaptureMediaStreamTrack と呼ばれるサブクラスが使用されると仮定する。

トラックは初期状態で未切り抜きでなければ MUST ならない。

WebIDL[Exposed = Window]
interface BrowserCaptureMediaStreamTrack : MediaStreamTrack {
  Promise<undefined> cropTo(CropTarget? cropTarget);
  BrowserCaptureMediaStreamTrack clone();
};

cropTo()

このメソッドの呼び出しは、ビデオトラックを cropTarget.[[Element]] の境界クライアント矩形に合わせて切り抜くことを開始/停止するようユーザーエージェントに指示する。トラックは display-surface の可視ビューポートに制限されるため、キャプチャされる領域は、可視ビューポートと要素の境界クライアント矩形との交差部分になる。 cropTo が呼び出されるたびに、ユーザーエージェントは次のアルゴリズムを実行しなければ MUST ならない:

cropTarget が有効な CropTarget でも null でもない場合、ユーザーエージェントは UnknownError で拒否された Promise を返さなければ MUST ならない。
p を新しい Promise とする。
次の手順を並列に実行する:
1. cropTarget が undefined でも有効な CropTarget でもない場合、 p を NotAllowedError で拒否し、これらの手順を中止する。
2. cropTarget が undefined または有効な CropTarget のいずれかである場合、ユーザーエージェントは cropTarget に従って this ビデオトラックの切り抜き状態を更新しなければ MUST ならない:
  - cropTarget が undefined に設定された場合、ユーザーエージェントは切り抜きを停止しなければ MUST ならない。This ビデオトラックは未切り抜き状態に戻る。
  - cropTarget が有効な CropTarget である場合、ユーザーエージェントは this ビデオトラックを、この CropTarget によって参照される要素の輪郭に合わせて切り抜き始めなければ MUST ならない。これは、トラック上で生成される各新しいフレームについて、ユーザーエージェントがその要素に属するピクセルの境界ボックスを計算し、この境界ボックスの座標に合わせてフレームを切り抜くことを意味する。
3. このメソッド呼び出し前のトラックの状態を PRE-STATE と呼び、このメソッド呼び出し後の状態を POST-STATE と呼ぶ。ユーザーエージェントは、 PRE-STATE に従って切り抜かれた（または未切り抜きの）フレームがそれ以上アプリケーションに配信されないこと、およびアプリケーションに配信される追加のフレームがしたがって POST-STATE またはそれ以降の状態のいずれかに従って切り抜かれる（または未切り抜きになる）ことが保証されたとき、 p を解決しなければ MUST ならない。
  
  注記
  
  cropTo promise の解決タイミングおよびビデオフレームの実際の切り抜きタイミングは、 MediaStreamTrack transforms を通じて JavaScript から観測可能である。最初の新たに切り抜かれたビデオフレームは、cropTo promise が解決された直後に MediaStreamTrack ReadableStream にキュー投入されることが期待される。
p を返す。

clone()

BrowserCaptureMediaStreamTrack がクローンされるとき、ユーザーエージェントは、元のトラックの切り抜き状態に関係なく、初期状態で未切り抜きであるトラックを生成しなければ MUST ならない。

fromElement の呼び出しを通じて CropTarget が生成された Element を、潜在的な切り抜きターゲットと定義する。

cropTo の正常な呼び出しによってターゲットにされた潜在的な切り抜きターゲットを、 crop-session target と定義する。

切り抜き済みビデオトラック上に生成されたフレームを考える。ユーザーエージェントは、 (i) 最上位閲覧コンテキストのビューポートと、(ii) crop-session target に属するすべてのピクセルの境界ボックスとの交差部分を計算する。この交差部分を、そのフレームにおける crop-session target の座標と定義する。

指定された crop-session target TARGET に切り抜かれたビデオトラック VT 切り抜き済みを考える。 TARGET が被る変化に直面した際の、VT の crop-session の動作を定義する。

crop-session target が DOM に接続されているものの、最上位閲覧コンテキストのビューポート内に描画されるピクセルが 0 個である場合を、空の crop-session target と定義する。

注記

これが起こりうる例には次のものが含まれる:

crop-session target が 0 個のピクセルで構成される。
閲覧コンテキストのビューポートがスクロールされ、 crop-session target が現在ビューポートの外にある。

ユーザーエージェントは、空の crop-session target を持つトラック上で新しいフレームを生成しては MUST NOT ならない。そのようなトラックについて、トラックが未切り抜きになるか、またはその crop-session target が空でなくなった場合、ユーザーエージェントはフレームの生成を再開しなければ MUST ならない。

DOM から切り離された crop-session target を、切断された crop-session target と定義する。

空の crop-session target と切断された crop-session target の違いは、切断されたものは到達不能になる可能性があり、その場合は新しいフレームを生成しないことである。それにもかかわらず、ユーザーエージェントは切断された crop-session target を、空の crop-session target と同じように扱わなければ MUST ならない。アプリケーションは、 cropTo をトラックに対して undefined または新しい CropTarget のいずれかで呼び出すことができ、それによりトラック上のフレーム生成を再開できる。

領域キャプチャ

概要

この文書のステータス

1. 適合性

2. 定義

3. ユースケース

3.1 汎用的なユースケース

3.2 実用的なユースケース

4. ソリューション概要

5. CropTarget の生成

5.1 CropTarget の動機

5.2 `CropTarget` の定義

6. 切り抜き機構

6.1 BrowserCaptureMediaStreamTrack

6.2 Crop-Session の存続期間

6.2.1 Crop-Session の定義

6.2.2 Crop-Session のエッジケース

6.2.2.1 空の Crop-Target

6.2.2.2 切断された Crop-Session Target

7. サンプルコード

A. 参考文献

A.1 規範的参考文献

領域キャプチャ

概要

この文書のステータス

1. 適合性

2. 定義

3. ユースケース

3.1 汎用的なユースケース

3.2 実用的なユースケース

4. ソリューション概要

5. CropTarget の生成

5.1 CropTarget の動機

5.2 CropTarget の定義

6. 切り抜き機構

6.1 BrowserCaptureMediaStreamTrack

6.2 Crop-Session の存続期間

6.2.1 Crop-Session の定義

6.2.2 Crop-Session のエッジケース

6.2.2.1 空の Crop-Target

6.2.2.2 切断された Crop-Session Target

7. サンプルコード

A. 参考文献

A.1 規範的参考文献

5.2 `CropTarget` の定義