画面キャプチャ

要旨

この文書は、ユーザーの表示、またはその一部を、 getDisplayMedia を使用してメディアストリームのソースとして利用する方法を定義します。これは Media Capture API の拡張です [GETUSERMEDIA].

表示されているメディアのキャプチャは、getDisplayMedia という新しいメソッドを MediaDevices インターフェイスに追加することで有効になります。これは getUserMedia() に類似していますが、呼び出されるたびにエンドユーザーが選択した単一の表示デバイスからメディアを取得する点が異なります。

WebIDLpartial interface MediaDevices {
  Promise<MediaStream> getDisplayMedia(optional DisplayMediaStreamOptions options = {});
};

getDisplayMedia

ユーザーに対して表示のライブキャプチャの許可を求めます。

ユーザーエージェントは、エンドユーザーが毎回利用可能な選択肢の中から共有する表示面を選べるようにしなければならず（MUST）、options.video や options.audio に含まれるいかなる MediaTrackConstraints を用いてその選択を制限してはなりません（MUST NOT）。

ユーザーエージェントは、displaySurface 制約の存在およびその値を、ユーザーに提示するソースの表示に影響させることができます（MAY）。それでもユーザーエージェントは依然として任意の表示面を無制限に選択できるように提供しなければなりません（MUST）。ユーザーエージェントは、モニターの共有はリスクが高いためユーザーが選択しないよう促すことが強く推奨されます。

options.video や options.audio に含まれるいかなる MediaTrackConstraints も、ユーザーが選択を行った後にのみユーザーが選択したメディアへ適用されなければなりません（MUST）。

音声に関しては、ユーザーエージェントはエンドユーザーに共有するオーディオソースを提示してもよい（MAY）ものとします。どの選択肢を提示するかはユーザーエージェント次第であり、提示される音声ソースが必ずしもビデオソースと同一であるとは限りません。オーディオソースは特定のウィンドウ、ブラウザー、システム全体のオーディオ、あるいはそれらの組み合わせであり得ます。オーディオとビデオの両方を要求した場合でも、ユーザーエージェントはオーディオを返さないことが許されています。生涯にわたってオーディオが共有されないことが確実であるとユーザーエージェントが判断した場合、それは結果のストリームにオーディオトラックを含めてはなりません（MUST NOT）。ユーザーエージェントは、オーディオとビデオの要求に対してビデオトラックのみを返すか（MAY）、オーディオトラックとビデオトラックの両方を返すことができます（MAY）。ただし、オーディオのみの要求は拒否されなければなりません（MUST）。

getDisplayMedia は、異なるソース集合からメディアを取得しユーザー選択を要求する点に加え、getUserMedia() と異なり、"granted" の権限を永続化することはできません。

getDisplayMedia() が呼び出されると、ユーザーエージェントは次の手順を実行しなければなりません（MUST）：

mediaDevices をこの操作の this とします。
controller を options.controller が存在すればそれに、存在しなければ null にします。
もし controller が null でない場合、次の手順を実行します：
1. もし controller.[[IsBound]] が true であれば、reject された promise を、DOMException オブジェクト（そのname 属性が InvalidStateError の値を持つ）で返して終了します。
2. controller.[[IsBound]] を true に設定します。
もしこの操作の relevant global object が transient activation を持たない場合、reject された promise を、DOMException オブジェクト（そのname 属性が InvalidStateError の値を持つ）で返して終了します。
このメソッドの第一引数を options とします。
constraints を [options.audio, options.video] とします。
もし constraints.video が false であれば、新たに作成された reject された promise を、作成された TypeError で返します。
constraints の中で値 CS が辞書である既存の各メンバーについて、次の手順を実行します：
1. もし CS が advanced というメンバーを含むなら、新たに作成された作成された TypeError で拒否された promise を返します。
2. もし CS が表示面に適用可能な制約可能プロパティを指定する名前のメンバーを含み、その値がさらに min または exact というメンバーを含む辞書であるなら、新たに作成された作成された TypeError で拒否された promise を返します。
3. もし CS が表示面に適用可能な制約可能プロパティを指定する名前のメンバーを含み、その値がさらに max というメンバーを含み、そのメンバーの値が制約可能プロパティの floor value 未満であるなら、failedConstraint をそのメンバー名とし、message を undefined か説明的な人間可読のメッセージのいずれかとし、OverconstrainedError(failedConstraint, message) によって作成された新しいエラーで拒否された promise を返します。
requestedMediaTypes を、constraints のうち辞書値または true の値を持つメディア型の集合とします。
もしこの操作の current settings object の relevant global object に関連付けられた Document が完全にアクティブでない（fully active でない）か、フォーカスを持っていない（have focus でない）場合、reject された promise を、DOMException オブジェクト（そのname 属性が InvalidStateError の値を持つ）で返して終了します。
p を新しい promise とします。
次の手順を並列で実行します：
1. requestedMediaTypes の各メディア型 T について、
  1. もし型 T のソースが存在しない場合、ユーザーインタラクションタスクソースに対してタスクをキューし、p を新しい DOMException（そのname 属性が NotFoundError の値を持つ）で reject し、これらの手順を中止します。
  2. 現在の閲覧コンテキストで型 T のソースを取得するための権限状態を読み取ります。もし権限状態が "denied" であれば、下のラベル 許可失敗 にジャンプします。
2. 任意で、例えば事前に確立されたユーザープリファレンス、セキュリティ上の理由、あるいはプラットフォームの制約に基づいて、下のラベル 許可失敗 にジャンプしてもよい。
3. ユーザーに表示デバイスを選択させるよう促し、その結果として提供されるメディアの集合を得ます。これは PermissionDescriptor の name が "display-capture" に設定されたものとして扱います。
  
  提供されるメディアは正確に1つのビデオトラックを含まなければなりません（MUST）。
  
  提供されるメディアは最大で1つのオーディオトラックを含むことができます。このオーディオトラックは、requestedMediaTypes に音声が指定されていなかった場合、あるいはそれが false と指定されていた場合は含めてはなりません（MUST NOT）。
  
  選択されたデバイスはユーザーによって決定されたものでなければなりません（MUST）。一度選択されたら、ユーザーがユーザーエージェントとの相互作用を通じて許可しない限り、MediaStreamTrack のソースは変更してはなりません（MUST NOT）。
  
  ユーザーエージェントは、ブラウザーのウィンドウが可視であるブラウザー表示デバイスや、その他共有時に著しくリスクが高いと考えられるモニター表示デバイスの共有をユーザーに警告すること、またはそれらの選択を抑制しようとすることを推奨します。
  
  もし要求の結果が "granted" であれば、提供されたメディアのソースとなっている各デバイスについて、デバイスの安定かつプライベートな識別子である deviceId を用いて [[devicesLiveMap]][deviceId] を true に、もしまだ true でなければ [[devicesAccessibleMap]][deviceId] を true に設定します。
  
  ユーザーエージェントは "granted" の権限エントリを保存してはなりません（MUST NOT）。
  
  もし結果が "denied" であれば、下のラベル 許可失敗 にジャンプします。ユーザーが応答しない場合、このアルゴリズムはこのステップで停止します。
  
  ユーザーが許可したが、OS/プログラム/ウェブページのロック等のハードウェアエラーによりアクセスできない場合は、ユーザーインタラクションタスクソースにタスクをキューして p を新しい DOMException（そのname 属性が NotReadableError の値を持つ）で reject し、これらの手順を中止します。
  
  もし結果が "granted" であるにもかかわらず、上記以外の理由でデバイスアクセスが失敗した場合は、ユーザーインタラクションタスクソースにタスクをキューして p を新しい DOMException（そのname 属性が AbortError の値を持つ）で reject し、これらの手順を中止します。
4. stream を MediaStream オブジェクトとします。
5. ユーザーが許可した各 source について、次の手順を実行します：
  1. track を source と mediaDevices を用いて MediaStreamTrack を作成した結果とします。
  2. track を stream のトラック集合に追加します。
  3. Tie track source to MediaDevices を source と mediaDevices で実行します。
6. 適切な制約を用いて stream の全てのトラックに対して ApplyConstraints アルゴリズムを実行します。これが失敗した場合、失敗した結果を failedConstraint に、人間が読める説明を message にそれぞれ設定し、ユーザーインタラクションタスクソースにタスクをキューして p を OverconstrainedError(failedConstraint, message) で拒否し、これらの手順を中止します。
7. この getDisplayMedia() の呼び出しは、現在新しいキャプチャセッションを生成したものと見なされます。
8. ユーザーインタラクションタスクソースにタスクをキューして、次の手順を実行します：
  1. もし controller が null でない場合、次の手順を実行します：
    1. controller.[[Source]] を stream のビデオトラックの [[Source]] に設定します。
    2. controller.[[DisplaySurfaceType]] を、stream のビデオトラックの DisplayCaptureSurfaceType に設定します。
  2. last activation timestamp を現在の高解像度時刻に設定します。
  3. Resolve p を stream で完了させます。
9. もし controller が null でない場合、ユーザーインタラクションタスクソースにタスクをキューして controller に対して finalize focus decision algorithm を実行します。
10. これらの手順を中止します。
11. 許可失敗: ユーザーインタラクションタスクソースにタスクをキューして、p を新しい DOMException（そのname 属性が NotAllowedError の値を持つ）で reject します。
p を返します。

トップレベルのドキュメントがフォーカスを失ったとき、そのドキュメント内およびネストされた閲覧コンテキストのドキュメントにあるすべての CaptureController オブジェクトに対して次の手順を実行します：

もし [[Source]] が undefined であれば、これらの手順を中止します。
[[FocusChangeDisabled]] を true に設定します。

ユーザーエージェントは、部分的に透明なキャプチャされた表示面の背後にあるコンテンツをキャプチャしてはなりません（MUST NOT）。

新しく作成された MediaStreamTrack について、ユーザーエージェントはプロンプトとしてユーザーに表示した内容をキャプチャしてはなりません（MUST NOT）。

現在スクリーンにレンダリングされていない情報は、アプリケーションが明示的にそのコンテンツへアクセスする許可を得ていない限り（例：昇格された権限のような手段で）、キャプチャでは隠蔽されるべきです（SHOULD）。

ユーザーエージェントは、アクティブなユーザーの同意（例：active user consent）なしにオーディオを共有してはなりません（MUST NOT）。例えば、あるウィンドウのビデオをキャプチャする際にシステム全体のオーディオ（そのウィンドウに無関係なアプリケーションを含む）を同時にキャプチャするような場合が該当します。

共有されている表示面は、オペレーティングシステムやユーザーエージェントによる操作により、アプリケーションから一時的または永久にアクセスできなくなることがあります。どのような状態が表示面をアクセス不能とみなすかは本仕様の範囲外ですが、例としては MAY モニターが切断される、ウィンドウやブラウザが閉じられるまたは最小化される、あるいは電話の着信による場合などがあります。

注記

ユーザーエージェントは最終的にこの文脈で「アクセス不能」が何を意味するかを決定しますが、外部要因による中断に対してのみミュートおよびミュート解除イベントを発火することが推奨されます。

表示面が必ずしも永続的ではないアクセス不能状態に入ると、ユーザーエージェント MUST タスクをキューに登録し、ユーザー相互作用タスクソース上で、その対応するメディアトラックのミュート状態を true に設定するように操作します。

表示面がアクセス不能状態を抜けて再びアクセス可能になると、ユーザーエージェント MUST タスクをキューに登録し、ユーザー相互作用タスクソース上で、その対応するメディアトラックのミュート状態を false に設定するように操作します。

表示面が永続的なアクセス不能状態（例えばソースのウィンドウの閉鎖）の状態に入ると、ユーザーエージェント MUST タスクをキューに登録し、ユーザー相互作用タスクソース上で、その対応するメディアトラックを終了させなければなりません。

直前に getDisplayMedia によって返されたストリームは、デフォルトでミュートされているトラックを含むことが MAY あります。同じストリームに属するオーディオトラックとビデオトラックは、互いに独立してミュート／ミュート解除される MAY あります。

ソース選択のための制約を受け付けないということは、getDisplayMedia が音声、映像、または音声と映像の表示ソースが存在するかどうかを公開するフィンガープリンティングの側面のみを提供することを意味します。

displaySurface 制約を受け入れても、ユーザーの選択を制限するものではない点に注意してください。

制約は、getDisplayMedia においては、 getUserMedia() とは異なる目的を持ちます。それらは探索を助けるものではなく、ユーザー選択の後にのみ適用されます。

このセクションは、getDisplayMedia のトラックにどの制約が適用されるかを定義します；ここに記載されていない getUserMedia() 用に定義された制約は適用されません。

これらの制約のいくつかは、ダウンスケーリングやフレーム間引きなどのユーザーエージェントによる処理や、表示固有の機能を可能にします。その他は、ユーザーが選択した display surface の固有の特性を、機能や設定として観測可能にします。

以下の新規および既存の MediaStreamTrack の Constrainable Properties は、ユーザーが選択したビデオの display surface に適用され、以下の動作を持ちます：

Property Name	Type	Behavior
width	`unsigned long`	ピクセル単位の幅。能力として、max は MUST で display surface の幅を反映し、min はユーザーエージェントによるダウンスケーリングで利用可能な最小のアスペクト比を保持した表現の幅を反映しなければなりません。
height	`unsigned long`	ピクセル単位の高さ。能力として、max は MUST で display surface の高さを反映し、min はユーザーエージェントによるダウンスケーリングで利用可能な最小のアスペクト比を保持した表現の高さを反映しなければなりません。
frameRate	`double`	フレームレート（毎秒フレーム数）。能力として、max は MUST で display surface のフレームレートを反映し、min はユーザーエージェントによるフレーム間引きで利用可能な最低フレームレートを反映しなければなりません。
aspectRatio	`double`	正確なアスペクト比（ピクセル単位の幅を高さで割った値で、小数点第十位まで四捨五入した double）またはアスペクト比の範囲。設定としては `width / height` を表します。能力としては、min と max の両方が MUST で現在の設定値であり、このプロパティはアプリケーション側から見て変更不可能になります。
resizeMode	`DOMString`	この文字列は `VideoResizeModeEnum` のメンバーの一つです。設定として、"`none`" は `MediaStreamTrack` が表示を完全な詳細でレンダリングするために必要な全てのビットを含むことを意味します。もし `source pixel ratio > 1` であれば、`width` と `height` はエンドユーザーの見た目よりも大きくなります。一方で "`crop-and-scale`" は `MediaStreamTrack` がユーザーエージェントによってダウンスケールされた、ただしクロップされていないアスペクト比を保持した表示面の表現を含むことを意味します。能力として、値 "`none`" と "`crop-and-scale`" の両方が MUST で存在しなければなりません。
deviceId	`DOMString`	キャプチャされている表示面の識別子。設定としては、キャプチャされている display surface を識別します。識別子は各 document ごとに一意に生成されなければなりません。能力としては、設定値が単独の値であることが MUST であり、このプロパティはアプリケーション側から見て変更不可能になります。
displaySurface	`DOMString`	この文字列は `DisplayCaptureSurfaceType` のメンバーの一つです。設定としては、キャプチャされている display surface の種類を示します。能力としては、設定値が単独の値であることが MUST であり、このプロパティはアプリケーション側から見て変更不可能になります。制約としては、その値はアプリケーションが特定の display surface 種類をユーザーエージェントに好意的に示すことを意味します；ユーザーエージェントはその好みに従ってユーザーに提示するオプションの順序を並べ替えることを MAY あります。この制約は他の目的では無視され、したがって副作用（たとえば `OverconstrainedError` の原因になるなど）を引き起こすことはできません。
logicalSurface	`boolean`	設定として、`true` の値は logical display surface のキャプチャを示し、`false` の値は visible display surface のキャプチャを示します。能力として、この同じ値が単独で存在することが MUST であり、このプロパティはアプリケーション側から見て変更不可能になります。
cursor	`DOMString`	この文字列は `CursorCaptureConstraint` のメンバーの一つです。設定としては、キャプチャされる display surface にカーソルが含まれるかおよびそのタイミングを示します。能力として、ユーザーエージェントはこの `CursorCaptureConstraint` の中から、この display surface でサポート可能な値だけを含めなければなりません。
screenPixelRatio	`double`	設定として、これはページズームが 1.0、スケールファクターが 1.0 のときの CSS ピクセルのサイズを、ページズームやスケールファクターを用いて表示面のピクセルの垂直サイズで割った結果です。これは制約や能力として使用することはできません。

以下の新規および既存の MediaStreamTrack の Constrainable Properties は、ユーザーが選択したオーディオソースに適用され、以下の動作を持ちます：

Property Name Type Behavior

Property Name	Type	Behavior
restrictOwnAudio	`boolean`	設定として、この値はユーザーエージェントがソースに対して own audio restriction を適用しているかどうかを示します。制約として、このプロパティを制約することで、own audio restriction を有効または無効にしたソースを得ることができます。 own audio restriction が適用されている場合、ユーザーエージェントは MUST、`getDisplayMedia` を呼び出したドキュメントによって生成された音声をキャプチャ音声から除去しようと試みなければなりません。ユーザーエージェントが処理によって音声を除去できない場合は、そのドキュメントの音声をキャプチャ対象から除外することで音声を除去することを SHOULD します。これにより音声がまったくキャプチャされなくなる場合、ユーザーエージェントは再び音声をキャプチャできるようになるまでトラックをミュートしたままにしておくことが MUST です。
suppressLocalAudioPlayback	`boolean`	設定として、この値はアプリケーションがユーザーエージェントに対してソースに local audio playback suppression を適用するよう指示したかどうかを示します。制約として、この値はユーザーが browser の display surface のキャプチャを選択した場合にのみ意味を持ちます。その場合、`true` の値はユーザーエージェントがキャプチャされた browser の display surface に対して local audio playback suppression を行うことを SHOULD であることを示します。 local audio playback suppression が適用されている場合、ユーザーエージェントはローカルスピーカーへの音声の中継を停止することを SHOULD しますが、その音声は進行中のオーディオキャプチャの capture-sessions によっては引き続きキャプチャされなければなりません。この抑制はキャプチャされるドキュメントに対して観測可能であってはなりません。さらに、キャプチャしているドキュメントは自分が suppressLocalAudioPlayback を適用しているかどうかのみを観測でき、ユーザーエージェントでユーザーがこれを上書きしているかどうか（すなわち抑制が効果を持っているかどうか）は観測できません。複数の同時キャプチャが同じ browser の display surface に対して行われている場合、local audio playback suppression は、少なくとも一つのアクティブなオーディオキャプチャの capture-session が suppressLocalAudioPlayback を `true` に制約している限り適用することを SHOULD あります。

restrictOwnAudio

boolean

設定として、この値はユーザーエージェントがソースに対して own audio restriction を適用しているかどうかを示します。

制約として、このプロパティを制約することで、own audio restriction を有効または無効にしたソースを得ることができます。

own audio restriction が適用されている場合、ユーザーエージェントは MUST、getDisplayMedia を呼び出したドキュメントによって生成された音声をキャプチャ音声から除去しようと試みなければなりません。ユーザーエージェントが処理によって音声を除去できない場合は、そのドキュメントの音声をキャプチャ対象から除外することで音声を除去することを SHOULD します。これにより音声がまったくキャプチャされなくなる場合、ユーザーエージェントは再び音声をキャプチャできるようになるまでトラックをミュートしたままにしておくことが MUST です。

suppressLocalAudioPlayback

boolean

設定として、この値はアプリケーションがユーザーエージェントに対してソースに local audio playback suppression を適用するよう指示したかどうかを示します。

制約として、この値はユーザーが browser の display surface のキャプチャを選択した場合にのみ意味を持ちます。その場合、true の値はユーザーエージェントがキャプチャされた browser の display surface に対して local audio playback suppression を行うことを SHOULD であることを示します。

local audio playback suppression が適用されている場合、ユーザーエージェントはローカルスピーカーへの音声の中継を停止することを SHOULD しますが、その音声は進行中のオーディオキャプチャの capture-sessions によっては引き続きキャプチャされなければなりません。この抑制はキャプチャされるドキュメントに対して観測可能であってはなりません。さらに、キャプチャしているドキュメントは自分が suppressLocalAudioPlayback を適用しているかどうかのみを観測でき、ユーザーエージェントでユーザーがこれを上書きしているかどうか（すなわち抑制が効果を持っているかどうか）は観測できません。

複数の同時キャプチャが同じ browser の display surface に対して行われている場合、local audio playback suppression は、少なくとも一つのアクティブなオーディオキャプチャの capture-session が suppressLocalAudioPlayback を true に制約している限り適用することを SHOULD あります。

ユーザーが選択した display surface の基になるソースの固有のプロパティが変化する場合（例えばエンドユーザーがキャプチャされたウィンドウのサイズを変更した場合）や、これらの変化が一つ以上の制約可能プロパティの能力や設定を古くさせる場合、ユーザーエージェントは MUST タスクをキューに登録してユーザー相互作用タスクソース上で次の手順を実行する必要があります：

影響を受けるすべての制約可能プロパティを同時に更新します。

これが「過度の制約（overconstrained）」状況を引き起こす場合、ユーザーエージェントはその過度に制約している制約を、その過度の制約が続く限り無視しなければなりません。ユーザーエージェントはトラックをミュートしてはなりません。

注記

min や exact の制約が getDisplayMedia() 上で TypeError を発生させる一方、この仕様は track.applyConstraints() メソッドを変更しません。したがって、それらは値によって OverconstrainedError を発生させるか成功するかのいずれかになり得て、この「過度の制約」状況を引き起こす可能性があります。max 制約も例えば aspectRatio のようにこれを引き起こす可能性があります。本仕様はこれらを有用でないエッジケースと見なします。

SelectSettings アルゴリズムの目的のために、ユーザーエージェントは元の display surface のアスペクト比を保持する（最も近いピクセル単位まで）すべてのダウンスケールされた寸法の組み合わせと、フレーム間引きによって利用可能なフレームレートを、利用可能な settings dictionaries として考慮することを SHOULD です。

制約によるダウンスケーリングと間引きの効果は、実質的に fitness distance アルゴリズムによって支配されます。

意図としては、ユーザーエージェントが ideal の width、ideal height、および/または ideal frameRate が指定されている場合に、それらに近い出力を生成しつつ、常に元の display surface のアスペクト比を保持することです。

ユーザーエージェントは、明示的な制約が適用されていない限り、デフォルトで source pixel ratio によってダウンスケールすることを SHOULD です。

ユーザーエージェントはキャプチャされた出力を切り抜いては MUST NOT です。

ユーザーエージェントは、集約された display surface における高解像度や高フレームレートを保持する必要がある場合を除き、キャプチャされた出力をアップスケールしたり追加のフレームを生成しては MUST NOT です。

注記

max 制約タイプは、web アプリケーションが width や height のような制約可能なプロパティに対する最大の境界を提供できるようにします。これは、エンドユーザーがキャプチャ中に window や browser の表面を極端にリサイズした場合の極端なアスペクト比を制限するのに役立ちます。

本仕様の正の数値型の各制約可能プロパティについて、ユーザーエージェントはソースに関わらずサポートされる最小許容値を表す floor value を確立しなければなりません。この値は一定であり MUST で MUST 0 より大きくなければなりません。ユーザーエージェントは、ソースに関係なく floor value より大きいすべての値をサポートすることが推奨されます。

注記

floor value の目的は、ユーザーが既にプロンプトされた後に getDisplayMedia() が OverconstrainedError で失敗するのを回避し、ユーザーのシステムに関する情報漏洩を避ける手助けをすることです。

これは、アプリケーションが setFocusBehavior() を呼び出したときに、ユーザーエージェントが当該 display surface に関連付けられたその CaptureController の capture-session にフォーカスするかどうかを記述します。

WebIDLenum CaptureStartFocusBehavior {
  "focus-capturing-application",
  "focus-captured-surface",
  "no-focus-change"
};

列挙の説明
`focus-capturing-application`	アプリケーション自身がフォーカスされることを優先します。
`focus-captured-surface`	この display surface に関連付けられたこの `CaptureController` の capture-session がフォーカスされることをアプリケーションが希望していることを示します。
`no-focus-change`	アプリケーションは、ユーザーエージェントがフォーカスを変更せず、ユーザーのエージェントやオペレーティングシステムとのやり取りの結果で最後にフォーカスを持っていた表面にフォーカスを残すことを希望します。

注記

ワーキンググループは "no-focus-change" を非推奨にする可能性を検討しています。

CaptureController オブジェクトは capture-session に関連付けられる場合があります。これは、getDisplayMedia() の呼び出しやその結果のストリームやトラックではなく、capture-session 自体に関連付けられた機能を公開するために使用されます。

任意の capture-session は、最多で1つの CaptureController に関連付けられます。

任意の CaptureController は、最多で1つの capture-session に関連付けられます。

WebIDL[Exposed=Window, SecureContext]
interface CaptureController : EventTarget {
  constructor();
  undefined setFocusBehavior(CaptureStartFocusBehavior focusBehavior);
};

(実現可能性のリスク) Issue 1

CaptureController はまだイベントハンドラーを定義していないため、EventTarget を継承する必要はありません。これは、将来的に CaptureController をイベントハンドラー属性で拡張する仕様のためのメリットです。継承が使用されていない場合、それを削除することができます。

constructor

新しい CaptureController オブジェクトを次の内部スロットで作成します：

内部スロット	初期値	説明 (非規範的)
[[IsBound]]	`false`	アプリケーションが this を capture-session に関連付けようとしたかどうか。
[[Source]]	`null`	関連付けられた capture-session のソース。
[[DisplaySurfaceType]]	`null`	キャプチャが開始された後、キャプチャされた display surface のタイプに設定されます。
[[FocusChangeDisabled]]	`false`	外部イベントやユーザーエージェントの考慮により、フォーカス変更が無効化されたかどうか。
[[FocusDecisionFinalized]]	`false`	フォーカスの決定が確定されたときに true に設定されます。
[[FocusBehavior]]	`null`	アプリケーションによって希望されるフォーカス動作。

ユーザーエージェントは、自身のロジックに基づいて任意の時点で [[FocusChangeDisabled]] を true に設定することを MAY です。

setFocusBehavior

次の手順を実行します：

メソッドの最初の引数を focusBehavior とする。
もし this.[[Source]] が null である場合、this.[[FocusBehavior]] に focusBehavior を設定し、これらのステップを中止する。
もし this.[[Source]] が停止されていた場合、throw an "InvalidStateError" DOMException をスローする。
もし this.[[DisplaySurfaceType]] が "browser" または "window" のいずれでもない場合、throw an "InvalidStateError" DOMException をスローする。
もし this.[[FocusDecisionFinalized]] が true である場合、throw an "InvalidStateError" DOMException をスローする。
this.[[FocusBehavior]] に focusBehavior を設定する。
finalize focus decision algorithm を this に対して実行する。

finalize focus decision algorithm とは、与えられた controller に対して次の手順を実行することを指します：

もし capture-session が開始されてから過度の時間が経過している場合、ユーザーエージェントは SHOULD [[FocusDecisionFinalized]] を true に設定する。時間の範囲はユーザーエージェントに委ねられていますが、1秒の値を使用することが推奨されます。
もし controller.[[FocusDecisionFinalized]] が true の場合、これらのステップを中止する。
controller.[[FocusDecisionFinalized]] を true に設定する。
もし controller.[[FocusChangeDisabled]] が true の場合、これらのステップを中止する。
もし controller.[[DisplaySurfaceType]] が "browser" または "window" のいずれでもない場合、これらのステップを中止する。
controller.[[FocusBehavior]] を focusBehavior とする。
次のステップを並行して実行する：
1. もし focusBehavior が "focus-capturing-application" の場合、キャプチャ文書を表す display surface にフォーカスする。
2. もし focusBehavior が "focus-captured-surface" の場合、 controller.[[Source]] によって参照される display surface にフォーカスする。

アプリケーションが、自身が存在する display surface を、ユーザーに提示される選択肢に含めるべきかどうかについて提供できるさまざまなヒントを記述します。

WebIDLenum SelfCapturePreferenceEnum {
  "include",
  "exclude"
};

列挙値	説明
`include`	アプリケーションは、表示面が提示される選択肢に含まれることを希望します。
`exclude`	アプリケーションは、表示面が提示される選択肢から除外されることを希望します。

アプリケーションが getDisplayMedia() を呼び出す際、monitor display surfaces に対して、ユーザーに提示されるオーディオソースにシステムオーディオを含めるかどうかを記述します。他の種類の display surface には適用されません。

WebIDLenum SystemAudioPreferenceEnum {
  "include",
  "exclude"
};

列挙の説明
`include`	アプリケーションは、monitor display surfaces に対して、システムオーディオを共有するオプションがユーザーに提示されることを希望します。
`exclude`	アプリケーションは、monitor display surfaces に対して、システムオーディオを共有するオプションがユーザーに提示されないことを希望します。

アプリケーションが getDisplayMedia() を呼び出す際、window display surfaces に対して、ユーザーに提示されるオーディオソースにウィンドウまたはシステムオーディオを含めるかどうかを記述します。

WebIDLenum WindowAudioPreferenceEnum {
  "system",
  "window",
  "exclude"
};

列挙の説明
`system`	アプリケーションは、window display surfaces に対して、システムオーディオを共有するオプションがユーザーに提示されることを希望します。
`window`	アプリケーションは、window display surfaces に対して、ウィンドウオーディオを共有するオプションがユーザーに提示されることを希望します。
`exclude`	アプリケーションは、window display surfaces に対して、オーディオを共有するオプションがユーザーに提示されないことを希望します。

アプリケーションが getDisplayMedia() を呼び出す際、キャプチャ中にソースの display surface を動的に切り替えるオプションをユーザーに提供するかどうかを記述します。

WebIDLenum SurfaceSwitchingPreferenceEnum {
  "include",
  "exclude"
};

列挙の説明
`include`	アプリケーションは、キャプチャ中にソースの display surface を動的に切り替えるオプションがユーザーに提示されることを希望します。
`exclude`	アプリケーションは、キャプチャ中にソースの display surface を動的に切り替えるオプションがユーザーに提示されないことを希望します。

アプリケーションが、ユーザーエージェントに対して、その種類が monitor である display surfaces をユーザーに選択肢として提示するオプションを提供することを希望するかどうかを記述します。

WebIDLenum MonitorTypeSurfacesEnum {
  "include",
  "exclude"
};

列挙の説明
`include`	アプリケーションは、ユーザーに提示される display surfaces に、種類が monitor のものが含まれることを希望します。
`exclude`	アプリケーションは、ユーザーに提示される display surfaces に、種類が monitor のものが含まれないことを希望します。

DisplayMediaStreamOptions 辞書は、ユーザーエージェントに対して、MediaStreamTrack を含める方法を指定します。 MediaStream によって返される getDisplayMedia。

WebIDLdictionary DisplayMediaStreamOptions {
  (boolean or MediaTrackConstraints) video = true;
  (boolean or MediaTrackConstraints) audio = false;
  CaptureController controller;
  SelfCapturePreferenceEnum selfBrowserSurface;
  SystemAudioPreferenceEnum systemAudio;
  WindowAudioPreferenceEnum windowAudio;
  SurfaceSwitchingPreferenceEnum surfaceSwitching;
  MonitorTypeSurfacesEnum monitorTypeSurfaces;
};

video 型 (boolean or MediaTrackConstraints), デフォルト値は true: true の場合、返される MediaStream にビデオトラックを含むようにリクエストします。Constraints 構造体が提供されている場合、ユーザーが選択した表示面のビデオトラック表現に適用される必要な処理オプションをさらに指定します。false の場合、リクエストは拒否され、TypeError として、getDisplayMedia アルゴリズムに従いエラーになります。
audio 型 (boolean or MediaTrackConstraints), デフォルト値は false: true の場合、返される MediaStream にオーディオトラックが含まれることを示します（サポートされている場合）。Constraints 構造体が提供されている場合、オーディオトラックに適用される必要な処理オプションをさらに指定します。false の場合、MediaStream にオーディオトラックは含まれません。
controller 型 CaptureController: 存在する場合、この CaptureController オブジェクトは capture-session に関連付けられます。このオブジェクトで公開されるメソッドを通じて、capture-session を操作できます。
selfBrowserSurface 型 SelfCapturePreferenceEnum: 存在する場合、ブラウザの表示面がユーザーに提示される選択肢に含まれるべきかどうかについて、アプリケーションの希望を示します。ユーザーエージェントはこのヒントを無視することが MAY あります。
systemAudio 型 SystemAudioPreferenceEnum: 存在する場合、選択肢に対してシステムオーディオを含めるべきかどうか、アプリケーションの意図を示します。ユーザーエージェントはこのヒントを無視することが MAY あります。
windowAudio 型 WindowAudioPreferenceEnum: 存在する場合、ウィンドウまたはシステムオーディオを選択肢に含めるべきかどうか、アプリケーションの意図を示します。ユーザーエージェントはこのヒントを無視することが MAY あります。
surfaceSwitching 型 SurfaceSwitchingPreferenceEnum: 存在する場合、キャプチャされた表示面を動的に切り替えるオプションを提供するべきかどうか、アプリケーションの意図を示します。ユーザーエージェントはこのヒントを無視することが MAY あります。
monitorTypeSurfaces 型 MonitorTypeSurfacesEnum: 存在する場合、モニター型の表示面を選択肢に含めるべきかどうか、アプリケーションの意図を示します。ユーザーエージェントはこのヒントを無視することが MAY あります。

注記

ユーザーエージェントは、モニター型の表示面を選択肢に含めるオプションをユーザーに提示することが依然として可能です。そのため、アプリケーションは受け取ったトラックの displaySurface 設定を確認することが推奨されます。

MediaTrackSupportedConstraints は、ユーザーエージェントが認識する制約リストでここで拡張されます。

WebIDLpartial dictionary MediaTrackSupportedConstraints {
  boolean displaySurface = true;
  boolean logicalSurface = true;
  boolean cursor = true;
  boolean restrictOwnAudio = true;
  boolean suppressLocalAudioPlayback = true;
};

displaySurface 型 boolean, デフォルト値は true: displaySurface 制約が認識されるかどうか。
logicalSurface 型 boolean, デフォルト値は true: logicalSurface 制約が認識されるかどうか。
cursor 型 boolean, デフォルト値は true: cursor 制約が認識されるかどうか。
restrictOwnAudio 型 boolean, デフォルト値は true: restrictOwnAudio 制約が認識されるかどうか。
suppressLocalAudioPlayback 型 boolean, デフォルト値は true: suppressLocalAudioPlayback 制約が認識されるかどうか。

MediaTrackConstraintSet は、制約の現在の状態を読み取るために使用されます。

WebIDLpartial dictionary MediaTrackConstraintSet {
  ConstrainDOMString displaySurface;
  ConstrainBoolean logicalSurface;
  ConstrainDOMString cursor;
  ConstrainBoolean restrictOwnAudio;
  ConstrainBoolean suppressLocalAudioPlayback;
};

displaySurface 型 ConstrainDOMString: キャプチャされている表示面のタイプ。これは DisplayCaptureSurfaceType 列挙から値を取得します。
logicalSurface 型 ConstrainBoolean: true の値は、論理表示面のキャプチャを示し、false の値は可視表示面のキャプチャを示します。
cursor 型 ConstrainDOMString: CursorCaptureConstraint 列挙から値を取得し、キャプチャされた表示面にカーソルを含めるか及びそのタイミングを決定します。
restrictOwnAudio 型 ConstrainBoolean: この制約はオーディオトラックにのみ適用されます。詳細は restrictOwnAudio を参照してください。
suppressLocalAudioPlayback 型 ConstrainBoolean: この制約はオーディオトラックにのみ適用されます。詳細は suppressLocalAudioPlayback を参照してください。

getSettings() メソッドがビデオストリームトラックで呼び出された場合、ユーザーエージェントは基盤となるユーザーエージェントの現在の状態を表す拡張された MediaTrackSettings 辞書を返さなければなりません。

WebIDLpartial dictionary MediaTrackSettings {
  DOMString displaySurface;
  boolean logicalSurface;
  DOMString cursor;
  boolean restrictOwnAudio;
  boolean suppressLocalAudioPlayback;
  double screenPixelRatio;
};

displaySurface 型 DOMString: キャプチャされている表示面のタイプ。これは DisplayCaptureSurfaceType 列挙から値を取得します。
logicalSurface 型 boolean: true の値は論理表示面のキャプチャを示し、false の値は可視表示面のキャプチャを示します。
cursor 型 DOMString: CursorCaptureConstraint 列挙から値を取得し、キャプチャされた表示面にカーソルを含めるか及びそのタイミングを決定します。
restrictOwnAudio 型 boolean: restrictOwnAudio 制約が適用されているか (true)、されていないか (false) を示します。
suppressLocalAudioPlayback 型 boolean: アプリケーションがソースに対してローカルオーディオ再生抑制を適用するようユーザーエージェントに指示したかどうかを示します。
screenPixelRatio 型 double: キャプチャされている表示面の画素比。

getCapabilities() メソッドがビデオストリームトラックで呼び出された場合、ユーザーエージェントは基盤となるユーザーエージェントの機能を表す拡張された MediaTrackCapabilities 辞書を返さなければなりません。

WebIDLpartial dictionary MediaTrackCapabilities {
  DOMString displaySurface;
  boolean logicalSurface;
  sequence<DOMString> cursor;
};

displaySurface 型 DOMString: MUST は getSettings() によって返される値と同じでなければならず、アプリケーションの観点からこのプロパティは変更不可能です。
logicalSurface 型 boolean: MUST は getSettings() によって返される値と同じでなければならず、アプリケーションの観点からこのプロパティは変更不可能です。
cursor 型 sequence<DOMString>: MUST は、ユーザーエージェントがこのトラックのためにサポート可能な CursorCaptureConstraint からの値の正確なセットで構成されなければなりません。

DisplayCaptureSurfaceType 列挙は、異なる種類の表示面を記述します。

WebIDLenum DisplayCaptureSurfaceType {
  "monitor",
  "window",
  "browser"
};

列挙値	説明
`monitor`	モニター、表示面、物理的表示、または物理的表示の集合
`window`	ウィンドウ、表示面、または単一のアプリケーションウィンドウ
`browser`	ブラウザ、表示面、または単一のブラウザウィンドウ

CursorCaptureConstraint 列挙は、カーソルがキャプチャされる条件を列挙します。

WebIDLenum CursorCaptureConstraint {
  "never",
  "always",
  "motion"
};

列挙値	説明
`never`	"`never`" カーソルキャプチャ制約は、キャプチャされた表示面からカーソルを省略します。
`always`	"`always`" カーソルキャプチャ制約は、キャプチャされた表示面にカーソルを含めます。
`motion`	"`motion`" カーソルキャプチャ制約は、カーソル／ポインターが移動したときにキャプチャされた表示面にカーソルを含めます。ポインター／カーソルの移動が一定時間（ユーザーエージェントによって決定される）停止すると、キャプチャされたカーソルは削除されます。

キャプチャの潜在的なソースは、このAPIによって個別のメディアソースとして扱われます。しかし、表示キャプチャソースは、ホストシステムに関する過剰な情報を明らかにするため、enumerateDevices() によって列挙されてはなりません。

したがって、表示キャプチャソースは、その deviceId が公開されていないため、deviceId 制約を使用して選択することはできません。

注記

これは、プライバシーインジケーターを実装するアルゴリズムで使用される同名の安定かつプライベートなIDと混同しないでください。

画面キャプチャ

要旨

この文書の状態

1. 導入

2. 適合性

3. 例

4. 用語

5. 表示メディアのキャプチャ

5.1 MediaDevices の追加

5.2 クローズまたは最小化された表示面

5.3 制約のない表示面の選択

5.4 キャプチャされた表示面に対する制約可能なプロパティ

5.4.1 ダウンスケーリングとフレーム間引き

5.4.2 CaptureStartFocusBehavior

5.4.3 CaptureController

5.4.4 SelfCapturePreferenceEnum

5.4.5 SystemAudioPreferenceEnum

5.4.6 WindowAudioPreferenceEnum

5.4.7 SurfaceSwitchingPreferenceEnum

5.4.8 MonitorTypeSurfacesEnum

5.4.9 DisplayMediaStreamOptions

辞書 DisplayMediaStreamOptions メンバー

5.4.10 MediaTrackSupportedConstraints の拡張

5.4.11 MediaTrackConstraintSet の拡張

5.4.12 MediaTrackSettings の拡張

5.4.13 MediaTrackCapabilities の拡張

5.4.14 DisplayCaptureSurfaceType

5.4.15 CursorCaptureConstraint

5.5 デバイス識別子

6. 権限の統合

7. 権限ポリシーの統合

8. プライバシーインジケーター要件

9. セキュリティと権限

9.1 論理的または可視的な表示面のキャプチャ

9.1.1 オーディオのキャプチャ

9.2 ディスプレイキャプチャの許可

9.2.1 アクティブなユーザーの同意

9.2.2 昇格された権限

9.2.3 昇格された権限に依存する能力

9.3 キャプチャ中のフィードバックとインターフェース

A. 参考文献

A.1 規範的参考文献

A.2 参考情報

5.1 `MediaDevices` の追加

5.4.2 `CaptureStartFocusBehavior`

5.4.3 `CaptureController`

5.4.4 `SelfCapturePreferenceEnum`

5.4.5 `SystemAudioPreferenceEnum`

5.4.6 `WindowAudioPreferenceEnum`

5.4.7 `SurfaceSwitchingPreferenceEnum`

5.4.8 `MonitorTypeSurfacesEnum`

辞書 `DisplayMediaStreamOptions` メンバー

5.4.10 `MediaTrackSupportedConstraints` の拡張

5.4.11 `MediaTrackConstraintSet` の拡張

5.4.12 `MediaTrackSettings` の拡張

5.4.13 `MediaTrackCapabilities` の拡張

5.4.14 `DisplayCaptureSurfaceType`

5.4.15 `CursorCaptureConstraint`