Context Navigation

← Previous Changeset
Next Changeset →

Changeset 248606 in webkit

Timestamp:

Aug 13, 2019 12:49:40 PM (5 years ago)

Author:

Justin Fan

Message:

[WebGPU] Improve GPUBindGroup performance using one device-shared argument MTLBuffer
https://bugs.webkit.org/show_bug.cgi?id=200606

Reviewed by Myles C. Maxfield.

Source/WebCore:

Manage all argument buffer storage for GPUBindGroups in one large MTLBuffer for a GPUDevice.
Vastly improves GPUProgrammablePassEncoder.setBindGroup performance; in alpha MotionMark WebGPU benchmark,
score improves from ~12000 to ~90000.

No expected change in WebGPU behavior, though bind-groups.html has been updated to cover more cases.

Modules/webgpu/WebGPUDevice.cpp:

(WebCore::WebGPUDevice::createBindGroup const):

SourcesCocoa.txt:
WebCore.xcodeproj/project.pbxproj:
platform/graphics/gpu/GPUBindGroup.h: No longer manages one unique MTLBuffer per MTLArgumentEncoder.

(WebCore::GPUBindGroup::argumentBuffer const): Delegates to GPUBindGroupAllocator for current argument buffer.
(WebCore::GPUBindGroup::vertexArgsBuffer const): Deleted.
(WebCore::GPUBindGroup::fragmentArgsBuffer const): Deleted.
(WebCore::GPUBindGroup::computeArgsBuffer const): Deleted.

platform/graphics/gpu/GPUBindGroupAllocator.h: Added. Allocates MTLBuffer for and assigns offsets for argument buffers.

(WebCore::GPUBindGroupAllocator::argumentBuffer const):

platform/graphics/gpu/GPUBindGroupLayout.h:
platform/graphics/gpu/GPUBuffer.h: Move MTLResourceUsage calculation to GPUBuffer construction.

(WebCore::GPUBuffer::platformUsage const):

platform/graphics/gpu/GPUComputePassEncoder.h: Prevent any potiential narrowing issues, as offset can be large.
platform/graphics/gpu/GPUDevice.cpp: Now owns a GPUBindGroupAllocator for owning all its argument buffer storage.

(WebCore::GPUDevice::tryCreateBindGroup const):

platform/graphics/gpu/GPUDevice.h:
platform/graphics/gpu/GPUProgrammablePassEncoder.h:

(WebCore::GPUProgrammablePassEncoder::setVertexBuffer):
(WebCore::GPUProgrammablePassEncoder::setFragmentBuffer):
(WebCore::GPUProgrammablePassEncoder::setComputeBuffer):

platform/graphics/gpu/GPURenderPassEncoder.h:
platform/graphics/gpu/GPUTexture.h: Move MTLResourceUsage calculation to GPUTexture construction.

(WebCore::GPUTexture::platformUsage const):

platform/graphics/gpu/cocoa/GPUBindGroupAllocatorMetal.mm: Added.

(WebCore::GPUBindGroupAllocator::create):
(WebCore::GPUBindGroupAllocator::GPUBindGroupAllocator):
(WebCore::GPUBindGroupAllocator::allocateAndSetEncoders): Ensures that MTLArgumentEncoders have appropriate allocation for encoding.
(WebCore::GPUBindGroupAllocator::reallocate): Create new MTLBuffer large enough for new encoder requirement, and copy over old argument buffer data.
(WebCore::GPUBindGroupAllocator::tryReset): For now, resets argument buffer if all GPUBindGroups created with this allocator are destroyed.

platform/graphics/gpu/cocoa/GPUBindGroupMetal.mm:

(WebCore::tryGetResourceAsBufferBinding): Add size check.
(WebCore::GPUBindGroup::tryCreate): No longer owns new MTLBuffers. Requests argument buffer space from GPUBindGroupAllocator.
(WebCore::GPUBindGroup::GPUBindGroup):
(WebCore::GPUBindGroup::~GPUBindGroup): Remind allocator to check for possible reset.
(WebCore::tryCreateArgumentBuffer): Deleted.

platform/graphics/gpu/cocoa/GPUBufferMetal.mm:

(WebCore::GPUBuffer::GPUBuffer):

platform/graphics/gpu/cocoa/GPUComputePassEncoderMetal.mm:

(WebCore::GPUComputePassEncoder::setComputeBuffer):

platform/graphics/gpu/cocoa/GPUDeviceMetal.mm:
platform/graphics/gpu/cocoa/GPUProgrammablePassEncoderMetal.mm:

(WebCore::GPUProgrammablePassEncoder::setBindGroup): No need to recalculate usage every time. Set appropriate argument buffer and offsets for new bind group model.

platform/graphics/gpu/cocoa/GPURenderPassEncoderMetal.mm:

(WebCore::GPURenderPassEncoder::setVertexBuffer):
(WebCore::GPURenderPassEncoder::setFragmentBuffer):

platform/graphics/gpu/cocoa/GPUTextureMetal.mm:

(WebCore::GPUTexture::GPUTexture):

LayoutTests:

Update bind-groups.html to better stress GPUBindGroup implementation.

webgpu/bind-groups-expected.txt:
webgpu/bind-groups.html:

Location:

trunk

Files:

: 1 added
: 23 edited
: 1 copied

LayoutTests/ChangeLog (modified) (1 diff)
LayoutTests/webgpu/bind-groups-expected.txt (modified) (1 diff)
LayoutTests/webgpu/bind-groups.html (modified) (1 diff)
Source/WebCore/ChangeLog (modified) (1 diff)
Source/WebCore/Modules/webgpu/WebGPUDevice.cpp (modified) (1 diff)
Source/WebCore/SourcesCocoa.txt (modified) (1 diff)
Source/WebCore/WebCore.xcodeproj/project.pbxproj (modified) (5 diffs)
Source/WebCore/platform/graphics/gpu/GPUBindGroup.h (modified) (4 diffs)
Source/WebCore/platform/graphics/gpu/GPUBindGroupAllocator.h (copied) (copied from trunk/Source/WebCore/platform/graphics/gpu/GPUBindGroup.h) (1 diff)
Source/WebCore/platform/graphics/gpu/GPUBindGroupLayout.h (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/GPUBuffer.h (modified) (2 diffs)
Source/WebCore/platform/graphics/gpu/GPUComputePassEncoder.h (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/GPUDevice.cpp (modified) (2 diffs)
Source/WebCore/platform/graphics/gpu/GPUDevice.h (modified) (5 diffs)
Source/WebCore/platform/graphics/gpu/GPUProgrammablePassEncoder.h (modified) (2 diffs)
Source/WebCore/platform/graphics/gpu/GPURenderPassEncoder.h (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/GPUTexture.h (modified) (2 diffs)
Source/WebCore/platform/graphics/gpu/cocoa/GPUBindGroupAllocatorMetal.mm (added)
Source/WebCore/platform/graphics/gpu/cocoa/GPUBindGroupMetal.mm (modified) (7 diffs)
Source/WebCore/platform/graphics/gpu/cocoa/GPUBufferMetal.mm (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/cocoa/GPUComputePassEncoderMetal.mm (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/cocoa/GPUDeviceMetal.mm (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/cocoa/GPUProgrammablePassEncoderMetal.mm (modified) (1 diff)
Source/WebCore/platform/graphics/gpu/cocoa/GPURenderPassEncoderMetal.mm (modified) (2 diffs)
Source/WebCore/platform/graphics/gpu/cocoa/GPUTextureMetal.mm (modified) (1 diff)

Legend:

: Unmodified
: Added
: Removed

trunk/LayoutTests/ChangeLog

-                      r248604
+                      r248606
+-08-13  Justin Fan  <justin_fan@apple.com>
+        [WebGPU] Improve GPUBindGroup performance using one device-shared argument MTLBuffer
+        https://bugs.webkit.org/show_bug.cgi?id=200606
+        Reviewed by Myles C. Maxfield.
+        Update bind-groups.html to better stress GPUBindGroup implementation.
+        * webgpu/bind-groups-expected.txt:
+        * webgpu/bind-groups.html:
 -08-13  Antti Koivisto  <antti@apple.com>

trunk/LayoutTests/webgpu/bind-groups-expected.txt

-                      r244856
+                      r248606
+PASS Create a basic GPUBindGroup via GPUDevice.
+PASS Create and use a basic GPUBindGroup.
+PASS Create and use many GPUBindGroups in a single compute pass.
+PASS Create and access a uniform-buffer in a GPUBindGroup.
+PASS Create and access a sampled texture in a GPUBindGroup.
+PASS Create and use multiple GPUBindGroups in a single dispatch.
+PASS Bind a single GPUBuffer with different offsets in different GPUBindGroups

trunk/LayoutTests/webgpu/bind-groups.html

-                      r247289
+                      r248606
 <script src="../resources/testharnessreport.js"></script>
 <script>
+promise_test(() => {
+    return getBasicDevice().then(function(device) {
+        // GPUBindGroupLayoutBindings
+        // FIXME: Also test sampled texture bindings.
+        const bufferLayoutBinding = {
+let tests = {};
+const basicBufferShader = `
+[numthreads(1, 1, 1)]
+compute void compute_main(device int[] buffer : register(u0))
+{
+    ++buffer[0];
+}
+`;
+let basicPipeline;
+tests["Create and use a basic GPUBindGroup."] = async device => {
+    const bufferLayoutBinding = {
+        binding: 0,
+        visibility: GPUShaderStageBit.COMPUTE,
+        type: "storage-buffer"
+    };
+    const bindGroupLayout = device.createBindGroupLayout({ bindings: [bufferLayoutBinding] });
+    const basicBuffer = device.createBuffer({ size: 4, usage: GPUBufferUsage.STORAGE | GPUBufferUsage.MAP_READ });
+    const bufferBinding = { buffer: basicBuffer, size: 4 };
+    const bindGroupBinding = { binding: 0, resource: bufferBinding };
+    const bindGroup = device.createBindGroup({ layout: bindGroupLayout, bindings: [bindGroupBinding] });
+    const pipelineLayout = device.createPipelineLayout({ bindGroupLayouts: [bindGroupLayout] });
+    const basicShaderModule = device.createShaderModule({ code: basicBufferShader, isWHLSL: true });
+    basicPipeline = device.createComputePipeline({
+        layout: pipelineLayout,
+        computeStage: {
+            module: basicShaderModule,
+            entryPoint: "compute_main"
+        }
+    });
+    const commandEncoder = device.createCommandEncoder();
+    const passEncoder = commandEncoder.beginComputePass();
+    passEncoder.setPipeline(basicPipeline);
+    passEncoder.setBindGroup(0, bindGroup);
+    passEncoder.dispatch(1, 1, 1);
+    passEncoder.endPass();
+    device.getQueue().submit([commandEncoder.finish()]);
+    const results = new Int32Array(await basicBuffer.mapReadAsync());
+    basicBuffer.unmap();
+    assert_equals(results[0], 1, "Storage buffer binding written to successfully.");
+};
+tests["Create and use many GPUBindGroups in a single compute pass."] = async device => {
+    const bufferLayoutBinding = {
+        binding: 0,
+        visibility: GPUShaderStageBit.COMPUTE,
+        type: "storage-buffer"
+    };
+    const bindGroupLayout = device.createBindGroupLayout({ bindings: [bufferLayoutBinding] });
+    const basicBuffer = device.createBuffer({ size: 4, usage: GPUBufferUsage.STORAGE | GPUBufferUsage.MAP_READ });
+    const bufferBinding = { buffer: basicBuffer, size: 4 };
+    const bindGroupBinding = { binding: 0, resource: bufferBinding };
+    const numGroups = 1000;
+    let bindGroups = new Array(numGroups);
+    for (let i = 0; i < numGroups; ++i)
+        bindGroups[i] = device.createBindGroup({ layout: bindGroupLayout, bindings: [bindGroupBinding] });
+    const commandEncoder = device.createCommandEncoder();
+    const passEncoder = commandEncoder.beginComputePass();
+    let j = 0;
+    for (; j < numGroups; ++j) {
+        passEncoder.setPipeline(basicPipeline);
+        passEncoder.setBindGroup(0, bindGroups[j]);
+        passEncoder.dispatch(1, 1, 1);
+    }
+    passEncoder.endPass();
+    device.getQueue().submit([commandEncoder.finish()]);
+    const results = new Int32Array(await basicBuffer.mapReadAsync());
+    basicBuffer.unmap();
+    assert_equals(results[0], j, "Storage buffer accessed successfully through multiple bind groups.");
+};
+const uniformBufferShader = `
+[numthreads(1, 1, 1)]
+compute void compute_main(constant int[] uniforms : register(b0), device int[] buffer : register(u1))
+{
+    buffer[0] += uniforms[0];
+}
+`;
+tests["Create and access a uniform-buffer in a GPUBindGroup."] = async device => {
+    const [uniformBuffer, writeArrayBuffer] = device.createBufferMapped({ size: 4, usage: GPUBufferUsage.UNIFORM });
+    new Int32Array(writeArrayBuffer).set([42]);
+    uniformBuffer.unmap();
+    const storageBuffer = device.createBuffer({ size: 4, usage: GPUBufferUsage.STORAGE | GPUBufferUsage.MAP_READ });
+    const bindGroupLayout = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "uniform-buffer"
+        }, {
             binding: 1,
             visibility: GPUShaderStageBit.VERTEX,
+            visibility: GPUShaderStageBit.COMPUTE,
             type: "storage-buffer"
+        };
+        const bindGroupLayout = device.createBindGroupLayout({ bindings: [bufferLayoutBinding] });
+        const buffer = device.createBuffer({ size: 16, usage: GPUBufferUsage.STORAGE });
+        const bufferBinding = { buffer: buffer, size: 16 };
+        const bindGroupBinding = { binding: 1, resource: bufferBinding };
+        const bindGroup = device.createBindGroup({ layout: bindGroupLayout, bindings: [bindGroupBinding]});
+        assert_true(bindGroup instanceof GPUBindGroup, "GPUBindGroup successfully created.");
+    }, function() {
+    });
+}, "Create a basic GPUBindGroup via GPUDevice.")
+        }]
+    });
+    const bindGroup = device.createBindGroup({
+        layout: bindGroupLayout,
+        bindings: [{
+            binding: 0,
+            resource: {
+                buffer: uniformBuffer,
+                size: 4
+            }
+        }, {
+            binding: 1,
+            resource: {
+                buffer: storageBuffer,
+                size: 4
+            }
+        }]
+    });
+    const pipelineLayout = device.createPipelineLayout({ bindGroupLayouts: [bindGroupLayout] });
+    const shaderModule = device.createShaderModule({ code: uniformBufferShader, isWHLSL: true });
+    const pipeline = device.createComputePipeline({
+        layout: pipelineLayout,
+        computeStage: {
+            module: shaderModule,
+            entryPoint: "compute_main"
+        }
+    });
+    const commandEncoder = device.createCommandEncoder();
+    const passEncoder = commandEncoder.beginComputePass();
+    passEncoder.setPipeline(pipeline);
+    passEncoder.setBindGroup(0, bindGroup);
+    passEncoder.dispatch(1, 1, 1);
+    passEncoder.endPass();
+    device.getQueue().submit([commandEncoder.finish()]);
+    const results = new Int32Array(await storageBuffer.mapReadAsync());
+    storageBuffer.unmap();
+    assert_equals(results[0], 42, "Storage buffer binding written to successfully.");
+};
+const sampledTextureShader = `
+[numthreads(1, 1, 1)]
+compute void compute_main(Texture2D<uint> inputTexture : register(t0), sampler inputSampler : register(s1), device uint[] output : register(u2))
+{
+    output[0] = Sample(inputTexture, inputSampler, float2(0, 0));
+}
+`;
+tests["Create and access a sampled texture in a GPUBindGroup."] = async device => {
+    const [textureDataBuffer, textureArrayBuffer] = device.createBufferMapped({ size: 4, usage: GPUBufferUsage.TRANSFER_SRC });
+    new Uint32Array(textureArrayBuffer).set([42]);
+    textureDataBuffer.unmap();
+    const textureSize = { width: 1, height: 1, depth: 1 };
+    const texture = device.createTexture({
+        size: textureSize,
+        format: "rgba8uint",
+        usage: GPUTextureUsage.SAMPLED | GPUTextureUsage.TRANSFER_DST
+    });
+    const outputBuffer = device.createBuffer({ size: 4, usage: GPUBufferUsage.STORAGE | GPUBufferUsage.MAP_READ });
+    const bindGroupLayout = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "sampled-texture"
+        }, {
+            binding: 1,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "sampler"
+        }, {
+            binding: 2,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "storage-buffer"
+        }]
+    });
+    const bindGroup = device.createBindGroup({
+        layout: bindGroupLayout,
+        bindings: [{
+            binding: 0,
+            resource: texture.createDefaultView()
+        }, {
+            binding: 1,
+            resource: device.createSampler({})
+        }, {
+            binding: 2,
+            resource: {
+                buffer: outputBuffer,
+                size: 4
+            }
+        }]
+    });
+    const shaderModule = device.createShaderModule({ code: sampledTextureShader, isWHLSL: true });
+    const pipelineLayout = device.createPipelineLayout({ bindGroupLayouts: [bindGroupLayout] });
+    const pipeline = device.createComputePipeline({
+        layout: pipelineLayout,
+        computeStage: {
+            module: shaderModule,
+            entryPoint: "compute_main"
+        }
+    });
+    const commandEncoder = device.createCommandEncoder();
+    commandEncoder.copyBufferToTexture({
+        buffer: textureDataBuffer,
+        rowPitch: 4,
+        imageHeight: 0
+    }, { texture: texture }, textureSize);
+    const passEncoder = commandEncoder.beginComputePass();
+    passEncoder.setPipeline(pipeline);
+    passEncoder.setBindGroup(0, bindGroup);
+    passEncoder.dispatch(1, 1, 1);
+    passEncoder.endPass();
+    device.getQueue().submit([commandEncoder.finish()]);
+    const results = new Uint32Array(await outputBuffer.mapReadAsync());
+    outputBuffer.unmap();
+    assert_equals(results[0], 42, "Correct value sampled from a bound 2D texture.");
+};
+const comboShader = `
+[numthreads(1, 1, 1)]
+compute void compute_main(
+    Texture2D<uint> inputTexture : register(t0, space0),
+    sampler inputSampler : register(s0, space1),
+    constant uint[] input : register(b0, space2),
+    device uint[] output : register(u0, space3))
+{
+    output[0] = input[0] + Sample(inputTexture, inputSampler, float2(0, 0));
+}
+`;
+tests["Create and use multiple GPUBindGroups in a single dispatch."] = async device => {
+    const [textureDataBuffer, textureArrayBuffer] = device.createBufferMapped({ size: 4, usage: GPUBufferUsage.TRANSFER_SRC });
+    new Uint32Array(textureArrayBuffer).set([17]);
+    textureDataBuffer.unmap();
+    const textureSize = { width: 1, height: 1, depth: 1 };
+    const texture = device.createTexture({
+        size: textureSize,
+        format: "rgba8uint",
+        usage: GPUTextureUsage.SAMPLED | GPUTextureUsage.TRANSFER_DST
+    });
+    const [inputBuffer, inputArrayBuffer] = device.createBufferMapped({ size: 4, usage: GPUBufferUsage.UNIFORM });
+    new Uint32Array(inputArrayBuffer).set([25]);
+    inputBuffer.unmap();
+    const outputBuffer = device.createBuffer({ size: 4, usage: GPUBufferUsage.STORAGE | GPUBufferUsage.MAP_READ });
+    const bgl0 = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "sampled-texture"
+        }]
+    });
+    const bgl1 = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "sampler"
+        }]
+    });
+    const bgl2 = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "uniform-buffer"
+        }]
+    });
+    const bgl3 = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "storage-buffer"
+        }]
+    })
+    const bg0 = device.createBindGroup({
+        layout: bgl0,
+        bindings: [{
+            binding: 0,
+            resource: texture.createDefaultView()
+        }]
+    });
+    const bg1 = device.createBindGroup({
+        layout: bgl1,
+        bindings: [{
+            binding: 0,
+            resource: device.createSampler({})
+        }]
+    });
+    const bg2 = device.createBindGroup({
+        layout: bgl2,
+        bindings: [{
+            binding: 0,
+            resource: {
+                buffer: inputBuffer,
+                size: 4
+            }
+        }]
+    });
+    const bg3 = device.createBindGroup({
+        layout: bgl3,
+        bindings: [{
+            binding: 0,
+            resource: {
+                buffer: outputBuffer,
+                size: 4
+            }
+        }]
+    });
+    const shaderModule = device.createShaderModule({ code: comboShader, isWHLSL: true });
+    const pipelineLayout = device.createPipelineLayout({ bindGroupLayouts: [bgl0, bgl1, bgl2, bgl3] });
+    const pipeline = device.createComputePipeline({
+        layout: pipelineLayout,
+        computeStage: {
+            module: shaderModule,
+            entryPoint: "compute_main"
+        }
+    });
+    const commandEncoder = device.createCommandEncoder();
+    commandEncoder.copyBufferToTexture({
+        buffer: textureDataBuffer,
+        rowPitch: 4,
+        imageHeight: 0
+    }, { texture: texture }, textureSize);
+    const passEncoder = commandEncoder.beginComputePass();
+    passEncoder.setPipeline(pipeline);
+    passEncoder.setBindGroup(0, bg0);
+    passEncoder.setBindGroup(1, bg1);
+    passEncoder.setBindGroup(2, bg2);
+    passEncoder.setBindGroup(3, bg3);
+    passEncoder.dispatch(1, 1, 1);
+    passEncoder.endPass();
+    device.getQueue().submit([commandEncoder.finish()]);
+    const results = new Uint32Array(await outputBuffer.mapReadAsync());
+    outputBuffer.unmap();
+    assert_equals(results[0], 42, "Correct value sampled from a bound 2D texture.");
+};
+tests["Bind a single GPUBuffer with different offsets in different GPUBindGroups"] = async device => {
+    const numInputs = 4;
+    const [uniformBuffer, writeArrayBuffer] = device.createBufferMapped({ size: 4 * numInputs, usage: GPUBufferUsage.UNIFORM });
+    new Int32Array(writeArrayBuffer).set([1, 2, 3, 36]);
+    uniformBuffer.unmap();
+    const storageBuffer = device.createBuffer({ size: 4, usage: GPUBufferUsage.STORAGE | GPUBufferUsage.MAP_READ });
+    const bindGroupLayout = device.createBindGroupLayout({
+        bindings: [{
+            binding: 0,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "uniform-buffer"
+        }, {
+            binding: 1,
+            visibility: GPUShaderStageBit.COMPUTE,
+            type: "storage-buffer"
+        }]
+    });
+    let bindGroups = new Array(numInputs);
+    for (let i = 0; i < numInputs; ++i) {
+        bindGroups[i] = device.createBindGroup({
+            layout: bindGroupLayout,
+            bindings: [{
+                binding: 0,
+                resource: {
+                    buffer: uniformBuffer,
+                    offset: i * numInputs,
+                    size: 4
+                }
+            }, {
+                binding: 1,
+                resource: {
+                    buffer: storageBuffer,
+                    size: 4
+                }
+            }]
+        });
+    }
+    const pipelineLayout = device.createPipelineLayout({ bindGroupLayouts: [bindGroupLayout] });
+    const shaderModule = device.createShaderModule({ code: uniformBufferShader, isWHLSL: true });
+    const pipeline = device.createComputePipeline({
+        layout: pipelineLayout,
+        computeStage: {
+            module: shaderModule,
+            entryPoint: "compute_main"
+        }
+    });
+    const commandEncoder = device.createCommandEncoder();
+    const passEncoder = commandEncoder.beginComputePass();
+    passEncoder.setPipeline(pipeline);
+    for (let i = 0; i < numInputs; ++i) {
+        passEncoder.setBindGroup(0, bindGroups[i]);
+        passEncoder.dispatch(1, 1, 1);
+    }
+    passEncoder.endPass();
+    device.getQueue().submit([commandEncoder.finish()]);
+    const results = new Int32Array(await storageBuffer.mapReadAsync());
+    storageBuffer.unmap();
+    assert_equals(results[0], 42, "Storage buffer binding written to successfully.");
+};
+runTestsWithDevice(tests);
 </script>
 </body>

trunk/Source/WebCore/ChangeLog

-                      r248604
+                      r248606
+-08-13  Justin Fan  <justin_fan@apple.com>
+        [WebGPU] Improve GPUBindGroup performance using one device-shared argument MTLBuffer
+        https://bugs.webkit.org/show_bug.cgi?id=200606
+        Reviewed by Myles C. Maxfield.
+        Manage all argument buffer storage for GPUBindGroups in one large MTLBuffer for a GPUDevice.
+        Vastly improves GPUProgrammablePassEncoder.setBindGroup performance; in alpha MotionMark WebGPU benchmark,
+        score improves from ~12000 to ~90000.
+        No expected change in WebGPU behavior, though bind-groups.html has been updated to cover more cases.
+        * Modules/webgpu/WebGPUDevice.cpp:
+        (WebCore::WebGPUDevice::createBindGroup const):
+        * SourcesCocoa.txt:
+        * WebCore.xcodeproj/project.pbxproj:
+        * platform/graphics/gpu/GPUBindGroup.h: No longer manages one unique MTLBuffer per MTLArgumentEncoder.
+        (WebCore::GPUBindGroup::argumentBuffer const): Delegates to GPUBindGroupAllocator for current argument buffer.
+        (WebCore::GPUBindGroup::vertexArgsBuffer const): Deleted.
+        (WebCore::GPUBindGroup::fragmentArgsBuffer const): Deleted.
+        (WebCore::GPUBindGroup::computeArgsBuffer const): Deleted.
+        * platform/graphics/gpu/GPUBindGroupAllocator.h: Added. Allocates MTLBuffer for and assigns offsets for argument buffers.
+        (WebCore::GPUBindGroupAllocator::argumentBuffer const):
+        * platform/graphics/gpu/GPUBindGroupLayout.h:
+        * platform/graphics/gpu/GPUBuffer.h: Move MTLResourceUsage calculation to GPUBuffer construction.
+        (WebCore::GPUBuffer::platformUsage const):
+        * platform/graphics/gpu/GPUComputePassEncoder.h: Prevent any potiential narrowing issues, as offset can be large.
+        * platform/graphics/gpu/GPUDevice.cpp: Now owns a GPUBindGroupAllocator for owning all its argument buffer storage.
+        (WebCore::GPUDevice::tryCreateBindGroup const):
+        * platform/graphics/gpu/GPUDevice.h:
+        * platform/graphics/gpu/GPUProgrammablePassEncoder.h:
+        (WebCore::GPUProgrammablePassEncoder::setVertexBuffer):
+        (WebCore::GPUProgrammablePassEncoder::setFragmentBuffer):
+        (WebCore::GPUProgrammablePassEncoder::setComputeBuffer):
+        * platform/graphics/gpu/GPURenderPassEncoder.h:
+        * platform/graphics/gpu/GPUTexture.h: Move MTLResourceUsage calculation to GPUTexture construction.
+        (WebCore::GPUTexture::platformUsage const):
+        * platform/graphics/gpu/cocoa/GPUBindGroupAllocatorMetal.mm: Added.
+        (WebCore::GPUBindGroupAllocator::create):
+        (WebCore::GPUBindGroupAllocator::GPUBindGroupAllocator):
+        (WebCore::GPUBindGroupAllocator::allocateAndSetEncoders): Ensures that MTLArgumentEncoders have appropriate allocation for encoding.
+        (WebCore::GPUBindGroupAllocator::reallocate): Create new MTLBuffer large enough for new encoder requirement, and copy over old argument buffer data.
+        (WebCore::GPUBindGroupAllocator::tryReset): For now, resets argument buffer if all GPUBindGroups created with this allocator are destroyed.
+        * platform/graphics/gpu/cocoa/GPUBindGroupMetal.mm:
+        (WebCore::tryGetResourceAsBufferBinding): Add size check.
+        (WebCore::GPUBindGroup::tryCreate): No longer owns new MTLBuffers. Requests argument buffer space from GPUBindGroupAllocator.
+        (WebCore::GPUBindGroup::GPUBindGroup):
+        (WebCore::GPUBindGroup::~GPUBindGroup): Remind allocator to check for possible reset.
+        (WebCore::tryCreateArgumentBuffer): Deleted.
+        * platform/graphics/gpu/cocoa/GPUBufferMetal.mm:
+        (WebCore::GPUBuffer::GPUBuffer):
+        * platform/graphics/gpu/cocoa/GPUComputePassEncoderMetal.mm:
+        (WebCore::GPUComputePassEncoder::setComputeBuffer):
+        * platform/graphics/gpu/cocoa/GPUDeviceMetal.mm:
+        * platform/graphics/gpu/cocoa/GPUProgrammablePassEncoderMetal.mm:
+        (WebCore::GPUProgrammablePassEncoder::setBindGroup): No need to recalculate usage every time. Set appropriate argument buffer and offsets for new bind group model.
+        * platform/graphics/gpu/cocoa/GPURenderPassEncoderMetal.mm:
+        (WebCore::GPURenderPassEncoder::setVertexBuffer):
+        (WebCore::GPURenderPassEncoder::setFragmentBuffer):
+        * platform/graphics/gpu/cocoa/GPUTextureMetal.mm:
+        (WebCore::GPUTexture::GPUTexture):
 -08-13  Antti Koivisto  <antti@apple.com>

trunk/Source/WebCore/Modules/webgpu/WebGPUDevice.cpp

r247892	r248606
146	146	return WebGPUBindGroup::create(nullptr);
147	147
148		auto bindGroup = ~~GPUBindGroup::tryCreate(*gpuDescriptor~~);
	148	auto bindGroup = m_device->tryCreateBindGroup(*gpuDescriptor, m_errorScopes);
149	149	return WebGPUBindGroup::create(WTFMove(bindGroup));
150	150	}

trunk/Source/WebCore/SourcesCocoa.txt

r247530	r248606
327	327	platform/graphics/cv/VideoTextureCopierCV.cpp
328	328
	329	platform/graphics/gpu/cocoa/GPUBindGroupAllocatorMetal.mm
329	330	platform/graphics/gpu/cocoa/GPUBindGroupMetal.mm
330	331	platform/graphics/gpu/cocoa/GPUBindGroupLayoutMetal.mm

trunk/Source/WebCore/WebCore.xcodeproj/project.pbxproj

-                      r248596
+                      r248606
                 D0615FCD217FE5C6008A48A8 /* WebGPUShaderModule.cpp */ = {isa = PBXFileReference; lastKnownFileType = sourcecode.cpp.cpp; path = WebGPUShaderModule.cpp; sourceTree = "<group>"; };
                 D0615FCE217FE5C6008A48A8 /* WebGPUShaderModule.idl */ = {isa = PBXFileReference; lastKnownFileType = text; path = WebGPUShaderModule.idl; sourceTree = "<group>"; };
+                D065BE5722FB616D0076DD60 /* GPUBindGroupAllocator.h */ = {isa = PBXFileReference; lastKnownFileType = sourcecode.c.h; path = GPUBindGroupAllocator.h; sourceTree = "<group>"; };
+                D065BE5822FB616D0076DD60 /* GPUBindGroupAllocatorMetal.mm */ = {isa = PBXFileReference; lastKnownFileType = sourcecode.cpp.objcpp; path = GPUBindGroupAllocatorMetal.mm; sourceTree = "<group>"; };
                 D06A9A2122026C7A0083C662 /* GPURequestAdapterOptions.h */ = {isa = PBXFileReference; lastKnownFileType = sourcecode.c.h; path = GPURequestAdapterOptions.h; sourceTree = "<group>"; };
                 D06C0D8D0CFD11460065F43F /* RemoveFormatCommand.h */ = {isa = PBXFileReference; fileEncoding = 4; lastKnownFileType = sourcecode.c.h; path = RemoveFormatCommand.h; sourceTree = "<group>"; };
 …
                                 D087CE3721ACA94200BDE174 /* cocoa */,
                                 D0BE105E21E6BAD300E42A89 /* GPUBindGroup.h */,
+                                D065BE5722FB616D0076DD60 /* GPUBindGroupAllocator.h */,
                                 D0BE104E21E695E200E42A89 /* GPUBindGroupBinding.h */,
                                 D0BE105121E6A70E00E42A89 /* GPUBindGroupDescriptor.h */,
 …
                         isa = PBXGroup;
                         children = (
+                                D065BE5822FB616D0076DD60 /* GPUBindGroupAllocatorMetal.mm */,
                                 D0232B5821CB49B7009483B9 /* GPUBindGroupLayoutMetal.mm */,
                                 D085E64A2236DEAE00C3E1E2 /* GPUBindGroupMetal.mm */,
 …
 F60F32B1DFBB10700416D6C /* CommonVM.h in Headers */,
 C93F34A1AA6BA5E00A98BAB /* CompiledContentExtension.h in Headers */,
+                                E4E94D6122FF158A00DD191F /* ComplexLineLayout.h in Headers */,
                                 C2F4E78C1E45C3EF006D7105 /* ComplexTextController.h in Headers */,
                                 E4BA50901BCFBD9500E34EF7 /* ComposedTreeAncestorIterator.h in Headers */,
 …
                                 E13EF3441684ECF40034C83F /* NetworkStorageSession.h in Headers */,
                                 269397241A4A5B6400E8349D /* NFA.h in Headers */,
-                                E4E94D6122FF158A00DD191F /* ComplexLineLayout.h in Headers */,
                                 269397221A4A412F00E8349D /* NFANode.h in Headers */,
                                 267726011A5B3AD9003C24DD /* NFAToDFA.h in Headers */,

trunk/Source/WebCore/platform/graphics/gpu/GPUBindGroup.h

-                      r247930
+                      r248606
 #if ENABLE(WEBGPU)
+#include "GPUBindGroupAllocator.h"
 #include "GPUBuffer.h"
 #include "GPUTexture.h"
+#include <objc/NSObjCRuntime.h>
+#include <utility>
 #include <wtf/HashSet.h>
 #include <wtf/RefCounted.h>
 …
 #include <wtf/RetainPtr.h>
+#if USE(METAL)
 OBJC_PROTOCOL(MTLBuffer);
+#endif
 namespace WebCore {
 …
 struct GPUBindGroupDescriptor;
+#if USE(METAL)
+using ArgumentBuffer = std::pair<const MTLBuffer *, const GPUBindGroupAllocator::ArgumentBufferOffsets&>;
+#endif
 class GPUBindGroup : public RefCounted<GPUBindGroup> {
 public:
+    static RefPtr<GPUBindGroup> tryCreate(const GPUBindGroupDescriptor&);
+    static RefPtr<GPUBindGroup> tryCreate(const GPUBindGroupDescriptor&, GPUBindGroupAllocator&);
+    ~GPUBindGroup();
 #if USE(METAL)
+    const MTLBuffer *vertexArgsBuffer() const { return m_vertexArgsBuffer.get(); }
+    const MTLBuffer *fragmentArgsBuffer() const { return m_fragmentArgsBuffer.get(); }
+    const MTLBuffer *computeArgsBuffer() const { return m_computeArgsBuffer.get(); }
+    const ArgumentBuffer argumentBuffer() const { return { m_allocator->argumentBuffer(), m_argumentBufferOffsets }; }
 #endif
     const HashSet<Ref<GPUBuffer>>& boundBuffers() const { return m_boundBuffers; }
 …
 private:
 #if USE(METAL)
     GPUBindGroup(RetainPtr<MTLBuffer>&& vertexBuffer, RetainPtr<MTLBuffer>&& fragmentBuffer, RetainPtr<MTLBuffer>&& computeArgsBuffer, HashSet<Ref<GPUBuffer>>&&, HashSet<Ref<GPUTexture>>&&);
+    GPUBindGroup(GPUBindGroupAllocator::ArgumentBufferOffsets&&, GPUBindGroupAllocator&, HashSet<Ref<GPUBuffer>>&&, HashSet<Ref<GPUTexture>>&&);
+    RetainPtr<MTLBuffer> m_vertexArgsBuffer;
+    RetainPtr<MTLBuffer> m_fragmentArgsBuffer;
+    RetainPtr<MTLBuffer> m_computeArgsBuffer;
+    GPUBindGroupAllocator::ArgumentBufferOffsets m_argumentBufferOffsets;
+    Ref<GPUBindGroupAllocator> m_allocator;
 #endif
     HashSet<Ref<GPUBuffer>> m_boundBuffers;

trunk/Source/WebCore/platform/graphics/gpu/GPUBindGroupAllocator.h

-                      r248605
+                      r248606
 #if ENABLE(WEBGPU)
 #include "GPUBuffer.h"
 #include "GPUTexture.h"
 #include <wtf/HashSet.h>
+#include <objc/NSObjCRuntime.h>
+#include <wtf/Optional.h>
+#include <wtf/Ref.h>
 #include <wtf/RefCounted.h>
-#include <wtf/RefPtr.h>
 #include <wtf/RetainPtr.h>
+OBJC_PROTOCOL(MTLArgumentEncoder);
 OBJC_PROTOCOL(MTLBuffer);
 namespace WebCore {
 struct GPUBindGroupDescriptor;
+class GPUErrorScopes;
 class GPUBindGroup : public RefCounted<GPUBindGroup> {
+class GPUBindGroupAllocator : public RefCounted<GPUBindGroupAllocator> {
 public:
     static RefPtr<GPUBindGroup> tryCreate(const GPUBindGroupDescriptor&);
+    static Ref<GPUBindGroupAllocator> create(GPUErrorScopes&);
 #if USE(METAL)
+    const MTLBuffer *vertexArgsBuffer() const { return m_vertexArgsBuffer.get(); }
+    const MTLBuffer *fragmentArgsBuffer() const { return m_fragmentArgsBuffer.get(); }
+    const MTLBuffer *computeArgsBuffer() const { return m_computeArgsBuffer.get(); }
+    struct ArgumentBufferOffsets {
+        Optional<NSUInteger> vertex;
+        Optional<NSUInteger> fragment;
+        Optional<NSUInteger> compute;
+    };
+    Optional<ArgumentBufferOffsets> allocateAndSetEncoders(MTLArgumentEncoder *vertex, MTLArgumentEncoder *fragment, MTLArgumentEncoder *compute);
+    void tryReset();
+    const MTLBuffer *argumentBuffer() const { return m_argumentBuffer.get(); }
 #endif
-    const HashSet<Ref<GPUBuffer>>& boundBuffers() const { return m_boundBuffers; }
-    const HashSet<Ref<GPUTexture>>& boundTextures() const { return m_boundTextures; }
 private:
+    explicit GPUBindGroupAllocator(GPUErrorScopes&);
 #if USE(METAL)
+    GPUBindGroup(RetainPtr<MTLBuffer>&& vertexBuffer, RetainPtr<MTLBuffer>&& fragmentBuffer, RetainPtr<MTLBuffer>&& computeArgsBuffer, HashSet<Ref<GPUBuffer>>&&, HashSet<Ref<GPUTexture>>&&);
+    RetainPtr<MTLBuffer> m_vertexArgsBuffer;
+    RetainPtr<MTLBuffer> m_fragmentArgsBuffer;
+    RetainPtr<MTLBuffer> m_computeArgsBuffer;
+    bool reallocate(NSUInteger);
+    RetainPtr<MTLBuffer> m_argumentBuffer;
+    NSUInteger m_lastOffset { 0 };
 #endif
+    HashSet<Ref<GPUBuffer>> m_boundBuffers;
     HashSet<Ref<GPUTexture>> m_boundTextures;
+    Ref<GPUErrorScopes> m_errorScopes;
 };

trunk/Source/WebCore/platform/graphics/gpu/GPUBindGroupLayout.h

r246394	r248606
29	29
30	30	#include "GPUBindGroupLayoutDescriptor.h"
31
32	31	#include <wtf/HashMap.h>
33	32	#include <wtf/RefCounted.h>

trunk/Source/WebCore/platform/graphics/gpu/GPUBuffer.h

-                      r247892
+                      r248606
     bool isReadOnly() const;
     bool isMappable() const { return m_usage.containsAny({ GPUBufferUsage::Flags::MapWrite, GPUBufferUsage::Flags::MapRead }); }
+    unsigned platformUsage() const { return m_platformUsage; }
     State state() const;
 …
     size_t m_byteLength;
     OptionSet<GPUBufferUsage::Flags> m_usage;
+    unsigned m_platformUsage;
     unsigned m_numScheduledCommandBuffers { 0 };
     bool m_isMappedFromCreation { false };

trunk/Source/WebCore/platform/graphics/gpu/GPUComputePassEncoder.h

r243627	r248606
57	57	#if USE(METAL)
58	58	void useResource(const MTLResource *, unsigned usage) final;
59		void setComputeBuffer(const MTLBuffer *, ~~unsigned~~ offset, unsigned index) final;
	59	void setComputeBuffer(const MTLBuffer *, NSUInteger offset, unsigned index) final;
60	60	#endif
61	61

trunk/Source/WebCore/platform/graphics/gpu/GPUDevice.cpp

-                      r247892
+                      r248606
 #if ENABLE(WEBGPU)
+#include "GPUBindGroup.h"
+#include "GPUBindGroupAllocator.h"
+#include "GPUBindGroupDescriptor.h"
 #include "GPUBindGroupLayout.h"
 #include "GPUBindGroupLayoutDescriptor.h"
 …
+}
+RefPtr<GPUBindGroup> GPUDevice::tryCreateBindGroup(const GPUBindGroupDescriptor& descriptor, GPUErrorScopes& errorScopes) const
+{
+    if (!m_bindGroupAllocator)
+        m_bindGroupAllocator = GPUBindGroupAllocator::create(errorScopes);
+    return GPUBindGroup::tryCreate(descriptor, *m_bindGroupAllocator);
+}
 RefPtr<GPUCommandBuffer> GPUDevice::tryCreateCommandBuffer() const
+{

trunk/Source/WebCore/platform/graphics/gpu/GPUDevice.h

-                      r247892
+                      r248606
 #if ENABLE(WEBGPU)
+#include "GPUBindGroupAllocator.h"
 #include "GPUQueue.h"
 #include "GPUSwapChain.h"
 #include <wtf/Function.h>
 #include <wtf/Optional.h>
+#include <wtf/Ref.h>
 #include <wtf/RefCounted.h>
+#include <wtf/RefPtr.h>
 #include <wtf/RetainPtr.h>
 #include <wtf/WeakPtr.h>
 …
 namespace WebCore {
+class GPUBindGroup;
 class GPUBindGroupLayout;
 class GPUBuffer;
 …
 class GPUTexture;
+struct GPUBindGroupDescriptor;
 struct GPUBindGroupLayoutDescriptor;
 struct GPUBufferDescriptor;
 …
     RefPtr<GPUBindGroupLayout> tryCreateBindGroupLayout(const GPUBindGroupLayoutDescriptor&) const;
     Ref<GPUPipelineLayout> createPipelineLayout(GPUPipelineLayoutDescriptor&&) const;
+    RefPtr<GPUBindGroup> tryCreateBindGroup(const GPUBindGroupDescriptor&, GPUErrorScopes&) const;
     RefPtr<GPUShaderModule> tryCreateShaderModule(const GPUShaderModuleDescriptor&) const;
 …
     mutable RefPtr<GPUQueue> m_queue;
     RefPtr<GPUSwapChain> m_swapChain;
+    mutable RefPtr<GPUBindGroupAllocator> m_bindGroupAllocator;
 };

trunk/Source/WebCore/platform/graphics/gpu/GPUProgrammablePassEncoder.h

-                      r243627
+                      r248606
 #include "GPUBindGroupBinding.h"
 #include "GPUCommandBuffer.h"
+#include <objc/NSObjCRuntime.h>
 #include <wtf/RefCounted.h>
 …
     // Render command encoder methods.
     virtual void setVertexBuffer(const MTLBuffer *, unsigned, unsigned) { }
     virtual void setFragmentBuffer(const MTLBuffer *, unsigned, unsigned) { }
+    virtual void setVertexBuffer(const MTLBuffer *, NSUInteger, unsigned) { }
+    virtual void setFragmentBuffer(const MTLBuffer *, NSUInteger, unsigned) { }
     // Compute.
     virtual void setComputeBuffer(const MTLBuffer *, unsigned, unsigned) { }
+    virtual void setComputeBuffer(const MTLBuffer *, NSUInteger, unsigned) { }
 #endif // USE(METAL)

trunk/Source/WebCore/platform/graphics/gpu/GPURenderPassEncoder.h

-                      r244147
+                      r248606
 #if USE(METAL)
     void useResource(const MTLResource *, unsigned usage) final;
     void setVertexBuffer(const MTLBuffer *, unsigned offset, unsigned index) final;
     void setFragmentBuffer(const MTLBuffer *, unsigned offset, unsigned index) final;
+    void setVertexBuffer(const MTLBuffer *, NSUInteger offset, unsigned index) final;
+    void setFragmentBuffer(const MTLBuffer *, NSUInteger offset, unsigned index) final;
     RefPtr<GPUBuffer> m_indexBuffer;

trunk/Source/WebCore/platform/graphics/gpu/GPUTexture.h

-                      r246631
+                      r248606
     bool isSampled() const { return m_usage.contains(GPUTextureUsage::Flags::Sampled); }
     bool isStorage() const { return m_usage.contains(GPUTextureUsage::Flags::Storage); }
+    unsigned platformUsage() const { return m_platformUsage; }
     RefPtr<GPUTexture> tryCreateDefaultTextureView();
 …
     OptionSet<GPUTextureUsage::Flags> m_usage;
+    unsigned m_platformUsage;
 };

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPUBindGroupMetal.mm

-                      r247930
+                      r248606
 #if ENABLE(WEBGPU)
+#import "GPUBindGroupAllocator.h"
 #import "GPUBindGroupBinding.h"
 #import "GPUBindGroupDescriptor.h"
 …
 namespace WebCore {
-static RetainPtr<MTLBuffer> tryCreateArgumentBuffer(MTLArgumentEncoder *encoder)
+{
-    RetainPtr<MTLBuffer> buffer;
-    BEGIN_BLOCK_OBJC_EXCEPTIONS;
-    buffer = adoptNS([encoder.device newBufferWithLength:encoder.encodedLength options:0]);
-    [encoder setArgumentBuffer:buffer.get() offset:0];
-    END_BLOCK_OBJC_EXCEPTIONS;
-    return buffer;
+}
 static Optional<GPUBufferBinding> tryGetResourceAsBufferBinding(const GPUBindingResource& resource, const char* const functionName)
 …
     if (!bufferBinding.buffer->platformBuffer()) {
         LOG(WebGPU, "%s: Invalid MTLBuffer in GPUBufferBinding!", functionName);
+        return WTF::nullopt;
+    }
+    if (!WTF::isInBounds<NSUInteger>(bufferBinding.size) || bufferBinding.size > bufferBinding.buffer->byteLength()) {
+        LOG(WebGPU, "%s: GPUBufferBinding size is too large!", functionName);
         return WTF::nullopt;
+    }
 …
     END_BLOCK_OBJC_EXCEPTIONS;
+}
 RefPtr<GPUBindGroup> GPUBindGroup::tryCreate(const GPUBindGroupDescriptor& descriptor)
+RefPtr<GPUBindGroup> GPUBindGroup::tryCreate(const GPUBindGroupDescriptor& descriptor, GPUBindGroupAllocator& allocator)
+{
     const char* const functionName = "GPUBindGroup::tryCreate()";
 …
     MTLArgumentEncoder *fragmentEncoder = descriptor.layout->fragmentEncoder();
     MTLArgumentEncoder *computeEncoder = descriptor.layout->computeEncoder();
+    RetainPtr<MTLBuffer> vertexArgsBuffer;
+    if (vertexEncoder && !(vertexArgsBuffer = tryCreateArgumentBuffer(vertexEncoder))) {
+        LOG(WebGPU, "%s: Unable to create MTLBuffer for vertex argument buffer!", functionName);
+        return nullptr;
+    }
+    RetainPtr<MTLBuffer> fragmentArgsBuffer;
+    if (fragmentEncoder && !(fragmentArgsBuffer = tryCreateArgumentBuffer(fragmentEncoder))) {
+        LOG(WebGPU, "%s: Unable to create MTLBuffer for fragment argument buffer!", functionName);
+        return nullptr;
+    }
+    RetainPtr<MTLBuffer> computeArgsBuffer;
+    if (computeEncoder && !(computeArgsBuffer = tryCreateArgumentBuffer(computeEncoder))) {
+        LOG(WebGPU, "%s: Unable to create MTLBuffer for compute argument buffer!", functionName);
+        return nullptr;
+    }
+    auto offsets = allocator.allocateAndSetEncoders(vertexEncoder, fragmentEncoder, computeEncoder);
+    if (!offsets)
+        return nullptr;
     HashSet<Ref<GPUBuffer>> boundBuffers;
 …
             if (isForCompute)
                 setBufferOnEncoder(computeEncoder, *bufferResource, layoutBinding.internalName, internalLengthName);
             boundBuffers.addVoid(bufferResource->buffer.copyRef());
+            boundBuffers.addVoid(WTFMove(bufferResource->buffer));
             return true;
         };
 …
+    }
+    return adoptRef(new GPUBindGroup(WTFMove(vertexArgsBuffer), WTFMove(fragmentArgsBuffer), WTFMove(computeArgsBuffer), WTFMove(boundBuffers), WTFMove(boundTextures)));
+}
+GPUBindGroup::GPUBindGroup(RetainPtr<MTLBuffer>&& vertexBuffer, RetainPtr<MTLBuffer>&& fragmentBuffer, RetainPtr<MTLBuffer>&& computeBuffer, HashSet<Ref<GPUBuffer>>&& buffers, HashSet<Ref<GPUTexture>>&& textures)
+    : m_vertexArgsBuffer(WTFMove(vertexBuffer))
+    , m_fragmentArgsBuffer(WTFMove(fragmentBuffer))
+    , m_computeArgsBuffer(WTFMove(computeBuffer))
+    return adoptRef(new GPUBindGroup(WTFMove(*offsets), allocator, WTFMove(boundBuffers), WTFMove(boundTextures)));
+}
+GPUBindGroup::GPUBindGroup(GPUBindGroupAllocator::ArgumentBufferOffsets&& offsets, GPUBindGroupAllocator& allocator, HashSet<Ref<GPUBuffer>>&& buffers, HashSet<Ref<GPUTexture>>&& textures)
+    : m_argumentBufferOffsets(WTFMove(offsets))
+    , m_allocator(makeRef(allocator))
     , m_boundBuffers(WTFMove(buffers))
     , m_boundTextures(WTFMove(textures))
+{
+}
+GPUBindGroup::~GPUBindGroup()
+{
+    GPUBindGroupAllocator& rawAllocator = m_allocator.leakRef();
+    rawAllocator.deref();
+    rawAllocator.tryReset();
+}
 } // namespace WebCore

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPUBufferMetal.mm

r248532	r248606
119	119	, m_isMappedFromCreation(isMapped == GPUBufferMappedOption::IsMapped)
120	120	{
	121	m_platformUsage = MTLResourceUsageRead;
	122	if (isStorage())
	123	m_platformUsage \|= MTLResourceUsageWrite;
121	124	}
122	125

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPUComputePassEncoderMetal.mm

r246427	r248606
122	122	}
123	123
124		void GPUComputePassEncoder::setComputeBuffer(const MTLBuffer * ~~buffer, unsigned~~ offset, unsigned index)
	124	void GPUComputePassEncoder::setComputeBuffer(const MTLBuffer *buffer, NSUInteger offset, unsigned index)
125	125	{
126	126	ASSERT(m_platformComputePassEncoder);

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPUDeviceMetal.mm

r246846	r248606
31	31	#import "GPURequestAdapterOptions.h"
32	32	#import "Logging.h"
33
34	33	#import <Metal/Metal.h>
35	34	#import <pal/spi/cocoa/MetalSPI.h>

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPUProgrammablePassEncoderMetal.mm

-                      r246631
+                      r248606
         return;
+    }
-    if (bindGroup.vertexArgsBuffer())
-        setVertexBuffer(bindGroup.vertexArgsBuffer(), 0, index);
-    if (bindGroup.fragmentArgsBuffer())
-        setFragmentBuffer(bindGroup.fragmentArgsBuffer(), 0, index);
-    if (bindGroup.computeArgsBuffer())
-        setComputeBuffer(bindGroup.computeArgsBuffer(), 0, index);
+    for (auto& bufferRef : bindGroup.boundBuffers()) {
+        MTLResourceUsage usage = 0;
+        if (bufferRef->isUniform()) {
+            ASSERT(!bufferRef->isStorage());
+            usage = MTLResourceUsageRead;
+        } else if (bufferRef->isStorage()) {
+            ASSERT(!bufferRef->isUniform());
+            usage = MTLResourceUsageRead | MTLResourceUsageWrite;
+        }
+        useResource(bufferRef->platformBuffer(), usage);
+        m_commandBuffer->useBuffer(bufferRef.copyRef());
+    auto argumentBuffer = bindGroup.argumentBuffer();
+    if (!argumentBuffer.first)
+        return;
+    if (argumentBuffer.second.vertex)
+        setVertexBuffer(argumentBuffer.first, *argumentBuffer.second.vertex, index);
+    if (argumentBuffer.second.fragment)
+        setFragmentBuffer(argumentBuffer.first, *argumentBuffer.second.fragment, index);
+    if (argumentBuffer.second.compute)
+        setComputeBuffer(argumentBuffer.first, *argumentBuffer.second.compute, index);
+    for (auto& buffer : bindGroup.boundBuffers()) {
+        useResource(buffer->platformBuffer(), static_cast<MTLResourceUsage>(buffer->platformUsage()));
+        m_commandBuffer->useBuffer(buffer.copyRef());
+    }
+    for (auto& textureRef : bindGroup.boundTextures()) {
+        MTLResourceUsage usage = 0;
+        if (textureRef->isSampled()) {
+            ASSERT(!textureRef->isStorage());
+            usage = MTLResourceUsageRead | MTLResourceUsageSample;
+        } else if (textureRef->isStorage()) {
+            ASSERT(!textureRef->isSampled());
+            usage = MTLResourceUsageRead | MTLResourceUsageWrite;
+        }
+        useResource(textureRef->platformTexture(), usage);
+        m_commandBuffer->useTexture(textureRef.copyRef());
+    for (auto& texture : bindGroup.boundTextures()) {
+        useResource(texture->platformTexture(), static_cast<MTLResourceUsage>(texture->platformUsage()));
+        m_commandBuffer->useTexture(texture.copyRef());
+    }
+}

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPURenderPassEncoderMetal.mm

r244235	r248606
394	394	}
395	395
396		void GPURenderPassEncoder::setVertexBuffer(const MTLBuffer *buffer, ~~unsigned~~ offset, unsigned index)
	396	void GPURenderPassEncoder::setVertexBuffer(const MTLBuffer *buffer, NSUInteger offset, unsigned index)
397	397	{
398	398	ASSERT(m_platformRenderPassEncoder);
…	…
403	403	}
404	404
405		void GPURenderPassEncoder::setFragmentBuffer(const MTLBuffer *buffer, ~~unsigned~~ offset, unsigned index)
	405	void GPURenderPassEncoder::setFragmentBuffer(const MTLBuffer *buffer, NSUInteger offset, unsigned index)
406	406	{
407	407	ASSERT(m_platformRenderPassEncoder);

trunk/Source/WebCore/platform/graphics/gpu/cocoa/GPUTextureMetal.mm

r246631	r248606
179	179	, m_usage(usage)
180	180	{
	181	m_platformUsage = MTLResourceUsageRead;
	182	if (isSampled())
	183	m_platformUsage \|= MTLResourceUsageSample;
	184	else if (isStorage())
	185	m_platformUsage \|= MTLResourceUsageWrite;
181	186	}
182	187

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 248606 in webkit

Legend:

Download in other formats: