onnxruntime

mirror of https://github.com/saymrwulf/onnxruntime.git synced 2026-06-26 03:00:54 +00:00

History

Jiajia Qin 7e0dd9d433 [js/webgpu] Optimize Expand (#22752 ) Use components = 4 if possible. llama3.2-1B becomes 20 tokens/s from 18 tokens/s on my iGPUs.		2024-11-12 12:37:19 -08:00
..
ops	[js/webgpu] Optimize Expand (#22752 )	2024-11-12 12:37:19 -08:00
attribute-with-cache-key.ts	[js] change default formatter for JavaScript/TypeScript from clang-format to Prettier (#21728 )	2024-08-14 16:51:22 -07:00
gpu-data-manager.ts	[js/webgpu] Destroy staging buffers aggressively during weights uploading (#22726 )	2024-11-06 08:55:15 -08:00
op-resolve-rules.ts	[js/webgpu] support GridSample operator (#22652 )	2024-11-08 11:02:36 -08:00
program-manager.ts	[JS/WebGPU] Creating devices with subgroup features enabled if possible (#21833 )	2024-11-07 02:13:40 -08:00
types.ts	[JS/WebGPU] Creating devices with subgroup features enabled if possible (#21833 )	2024-11-07 02:13:40 -08:00