Allow overwrite flashinfer use_tensorcore #2169

merrymercy · 2024-11-25T04:55:23Z

No description provided.

zhyncs · 2024-11-25T04:56:54Z

python/sglang/srt/layers/attention/flashinfer_backend.py

        else:
-            self.decode_use_tensor_cores = False
+            if not _grouped_size_compiled_for_decode_kernels(


May we remove this _grouped_size_compiled_for_decode_kernels I think it's useless in FlashInfer v0.2 cc @yzh119

Yes we can use some heuristic:

For fp16, use_tensor_cores=True when gqa_group_size > 4

For fp8, we can always enable use_tensor_cores=True

merrymercy added 2 commits November 24, 2024 20:53

Allow overwrite flashinfer use_tensorcore

d573a97

Update flashinfer

ed5316f

merrymercy requested review from Ying1123, hnyls2002, zhyncs, ispobock and ByronHsu as code owners November 25, 2024 04:55

zhyncs reviewed Nov 25, 2024

View reviewed changes

merrymercy merged commit 8e1adb8 into main Nov 25, 2024
1 of 13 checks passed

merrymercy deleted the pr-fix-flashinfer branch November 25, 2024 04:58

zhyncs mentioned this pull request Nov 25, 2024

feat: add should_use_tensor_core #2179

Merged

3 tasks

bjmsong mentioned this pull request Dec 17, 2024

improve performance by removing use_tensor_core dependency #2496

Closed

3 tasks

timethink pushed a commit to timethink/sglang that referenced this pull request Mar 9, 2025

Allow overwrite flashinfer use_tensorcore (sgl-project#2169)

820594c

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Allow overwrite flashinfer use_tensorcore #2169

Allow overwrite flashinfer use_tensorcore #2169

Uh oh!

merrymercy commented Nov 25, 2024

Uh oh!

zhyncs Nov 25, 2024

Uh oh!

yzh119 Nov 25, 2024

Uh oh!

zhyncs Nov 25, 2024

Uh oh!

Uh oh!

Uh oh!

Allow overwrite flashinfer use_tensorcore #2169

Allow overwrite flashinfer use_tensorcore #2169

Uh oh!

Conversation

merrymercy commented Nov 25, 2024

Uh oh!

zhyncs Nov 25, 2024

Choose a reason for hiding this comment

Uh oh!

yzh119 Nov 25, 2024

Choose a reason for hiding this comment

Uh oh!

zhyncs Nov 25, 2024

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!