put_along_axis reduce='mul' 结果不对, cpu正确，gpu错误

### bug描述 Describe the Bug

这里没有实现，https://github.com/PaddlePaddle/Paddle/blob/0b79129d5a76eeb7e4cf004ad1d43347f58520da/paddle/phi/kernels/funcs/gather_scatter_functor.cu#L52

```python
import paddle
def scatter_reduce(input: paddle.Tensor, 
                   axis: int, 
                   index: paddle.Tensor, 
                   src: paddle.Tensor, 
                   reduce: str) -> paddle.Tensor:
    # reduce "sum", "prod", "mean", "amax", "amin"
    if reduce == "sum":
        input.put_along_axis_(indices=index, values=src, axis=axis, reduce="add")
    elif reduce == "mean":
        input.put_along_axis_(indices=index, values=src, axis=axis, reduce="add")
        dst_div = (
            paddle.ones_like(input)
            .put_along_axis(
                indices=index, values=paddle.to_tensor(1.0, dtype=input.dtype), axis=axis, reduce="add"
            )
        )
        input = input / dst_div
    elif reduce == "prod":
        input = input.put_along_axis(indices=index, values=src, axis=axis, reduce="mul")
    else:
        raise NotImplementedError("only support mode in ['sum', 'prod', 'mean']!")
    return input
paddle.set_device('cpu')
src = paddle.to_tensor([1., 2., 3., 4., 5., 6.])
index = paddle.to_tensor([0, 1, 0, 1, 2, 1])
input = paddle.to_tensor([1., 2., 3., 4.])
out = scatter_reduce(input, 0, index, src, reduce="prod")
print(out)
# Tensor(shape=[4], dtype=float32, place=Place(cpu), stop_gradient=True,
#        [3. , 96., 15., 4. ])

paddle.set_device('gpu')
src = paddle.to_tensor([1., 2., 3., 4., 5., 6.])
index = paddle.to_tensor([0, 1, 0, 1, 2, 1])
input = paddle.to_tensor([1., 2., 3., 4.])
out = scatter_reduce(input, 0, index, src, reduce="prod")
print(out)
# Tensor(shape=[4], dtype=float32, place=Place(gpu:0), stop_gradient=True,
#        [1. , 4. , 15., 4. ])
```

### 其他补充信息 Additional Supplementary Information

希望新增 reduce='mean' 的，当前是组合算子组成

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

put_along_axis reduce='mul' 结果不对, cpu正确，gpu错误 #52446

bug描述 Describe the Bug

其他补充信息 Additional Supplementary Information

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

put_along_axis reduce='mul' 结果不对, cpu正确，gpu错误 #52446

Description

bug描述 Describe the Bug

其他补充信息 Additional Supplementary Information

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions