MVFormer: UNet-like Transformer with Mix-Voxel Attention for Camera-Based 3D Semantic Scene Completion

MVFormer: UNet-like Transformer with Mix-Voxel Attention for Camera-Based 3D Semantic Scene Completion | IEEE Journals & Magazine | IEEE Xplore