Combining Global and Local Attention with Positional Encoding for Video Summarization

Combining Global and Local Attention with Positional Encoding for Video Summarization | IEEE Conference Publication | IEEE Xplore