Weakly Supervised Video Representation Learning with Unaligned Text for Sequential Videos

Weakly Supervised Video Representation Learning with Unaligned Text for Sequential Videos | IEEE Conference Publication | IEEE Xplore