Visual Question Answering Combining Multi-modal Feature Fusion and Multi-Attention Mechanism

Visual Question Answering Combining Multi-modal Feature Fusion and Multi-Attention Mechanism | IEEE Conference Publication | IEEE Xplore