FreeLunch: Compression-based GPU Memory Management for Convolutional Neural Networks

FreeLunch: Compression-based GPU Memory Management for Convolutional Neural Networks | IEEE Conference Publication | IEEE Xplore