4 bit quantization pytorch