CLIPについて
contrastive learning は...