다운받을 디렉토리에서 wget을 사용하여 저장된 URL로 학습 및 검증 파일을 다운로드 합니다.
'학습 이미지(작업 1 및 2)' 파일은 큰 학습 세트입니다. 용량은 138GB이며, Cloud Shell을 사용하여 Compute Engine VM으로 다운로드하는 경우 예상 다운로드 시간은 약 40시간입니다. 이 대용량 파일의 경우에는 명령어 앞에 nohup를 추가하거나 screen을 사용하여 Cloud Shell의 연결이 끊겨도 다운로드가 종료되지 않도록 할 수 있습니다.
https://linuxize.com/post/how-to-use-linux-screen/
nohup wget http://image-net.org/challenges/LSVRC/2012/dd31405981ef5f776aa17412e1f0c112/ILSVRC2012_img_train.tar &
그러면 ILSVRC2012_img_train.tar라는 대용량 파일이 다운로드됩니다.
VM의 $IMAGENET_HOME에서 다음 명령어를 사용하여 개별 학습 디렉터리를 $IMAGENET_HOME/train 디렉터리로 추출합니다. 추출에는 1~3시간이 걸립니다.
tar xf ILSVRC2012_img_train.tar
'학습 이미지(작업 3)' 파일은 728MB이며 다운로드하는 데 몇 분밖에 걸리지 않으므로 Cloud Shell 연결이 끊기지 않도록 예방 조치를 취할 필요가 없습니다.
이 파일을 다운로드하면 개별 학습 디렉터리가 기존 $IMAGENET_HOME/train 디렉터리로 추출됩니다.