GPU4 CPU / GPU 모니터링 및 로그 남기기 부하 테스트, 사용량 로그 등을 위한 로그 남기기 방법 top 로깅쪽은 리디렉션으로 쉽게 되는 반면, nvidia-smi의 경우 watch를 쓰면 정상적으로 되지 않는다. 따로 배치를 짤까 고민하다가 한 줄로 끝나는 법이 있어 모니터링 및 로깅을 남겨둔다. 1. 모니터링 1) CPU / Memory 모니터링 : top -b -n 1 -> 1은 얼마마다 체크할건지 (소숫점 가능) 2) GPU 모니터링 : watch nvidia-smi -d -n 1 -> 1은 얼마마다 체크할건지 (소숫점 가능) 2. 로깅(로그 남기기) 1) CPU / Memory 로깅 : top -d 1 -b > log_top.log 2) while true; do nvidia-smi >> log_nvidia-smi.log; sleep 1.. 2021. 12. 27. R gpu 및 딥러닝 세팅 기존 글( 딥러닝 세팅하기 )의 7번까지의 과정 선행이 필요합니다. 1. Rtools 설치 https://cran.r-project.org/bin/windows/Rtools/ R core 버전에 맞는 버전. 설치 2. gpuR install.packages('gpuR') 3. devtools 설치 install.packages('devtools') 4. keras 세팅 devtools::install_github("rstudio/keras") install.packages('kerasr') library(keras) install_keras(tensorflow = "gpu") 5. OpenCL 세팅 install.packages('OpenCL') 2020. 4. 17. 딥러닝 세팅하기(cudart64_101.dll 해결, 텐서플로 및 파이토치) 목표 : 윈도우에서 아나콘다를 이용해 jupyter / tensorflow / pytorch 풀 세팅 1. 그래픽카드 드라이브 설치(최신으로) (아래 링크에서 해당 그래픽카드 선택 후 받아서 설치) https://www.nvidia.co.kr/Download/index.aspx?lang=kr 2. cuda 설치 (10.2 설치해도 된다.) (윈도우 10일 때 아래 링크 파일) http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_441.22_win10.exe [중요] cudart64_101.dll 문제 해결 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\.. 2020. 4. 7. CUDA out of memory error 문제 RuntimeError: CUDA out of memory. Tried to allocate 300.00 MiB (GPU 0; 4.00 GiB total capacity; 2.69 GiB already allocated; 220.35 MiB free; 2.71 GiB reserved in total by PyTorch) 결론부터 말하자면 위와 같은 에러가 발생했다면, mini_batch 사이즈를 줄이거나 이미지를 리사이징 하는 방법 정도 외에는 방법이 없다. (혹은 그래픽카드를 업그레이드/추가 하는 방법이 있긴 하다.) 작업관리자 상에서 cuda를 확인해보면 공유 GPU메모리가 7.9GB가 놀고있는게 보인다. 저걸 사용하는 방법을 찾아보려 하였으나, 사실 공유 GPU메모리는 GPU에 실존하는 메모리가 아.. 2020. 3. 29. 이전 1 다음