본문 바로가기

분류 전체보기187

딥러닝의 30가지 적용 사례 https://brunch.co.kr/@itschloe1/23 2019. 8. 5.
작은 반쌤이 물어다 준 정보(데이터 과학 관련 가이드라인 및 팀 빌딩 관련) https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki Team-Neighborhood/I-want-to-study-Data-Science 데이터 사이언스를 공부하고 싶은 분들을 위한 글 . Contribute to Team-Neighborhood/I-want-to-study-Data-Science development by creating an account on GitHub. github.com https://www.slideshare.net/mobile/zzsza/tf-9-160560910 TF에서 팀 빌딩까지 9개월의 기록 : 성장하는 조직을 만드는 여정 DSTS2019에서 발표한 자료입니다 :) 슬라이드쉐어 이슈로 다운로드가.. 2019. 8. 5.
구글 클라우드 기반 쥬피터 노트북 구축 1. 구글 클라우드 세팅 (전부터 해보고싶었는데... 시간이랑 심적 여유가 없었음. 6개월정도 공짜로 사용가능하게 세팅함) 2. 가상 리눅스환경 세팅 3. 파이썬 종합선물세트 설치 (파이썬, 쥬피터노트북, 텐서플로, 파이토치등) 4. 도메인 연동해서 어디서나 접속가능하게 세팅함 5. winscp 원격접속 세팅 완료 6. pandas 학습 느낀점 : psm 엄청 급하면 구글 클라우드로 임시 컴퓨터 만들어서 쓰는것도 좋을 것 같음 몇 일 바짝 써도 만원도 안나올 것 같음 인공지능 컴퓨팅이 생각보다 저렴함. P100 (1080ti의 10배정도 계산속도) 4개 꽂은 컴퓨터 8core(물리) ssd 1200gb 정도를 1달간 풀로 돌리는데 400만원 정도... 하루에 13.3만원꼴? 시간단위로 종량제라 실제로 쓸.. 2019. 8. 1.
유동ip 혹은 private 네트워크용 ssh 터널링 http://blog.naver.com/PostView.nhn?blogId=alice_k106&logNo=221364560794&parentCategoryNo=&categoryNo=22&viewDate=&isShowPopularPosts=false&from=postView 외부IP를 가진 서버가 있어야 실행가능한 방법 클라우드를 이용해서 서버를 구축하고 내부 컴퓨터들을 분배해서 사용하는 것도 방법일 수 있음 간편하게 이용할 수 있고, 암호화도 자동으로 해 주지만 단점으로는 대용량 파일 전송시 속도가 느림 2019. 8. 1.
R studio 메모리 정리 분명히 없어야 하는 값들이 튀어나오는 상황을 발견. 메모리에 남아있던 찌꺼기들이 예상치못하게 로딩되는 경우로 예상함. rm(list = ls()) # 작업공간에 있는 모든 객체를 삭제 gc() # 더이상 사용되지 않는 메모리를 R로 하여금 강제로 해방 rm 부분만 하면 메모리 자체가 해방되진 않는 것 같음. gc까지 해 줘야 됨. 최종확인시 해당 코드 필수인 것 같음. 2019. 7. 19.
연구 관련 idea 1. 진단 건 ( 20t U 40t )에 대한 약물 처방 ( 60t ) 진단별 약물 각각에 대한 빈도를 기준으로 계산함. - 단순히 빈도로 하면, 자주 적어지는 진단명에 해당하는 약물이 더 강한 가중치가 가게 됨. - 일단 여기까진 coding & 결과까지 완료. - 기준이 필요함. 2. 진단은 개별 진단보다는 진단 묶음 기준으로 보는 것이 의미있지 않을까? - 질병1 -> 질병묶음A -> 약물x - 질병2 -> 질병묶음A -> 약물y - 질병3 -> 질병묶음A -> 약물z - 질병묶음은 순서 고려 / 순서 미고려 둘 다 의미있을 것 같음 - 다만 네트워크에서는 순서를 미고려해야 결과 정리가 될 것 같음 3. 질병묶음의 순서와 약물 처방 순서를 이용해서, EMR 구축시 앞선 질병 진단 코드를 바탕으로 추.. 2019. 7. 19.