본문 바로가기

반치용/기타 및 저장74

[중요]XGBoost 개념 및 전반적인 내용 https://brunch.co.kr/@snobberys/137 XGBoost 사용하기 지루하고, 재미없기 짝이 없지만 꾸준한 조회수를 보장할 것 같은 글 | 소개 시작은 캐글(kaggle)이었다. 캐글이 무엇인지 처음 읽는 분들을 위해서 잠깐 설명하자면, 은 과학자들이 통계적 문제를 놓고 경쟁하는 온라인 플랫폼이다. 비유하자면 엔지니어들의 랄까. 다만 누가 더 랩을 잘 하는가에 대한 평가는 심사위원이 아니라 수치로 집계된다. 지원자들은 학력, 나이에 관계없이 공개된 데이터를 다운로드하고, brunch.co.kr 얼른 다뤄보고싶다... 제대로 이해하기 위해서는 선행학습할게 많지만, 일단 간단히 전처리된 내용만으로라도 조물조물 해보고싶다. 이 글에 예제까지 있다. 2020. 1. 20.
[저장]자유도에 관해 여러 번 들었지만 제대로 이해도 안되고 와닫지 않던 자유도를 왜 사용하는 잘 설명한 글을 발견했다. https://brunch.co.kr/@zhoyp/174 자유도 통계학에서 자유도(degree of freedom)란 무엇일까요?보통은 이렇게 설명합니다. 표본 n 개를 선택할 때에 마지막 1개는 모집단의 평균과 같아지도록 표본집합을 구성하도록 brunch.co.kr 참 쉽죠라고 하는 건 별로 안 쉽더라. 다만 나한테 필요하던 설명이 더 있었다. 요약하자면 편차를 분산으로 재는 방식으로 인해 모 분산과 표본 분산간의 차이가 생기는데, 그 비율이 (n)/(n-1)이고, 약분 과정에서 (n)이 사라지고 남는 n-1을 자유도라 칭하는 것이다. 결국 모분산에 근접하기 위한 방법이고, 자유도에 따라 편향되는 분산을.. 2020. 1. 20.
[저장]데이터 분석 관련 주요 사이트 모음 https://www.finereport.com/kr/%ec%b1%85%eb%b3%b4%eb%8b%a4-%ed%8e%b8%ed%95%9c-30%ec%a2%85-%eb%b9%85%eb%8d%b0%ec%9d%b4%ed%84%b0-%eb%b6%84%ec%84%9d-%ec%8a%a4%ed%84%b0%eb%94%94-%ec%82%ac%ec%9d%b4%ed%8a%b8-%eb%aa%a8%ec%9d%8c/ 2020. 1. 13.
[저장] R 위치기반 분석 https://github.com/R-Korea/weekly_R_quiz/blob/master/202001/2.points_allocation/points_allocation_answer.R https://m.facebook.com/groups/1112017755528528?view=permalink&id=2763449273718693 2020. 1. 13.
[저장]네트워크 r shiny https://www.statworx.com/de/blog/interactive-network-visualization-with-r/ 2020. 1. 9.
[저장]데이터 엔지니어 자료구조, 알고리즘, OS, 네트워크 하둡/스파크 ELK 스택 Task Management도구 Airflow, Luigi 2020. 1. 8.