데이터분석을 직접 시작하는 것도 좋지만 저는 아무래도 데이터분석을 잘해놓은 Kernel을 먼저 참고하기로 결심했습니다. 저는 neural network로 시작을 해서 나름 은메달로 상위권이였는데... 4일만에 50퍼센트의 등수로 떨어질 정도로 많은 분들이 빠르게 정확도를 올리고 있습니다. 분류분석인만큼 많은 캐글 고수님들이 다양한 분석기법을 이용한 Kernel을 사용하고 있습니다. 이 중에서 가장 눈에 띄는것은 Chris Deotte라는 분인데 현재 (5월 25일 기준) 대회에서 1등을 하고 계신 분입니다. 이분이 쓰는 분석기법은 SVM (Support Vector Machine), Logistic Regression, neural network을 쓰고 있습니다. (다른 Kernel을 보면 lightgb..
대회 기간: 2019년 5월 18일 ~ 2019년 6월 21일 대회 상금: $5,000 대회 속성: Featured Code Competition Instant Gratification은 분류 분석을 기반으로 한 캐글 내 공모전으로 모든 데이터 속성들은 익명화되어있습니다. 데이터들은 train, test, sample_submission 데이터셋으로 구성이 되어있으며, - train 데이터는 총 262k row와 258개 column (257개 독립변수, 1개 종속변수)으로 구성 - test 데이터는 총 131k row와 257개 column으로 구성 - sample submission은 131k row와 id, target 컬럼으로 구성 데이터의 구성이 익명으로 되어있는만큼 각 데이터의 속성을 파악하는..
- Total
- Today
- Yesterday
- 빅데이터공모전
- instantgratification
- significant level
- 분류 모델 성능 평가지표
- 텍스트분석
- 캐글
- 데이터분석공모전
- 비전공자데이터분석
- 표본 추출
- 데이터분석
- 주식종목예측시나리오
- 국립국어원대회
- 추천시스템논문
- 딥러닝추천시스템
- kaggle
- 자연어처리공모전
- 딥러닝추천모델
- 대응표본 검정
- denserepresentation
- kaggle competition
- 국어정보처리시스템경진대회2020
- featureselection
- 데이터분석 척도
- 독립표본 t 검정
- recommendationsystem
- wordembedding
- 통계 척도
- 통계 분류 검증
- 일표본 검정
- featureextraction
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |