1. 머신러닝
- 모델 결정
- 주요 메트릭 정리 : 특히 AUC
- validation에 대한 로직
2. 회귀
- 다중공선성 정리
- 변수선택
- 회귀 진단
3. 텍스트 마이닝
- fread( ) 함수를 이용해 readLines의 효과내기 : f <- fread("Batting.csv", sep= "?", header = FALSE)[[1L]] # 파일에 없는 구분자를 사용
차라리 sep="\n" 라고 두는 것이 가능하면 이렇게도 괜찮을 듯?
[[1L]] 을 추가하면 캐릭터 타입으로 변경됨. (왜인지는 모르겠음)
- 한글 불러올 때 문제점
- 워드클라우드
- 명사/형용사
- 정규표현식(쓸데 없는 표현 제거 정리)
- 감성분석
ㆍ감성사전 등록
ㆍ분석 대상 전처리(불용어 처리)
ㆍ본문 단어와 긍정/부정 감성 사전 단어를 매칭
ㆍ이를 계산하여 결론을 산출하는 로직 구현
'자격증 > ADP' 카테고리의 다른 글
13회차 ADP실기 합격 및 자격증 취득 (2) | 2019.08.06 |
---|