1. 평균 전체를 아우르는 값. 모든 데이터를 반영하기때문에 가장 쉽게 쓰이는 값. 통계에서는 Mean 으로 쓴다. 단점 : 아웃라이어같은 존재에 쉽게 값이 훼손되기 때문에 다른 분석값과 비교해봐야함 r 함수 : mean() 2. 중앙값 전체배열에서 중간에 있는 값. 아웃라이어에 훼손당하지 않음. Median 이라고 쓴다. 자체에 의미보단 Mean 값을 보완하기 위해 쓰이는 경우가 많다. r 함수 : median() 3. 범위값 최소 - 최대를 봄. 아웃라이어에 훼손당하기 쉬워서 사분위 범위를 사용한다. 25% 50% 75% 100% 구간별로 (이때 % 는 중앙값을 구하는 방식과 같이 구함. 순서대로 세우는 방식) 4분위 범위를 만든다. 이를 IQR 이라고 부르는데 Boxplot을 이용해 표시하면 중앙값..
install.packages("KoNLP")install.packages("wordcloud")install.packages("RcolorBrewer") library(KoNLP)library(wordcloud)library(RColorBrewer) src_dir 4] wordcount2 = sort(wordcount1, decreasing = T)head(wordcount2,30)write.csv(head(wordcount2,30),file="c:/R/chu.csv") #wordcount1 #pal =2}, undata)data= Filter(function(x){ length(grep("&", x)) < 1 }, data)data= Filter(function(x){ length(grep("[0-9..