R/R

[R] 22. 데이터시각화(plot함수)

구름솜:D 2023. 12. 8. 20:18
728x90

시각화(visualization)란 데이터를 시각적으로 나타내는 것을 말한다.

R은 데이터 분석 및 시각화에 널리 사용되는 프로그래밍 언어 중 하나로 데이터를 시각화 할 수 있는 여러가지 기본함수와 패키지가 존재한다.

 

plot()함수는 산점도로 시각화하는 함수로, 일반적으로 객체를 시각화 하는데 모두 사용할 수 있다.

일반적으로는 데이터를 산점도 그래프나 선그래프로 시각화한다.

 

plot()함수에는 다양한 옵션이 있다.

이 중 주요 사용되는 옵션은 다음과 같다.

plot(x,                                 # x축좌표
      y = NULL,                     # y축좌표
      type = "p",                    # 그래프 타입(p:산점도, l:선그래프, ...)
      xlim = NULL,                # x축 좌표 범위
      ylim = NULL,                # y축 좌표 범위
      log = "",                        # y축 좌표 log변환
      main = NULL,              # 그래프의 제목
      sub = NULL,                # 그래프의 sub 제목
      xlab = NULL,               # x축 이름
      ylab = NULL,               # y축 이름
      ann = par("ann"),         # 축 제목 출력 여부
      axes = TRUE,              # 축 출력 여부
     ...)

 

* dev.new()코드를 통해 화면창을 띄어 시각화된 그래프를 확인할 수 있다.

* par(mfrow = c(rows, cols))코드를 통해 한 화면에 여러개의 그래프를 한번에 볼 수 있다.

 

다음 코드를 실행하면 아래와 같이 시각화되어 나오는 그래프를 확인할 수 있다.

plot(v1,v2) 코드와  plot(v1,v2, type = 'p') 코드의 결과는 같다.

plot 함수는 산점도 그래프로 점을 표현하기에 디폴트 값으로 type 의 형태가 'p'(points) 이다. 

type옵션

type 옵션은 시각화 시 나타내는 그래프의 종류를 표현

  • type = 'p' : for points (점그래프(default))
  • type = 'l' : for lines (선그래프)
  • type = 'b' : for both points and lines (점그래프의 점을 선으로 이은 그래프)
  • type = 'c' : for the lines part along of 'b'                                                                                         ('b' type의 그래프에서 점은 생략하고 선만 표현한 그래프) 
  • type = 'o' : for both overplotted (점그래프와 선그래프를 모두 표현한 그래프)
  • type = 'h' : for histogram (vertical lines) (막대선그래프)
  • type = 's' : for stair steps (계단형그래프)
  • type = 'n' : for no plotting (점을 표시하지 않은 비어있는 그래프)

 

 

lty옵션

lty옵션은 그래프 위의 선 디자인을 변경

  • lty = 0(lty = 'blank') : 그리지 않음
  • lty = 1(lty = "solid'): 실선(default)
  • lty = 2(lty = "dashed') : 대시
  • lty = 3(lty = "dotted') : 점
  • lty = 4(lty = "dotdash') : 점과 대시
  • lty = 5(lty = "longdash') : 긴 대시

lty 옵션 사용시 각 선 모양의 번호

 

 

main, xlim, ylim, xlab, ylab 옵션

  • main옵션은 그래프의 제목을 선언
  • xlim,ylim옵션은 각 축의 범위 설정
  • xlab,ylab옵션은 각 축의 이름 지정

 

main, xlim, ylim, xlab, ylab 옵션을 사용하지 않은 경우/ 옵션을 사용한 경우

 

ann, axes옵션

  • ann옵션은 축 제목의 출력 여부 표현. ann =  F 로 선언하면, v1,v2 축을 알려주던 이름이 그래프에 출력되지 않는다.
  • axes옵션은 축의 출력 여부 표현. axes = F로 선언하면 그래프축이 생략되고 v1,v2의 그래프 형태만 출력된다.

 

아무 옵션이 없는 경우/ann옵션을 F로 설정한 경우/axes옵션을 F로 설정한 경우

 

cex, col, pch 옵션

이 옵션은 그래프를 디자인하는 옵션이다.

  • cex는 그래프의 점의 크기를 변경.
  • col는 그래프의 색상 변경.
  • pch는 그래프의 점의 모양을 변경.

 

cex(점의크기) 5로설정, col(색상) 2('red')로 설정/pch(점의모양) 11로 설정

 

pch옵션 사용 시 각 모양의 번호
col 옵션사용시 각 컬러의 번호

'R > R' 카테고리의 다른 글

[R] 23. 시각화 - 그래프 디자인하기  (0) 2023.12.08
[R] 09. 조건문(ifelse/if문)  (0) 2023.12.05
[R] 08. 문자열관련함수(stringr)  (0) 2023.11.29
[R] 04. 함수(function)  (0) 2023.11.22
[R] 03. 형 변환(casting)  (0) 2023.11.22