R 8

[R] 22. 데이터시각화(plot함수)

시각화(visualization)란 데이터를 시각적으로 나타내는 것을 말한다. R은 데이터 분석 및 시각화에 널리 사용되는 프로그래밍 언어 중 하나로 데이터를 시각화 할 수 있는 여러가지 기본함수와 패키지가 존재한다. plot()함수는 산점도로 시각화하는 함수로, 일반적으로 객체를 시각화 하는데 모두 사용할 수 있다. 일반적으로는 데이터를 산점도 그래프나 선그래프로 시각화한다. plot()함수에는 다양한 옵션이 있다. 이 중 주요 사용되는 옵션은 다음과 같다. plot(x, # x축좌표 y = NULL, # y축좌표 type = "p", # 그래프 타입(p:산점도, l:선그래프, ...) xlim = NULL, # x축 좌표 범위 ylim = NULL, # y축 좌표 범위 log = "", # y축 좌표..

R/R 2023.12.08

[R] 09. 조건문(ifelse/if문)

조건문이란, 주어진 조건식의 결과에 따라 별도의 명령을 수행하도록 제어하는 명령문으로 프로그래밍에서 조건을 판단하여 해당 조건에 맞는 상황을 수행하기 위해 처리하는 문장을 말한다. R에서는 조건문을 수행하는데 ifelse문과 if문 두가지로 구현할 수 있다. ifelse와 if문은 스칼라 단위로 하나씩 조건을 확인하기에 조건식의 변수로 벡터, 리스트등이 선언될 수 없다. 1. ifelse함수 - 조건별로 참과 거짓일때의 리턴값 전달 가능(복잡한 프로그래밍 처리 불가) ifelse( 조건식, 참일때 리턴값(생략불가), 거짓일때 리턴값(생략불가)) v1

R/R 2023.12.05

[R] 08. 문자열관련함수(stringr)

문자열 처리 관련 stringr 패키지에 있는 외장함수를 사용하여 문자열 관련함수를 사용할 수 있다 패키지 설치 및 로드 install.packages('stringr')으로 최초 설치 후 library(stringr)으로 로딩 패키지에 있는 외장 함수 목록 확인하는 방법 1) 패키지명:: 패키지 안에 있는 함수 목록 확인 가능 stringr:: # 자동완성 기능이 안되면 조회 불가 2) ls() ls('package:stringr') 1. 대소치환 (* string:: 생략가능) [stringr::]str_to_lower(문자열) #소문자를 대문자로 치환 [stringr::] str_to_upper(문자열) #대문자를 소문자로 치환 [stringr::] str_to_title(문자열) #카멜표기법으로 ..

R/R 2023.11.29

[R] 04. 함수(function)

함수란? - 특정한 기능을 수행하기 위해 사전에 만들어 놓은 프로그래밍 구문을 묶어 놓은 것 함수의 종류 내장함수) 별도의 패키지를 설치하지 않고 사용할 수 있는 함수 외장함수) 별도의 패키지를 설치하고 사용할 수 있는 함수 사용자 정의 함수) 사전에 정의된 내장함수 이외에 사용자가 임의로 원하는 기능을 만들어서 사용할 수 있는 함수 내장함수 별도의 패키지를 설치하지 않고 사용할 수 있는 함수 ex. print(), sum(), Sys.Date(), c(), 형변환함수(as.numeric()) * Sys.Date()함수 사용 시 R은 글자의 대소문자를 구분하기에 정확하게 표기할 것 * 벡터관련내장함수 c(), append(),names() 외장함수 별도의 패키지를 설치하고 사용할 수 있는 함수 패키지(p..

R/R 2023.11.22

[R] 03. 형 변환(casting)

형 변환(Casting)은 자료형의 타입을 변환하는 것을 말한다. 형 변환이 필요한 이유는 서로 다른 데이터타입끼리의 연산이 불가능 하기 때문이다. ex, 문자타입과 숫자타입 연산 불가능, 문자타입과 날짜타입 연산 불가능 (단, 날짜 타입과 숫자 타입 서로는 연산가능) 형 변환의 종류 암시적형변환(자동형변환) : 사용자가 바꾸지 않아도 내부적으로 자료형이 변환되는 경우 명시적형변환 : 사용자가 특정 함수를 사용하여 의도적으로 자료형을 변환하는 경우 자료형과 자료구조 확인하기 mode() : 데이터의 유형을 확인하는 함수 typeof() : 데이터의 유형을 확인하는 함수 더보기 - mode()와의 차이점 : mode()함수는 정수, 실수 모두 numeric(숫자형)으로 표현, typeof()함수는 정수(i..

R/R 2023.11.22

[R] 02. 인덱싱(indexing)

인덱싱(indexing) = 색인이란 데이터의 일부분을 선택하는 작업을 말한다. 인덱싱(indexing) 은 [ ](대괄호)를 사용하여 데이터의 일부분을 선택할 수 있다. 각 자료구조마다 인덱싱(indexing)을 하는 방법이 다르다. 다른 언어와 달리 R은 인덱싱(indexing)이 '1'부터 시작한다는 것에 주의해야한다. - Java, C, C++, Python은 인덱싱(indexing) '0'부터 시작 1. 벡터(vector) - 벡터 인덱싱(indexing)은 다양한 방법으로 가능하다. v1 v1[2] [1] 2 > v1[c(3:5)] [1] 3 4 5 > v1[c(3, 5, 6)] [1] 3 5 6 2. 행렬(matrix) - 행렬은 한가지 데이터 유형으로 구성된 2차원 구조의 데이터이기에 행과..

R/R 2023.11.22

[R] 01. R의 자료구조

데이터 유형 1) 숫자형(numeric): 숫자로만 이루어진 데이터타입 2) 문자형(character): 문자로만 이루어진 데이터타입 3) 논리형(logical): TRUE(T) 또는 FALSE(F)값으로 이루어진 데이터타입 단일형데이터: 한가지 데이터 유형으로만 구성된 데이터 ex. 스칼라, 벡터, 행렬, 배열 다중형데이터: 여러가지 데이터 유형으로 구성된 데이터 ex. 리스트, 데이터프레임 0. 스칼라(scalar) - 한 가지 데이터 유형으로 구성된 0차원 구조의 데이터 - 길이가 1인 벡터 1. 벡터(vector) - 한 가지 데이터 유형으로 구성된 1차원 구조의 데이터 - ':', c(), seq(), rep() 함수를 사용하여 선언 변수명

R/R 2023.11.22