728x90 데이터분석5 1. 데이터의 저장 - 데이터베이스, 데이터 웨어하우스, 데이터마트 1. 데이터베이스(Database) 데이터베이스의 정의 데이터베이스란 컴퓨터 시스템에 저장된 구조화된 정보 또는 데이터의 조직화된 모음이다. 오늘날 운영되고 있는 가장 일반적인 유형의 데이터베이스에서 처리 및 데이터 쿼리를 효율적으로 수행하기 위해 데이터는 행과 열로 모델링된다. 데이터베이스를 통해 데이터에 쉽게 액세스하고 관리, 수정, 업데이트, 제어 및 구성할 수 있다. 대부분의 데이터베이스는 데이터 작성 및 쿼리에 SQL(Structured *Query Language)을 사용한다. ※ 쿼리(query): 찾고싶은 정보를 요청하는 것 데이터베이스 관리 시스템(DBMS)의 정의 컴퓨터에 저장되는 데이터베이스를 관리하는 소프트웨어 시스템이다. DBMS는 데이터베이스와 최종 사용자 또는 프로그램 간의 인.. 2023. 8. 5. 1-4. 논리연산자 이번 포스팅에서는 R에서의 논리연산자에 대해 알아보자. R도 다른 프로그램들처럼 참과 거짓을 판단할 수 있는 논리연산자가 존재한다. 지금까지 다뤄왔던 숫자형 데이터와는 다른 개념이다. 1. 관계 비교 연산자 R에서는 문장이 참이라면 TRUE를, 문장이 거짓이라면 FALSE를 출력한다. 예를 들어서 사용자가 "57"이라는 식을 입력하면 거짓인 식이 되기 때문에 FALSE를 출력한다. 두 값의 관계를 나타내는 연산자인 관계 비교 연산자를 알아보고, 두 값의 관계를 TRUE,FALSE의 논리값으로 출력해주는 것을 확인하자. " " : greater than " = " : greater than equal to " == " : equal " != " : different (n.. 2022. 7. 13. 1-3. 수열의 생성 이번 포스팅에서는 R에서 간단한 수열을 생성하는 법에 대해 알아보자. 1. 연속된 정수 1씩 증가하거나 1씩 감소하는 수열을 생성할 때는 : 연산자를 사용하면 된다. 뒤에 있는 수 > 앞에 있는 수일 때는 증가 수열 뒤에 있는 수 < 앞에 있는 수일 때는 감소 수열이다. 2. 간격이 정해진 연속된 정수 더 다양한 형태의 수열을 만들 때는 seq 함수를 사용한다. 인자에는 수열의 시작을 나타내는 from, 수열의 끝을 나타내는 to (to값을 넘지 않게), 수열의 증가량을 나타내는 by, 수열의 길이를 나타내는 length.out, 다른 벡터를 지정하여 길이가 같은 수열을 만들기 위한 along.with가 있다. * 이때 from, to, by 명령어는 생략하고 순서대로 입력해도 R에서 명령어를 입력한 것.. 2022. 5. 24. 1-2. 여러가지 수학 함수들 지난 시간에 이어 숫자 벡터의 연산 함수들을 알아보자. 1. 수학 함수들 r에 내장된 함수들은 다음과 같다. r에 내장된 여러가지 함수들을 활용해 코딩해보자. 2. 통계 함수들 r에 내장된 통계 함수들은 다음과 같다. r에 내장된 여러가지 통계 함수들을 활용해 코딩해보자. 사분위수를 계산하는 quantile 함수는 quantile() 안에 분위수를 구하고자 하는 벡터만을 입력하면 사분위수를 출력한다. quantile() 안에 probs를 이용해 구하고자 하는 분위수를 설정할 수 있다. (예: probs=0.25, 0.5, 0.75일 때, 상위 75%의 값, 상위 50%의 값, 상위 25%의 값을 구해준다.) *함수의 사용법(문법, 사용 인자)를 잘 모를 때에는 ?(알고자 하는 함수) 혹은 help("알고.. 2022. 5. 24. 1-1. 숫자 벡터의 생성과 연산 R에는 벡터, 행렬, 배열, 리스트, 데이터 프레임 등 다양한 자료의 저장 방법이 있다. 이 중 벡터는 같은 형태의 자료를 모아놓은 1차원 형태의 자료 저장 방법이므로 벡터를 통해 먼저 R을 배워보자. 1. 숫자 벡터 정의하기 먼저, 10, 5, 3, 4, 21을 값으로 가지는 숫자 벡터 x를 생성해보자. 여러개의 값들을 묶어서 벡터를 만들 때는 연결함수인 c (concatanation function)를 사용한다. (만들고자하는 벡터의 이름) 2022. 5. 23. 이전 1 다음 728x90