Data 분석 과정
- 문제 인식 → 데디터 수집과 가공 → 데이터 분석 → 분석 결과 실행
- 여기서 2번째 단계를 전처리(Pre-processing)라고 하는데, 전체 과정에 70%~80퍼를 차지하고 있음
- 데이터 수집과 가공, 데이터 분석 과정에 SQL을 쓸 수 있다.
정형 데이터와 비정형 데이터
- 정형 데이터는 틀이 잡혀있는 데이터, 업무용 데이터 베이스와 같은 곳에서 가지고 오는 데이터
- 비정형 데이터는 틀이 잡혀있지 않은 데이터, 텍스트, 이미지, 음원 데이터, 빅데이터 등
- 여기서 SQL은 정형 데이터로 만들어진 관계형 데이터 베이스를 조작할 수 있는 언어
SQL is...
- a standard language for storing, manipulating and retrieving data in databases
→ 데이터베이스에 데이터를 저장, 조작 및 검색하기 위한 표준 언어
What Can SQL do?
- SQL can execute queries against a database(SQL은 데이터베이스에 쿼리를 실행시킬 수 있다.)
- SQL can retrieve data from a database(SQL은 데이터베이스에서 데이터를 뽑아낼 수 있다.)
- SQL can insert records in a database(SQL은 데이터베이스에 레코드를 넣을 수 있다.)
- SQL can update records in a database(SQL은 데이터베이스에 레코드를 업데이트할 수 있다.)
- SQL can delete records from a database(SQL은 데이터베이스에 레코드를 삭제시킬 수 있다.)
- SQL can create new databases(SQL은 새 데이터베이스를 만들 수 있다.)
- SQL can create new tables in a database(SQL은 데이터베이스에서 테이블을 만들 수 있다.)