15:00 PM ~ 16:00 PM Room 4004
Seokheon Cho, ph. D. / Principal Network Architect
Data Collection & Storage in KNIME
형식 파일 가져오기
● 대상 형식 파일 : csv file, text file
● Node : File reader
● 문자형
- I (Interger : 정수형), D (Double : 소수형), S (String : 문자형)
- 오른쪽 마우스 클릭 -> Configure -> Input location의 File 란에 Browse를 클릭하여 원하는 csv 파일을 찾은 후 Apply를 한다.
액셀 파일 가져오기
● 대상 액셀 파일 : *.xls, *.xlsx
● Node : Excel Reader
데이터베이스 테이블 가져오기
● 주요 해당 데이터베이스
- PostgreSQL, MySQL
● Node : Database Reader
● Database Driver
- PostgreSQL : org.postgresql.Driver
- MySQL : com.mysql.jdbc.Driver
● Database URL : 데이터베이스 드라이버 경로 지정
- Ex:jdbc:mysql://relational.fit.cvut.cz:3306/northwind
--- Guest / relational
Hadoop File 가져오기
● 하둡 파
일을 PC에 저장
- Nodes : HDFS connection + Download
● PC에 저장된 파일 읽기
- Nodes : File Reader
Hive Table 가져오기
● Nodes : Hive Connector + Database Table Selector + Database Connection Table Reader
* 데이터베이스 드라이버란?
컴퓨터 시스템에서 다른 유형의 다른 시스템에 연결하려면 어댑터 프로그램이 필요. 프린터 드라이버를 사용해 프린터를 컴퓨터에 연결하는 것과 마찬가지고 DBMS(데이터베이스 관리 시스템)는 다른 시스템에서 데이터베이스 연결을 가능하게 하는 데이터베이스 드라이버가 필요하다.
* 실습 때 우리 버전은 최신 버전인 4.7.0이었고 교수님의 버전은 4.6.~ 이었는데 그래서인지 Databse URL 노드가 없어서 실습에선 진행하지 않았고 추후에 파일을 제공 받았다.
형식 파일로 내보내기
● 해당 형식 파일 : *.csv
● Nodes : CSV Writer
ex)
KNIME Explorer의 기본 제공 예제 파일을 활용해서 File Reader와 CSV Writer 노드 사용을 해보자.
LOCAL -> Basic Examples -> TheData -> Basics -> adult.csv를 File Reader로 불러온다.
파일을 불러오면 노란색 불로 바뀐다. 오른쪽 마우스를 눌러 Execute 실행을 누르면 초록 불로 바뀐다.
이제 csv 파일을 내보내보자. CSV Writer 오른쪽 마우스를 눌러 Configure..를 누른다.
Input location의 File 칸 Browse..를 눌러 내가 불러내고 싶은 곳에 위치하고 파일명을 입력한 뒤 Apply를 하면 해당 장소로 csv 파일을 내보낸다. 그리고 Excel Writer 오른쪽 마우스를 눌러 Excute를 실행하면 끝!
엑셀 파일로 내보내기
● 해당 형식 파일 : *.xls, *.xlsx
● Nodes : Excel Writer
ex)
KNIME Explorer의 기본 제공 예제 파일을 활용해서 Excel Reader와 Excel Writer 노드 사용을 해보자.
LOCAL -> Basic Examples -> TheData -> Customers -> CallsData.xls를 Excel Reader로 불러온다.
파일을 불러오면 노란색 불로 바뀐다. 오른쪽 마우스를 눌러 Execute 실행을 누르면 초록 불로 바뀐다.
이제 엑셀 파일을 내보내보자. Excel Writer 오른쪽 마우스를 눌러 Configure..를 누른다.
Input location의 File 칸 Browse..를 눌러 내가 불러내고 싶은 곳에 위치하고 파일명을 입력한 뒤 Apply를 하면 해당 장소로 엑셀 파일을 내보낸다. 그리고 Excel Writer 오른쪽 마우스를 눌러 Excute를 실행하면 끝!
데이터베이스 테이블로 내보내기
● 해당 데이터베이스 : PostgreSQL, MySQL
● Nodes : Database Writer
● Database Driver
- PostgreSQL : org.postgresql.Driver
- MySQL : com.mysql.jdbc.Driver
Haddop File 내보내기
HIVE 테이블로 내보내기