14:00 PM ~ 15:00 PM Room 4004
Seokheon Cho, ph. D. / Principal Network Architect
Overview of KNIME
KNIME Diagram
Create는 무료
● Gather & Wrangle
- 모든 소스에서 데이터 수집 및 형성
- 모든 데이터로 부터 접근, 합병, 변환이 가능
● Model & visualize
- 직관적이고 시각적인 워크플로우 환경에서 다양한 데이터 소스 연결
- 사용자가 선택한 도구들로 데이터에 의미를 줌
KNIME Analytics Platform
- KNIME 확장성
- KNIME 통합
- 커뮤니티 확장
- 파트너 확장
Productionize는 유료
● Deploy & Manage (배포 및 관리)
- 전사적 데이터 과학 연습을 지원
● Consume & Optimize (소비 및 최적화)
- 데이터를 통해 얻은 통찰력을 활용
KNIME Server
- KNIME 웹포탈
- 데이터과학 서비스
Why KNIME ?
● 오픈 소스 기반 소프트웨어 + 상용 서버용 소프트웨어
- KNIME analytics platform (무료) + KNIME server (유료)
● 직관성
- workflow-based analysis
● 접근성
- Database systems, Hadoop files, Hive files
● 효율성
- Drag-and-drop
● 다양한 언어 지원
- R, Python, Java
● 개방적
- 정형 데이터 및 비정형 데이터에 대한 분석
Installation
● Website
설치 하고 나서 확장자를 늘려야 한다.
File - install KNIME Extensions..
1. KNIME & Extensions
2. KNIME Big Data Extensions
3. KNIME Community Extensions - Other
4. KNIME Labs Extensions
를 체크하고 next를 눌러 확장자를 설치한다. 이렇게 해야 필요한 노드를 사용할 수 있다.
새로운 Workflow 생성
● Workbench 상단 메뉴
● File -> New -> New KNIME Workflow -> Finish
● 새로운 Workflow Group 생성
- Workbench 상단 메뉴
- File -> New -> New KNIME Workflow Group -> Finish
● 새로운 Workflow Group 생성
- Workbench 상단 메뉴
- File -> New -> New KNIME Workflow Group -> Finish
1. KNIME Explorer
ex)
● Workflow files을 포함하고 있는 카테고리별 workflow group files 생성
2. Node Repository
● Workflow editor에서 사용할 수 있는 노드 저장소
● 노드 검색 ex) linear regression
3. Workflow Coach
● 현재 선택한 노드 다음에 어떤 노드가 가장 많이 사용되는지 제안
● Community node recommendation
- View -> Workflow Coach -> Configure.. 하고 (Node recommend by the Community) 체크표시
- File -> Preferences -> Workflow Coach 하고 (Node recommend by the Community) 체크표시
4. Workflow Editor
● Node port
- input port, output port / 인풋 아웃풋
- ex) file reader, joiner
● Node status
- RED : 비활성화 상태
- YELLOW : 노드가 설정됨. 하지만, 노드 비실행 상태
- GREEN : 노드가 성공적으로 실행된 상태
● Connection between nodes
- ex) file reader, joiner, linear regression learner, regression predictor, numeric scorer
- ex) 파일 판독기 / 가입자 / 선형 회귀 학습자 / 회귀 예측 변수 / 숫자 득점자
● Execution
● Statistics
5. Node Description
● 노드 도움말
- 선택한 노드 역할, 옵션 및 포트에 대한 설명
- 노드가 포함된 확장 기능 설명
6. Outline
● Workflow Editor의 축소판 화면
7. Console
● 실행된 워크플로우의 상태나 실행 중 발생한 경고 메시지 출력