프로세스 마이닝을 위한 3대 필수 요소가 있습니다. Case, Activity, Timestamp 이 3가지입니다.
이 3가지를 기존 로그 데이터로부터 어떻게 선정하냐의 문제도 있지만, 앞으로 프로세스 마이닝을 잘 하기 위해 로그 데이터를 어떻게 남겨야 할까도 중요 포인트입니다. 과거도 중요하지만 미래에 쌓을 데이터도 분명 중요할 테니까요. 저는 프로세스 마이닝 전문가나, 분석 전문가가 아닌 개발자/일반인 입장에서 얘기해 보고자 합니다.
먼저, Activity 와 Timestamp는 정의하기가 비교적 쉽습니다.
Activity는 발생한 사건이라고 생각하면 되는데요. 일상생활에서 보자면, “일어남”, “물을 마심”, “세수를 함”, “이를 닦음”, “밥을 먹음”, “다시 잠을 잠”, “집을 나감” 과 같은 일련의 행동들이라고 보면 됩니다. 웹 사이트의 경우 “로그인”, “받은 편지함”, “메일 읽기” 와 같은 행동들로 볼 수 있고, 병원의 경우에는 “접수”, “진료 대기”, “진료”, “처방전 발행”, “수납” 과 같은 행동으로 볼 수 있습니다.... |