(재수정)DB통합 질문 0 7 639

by 힘내라김대리 [DB 모델링/설계] [2019.02.11 10:51:25]



다시 수정해서 올립니다.

---------------------------------------------------------------------

통합DB 구축 방법에 관련되서 질문을 드립니다.

A라는 곳에는 고객정보가 들어있습니다.

회원ID, 생년월일, 핸드폰번호, 주소 등등의 회원정보가 DB에 저장되어 있구요

B라는 곳에는 고객의 거래 데이터가 들어있습니다. A에 속해있는 회원과 속해있지 않은 비회원 거래내역이 있습니다.

 

A에 있는 고객정보와 B에 있는 거래데이터를 가지고 통합 DB를 구축하여, 분석 및 고객정보를 통합합니다.

여기서 고객정보를 통합한다는 의미는

A에 있는 고객 홍길동이 아이디를 hong1, hong2.... 등으로 만들어놨습니다.

B에도 hong1, hong2 등으로 구매를 했겠지요

이처럼 한명의 고객이 여러ID로 생성하고 활동했다고 하면

하나의 ID를 대표로 설정한다든지 회원 정보를 정리를 해야합니다.

 

하지만 여기서 

B에있는 거래DB에는 접근할 수 있는 권한은 없고 거래 데이터를 엑셀파일로 제공을 합니다.(일별)

이 엑셀 파일을 가지고 A에 있는 고객정보와 매칭을 해야하는데

거래 데이터에 존재하는 고객데이터중 일부 데이터가 마스킹(*)처리 되어있습니다.

예를들면, 고객ID, 생년월일, 휴대폰번호 등등이 중간중간 * 표시로 되어있습니다.

보기에는 데이터통합이 불가능해 보이는데.....

다른 방법을 강구해야하는데...다른방법이 마땅히 떠오르지 않네요

어떻게 하면 될까요??

by 신이만든지기 [2019.02.11 11:10:08]

데이터 통합이라는 말은 정확히 어떤 의미인가요?

마스킹된 데이터와 데이터 통합과는 어떤 관계인가요? 뭣 때문에 통합이 불가능해 보인다는 건지 의미를 모르겠네요.


by 힘내라김대리 [2019.02.11 12:41:07]

제가 설명을 자세히 하지 못한것 같아서 다시 수정해서 올렸습니다.

그래도 이해가 가지 않으신다면, 다시 또 수정해서 자세히 올리겠습니다.


by 마농 [2019.02.11 11:25:42]

단순 통합이라면? 마스킹된 상태 그대로 통합도 가능하겠지요.
통합 후 두 테이블을 연관지어 자료를 뽑아야 한다면? 마스킹을 풀어서 통합해야 하겠네요.
마스킹된 자료로부터 원본자료 추출이 가능한지 확인해 보세요.


by 힘내라김대리 [2019.02.11 12:41:50]

마스킹 데이터를 풀수없이 제공해줍니다..


by 마농 [2019.02.11 13:07:24]

두가지 질문이 혼합되어 있네요.
1. 한명의 고객이 두개 이상의 ID 를 발급받은 경우
  - (생년월일 + 이름)등의 식별자를 기준으로 통합하면 됩니다.
2. 거래 데이터를 고객별로 분석하려면?
  - 고객ID가 마스킹되어 있다면 불가능 하겠지요?
3. 완벽하진 않지만 불완전 조인은 가능할 듯 합니다.
  - (고객ID, 생년월일, 휴대폰번호)를 동일한 규칙으로 마스킹하여 조인
  - 휴대폰 번호는 변동 가능하여 논란의 여지가 있음.(고객ID, 생년월일)


by 힘내라김대리 [2019.02.11 13:28:54]

자세한 답변을 주셔서 감사합니다.

정확한 데이터를 확인하지 않았지만, 일단 마스킹된 데이터(엑셀)를 살펴보고 다시 여쭤봐야겠습니다.


by 신이만든지기 [2019.02.11 15:02:02]

고객을 식별할 수 있는 유니크한 값(식별자)이 있어야겠네요.

예를 들면 마스킹 안된 고객번호 같은 것 말이죠. 

마스킹된 식별자 밖에 없다면 마농님 말씀처럼 식별자를 동일하게 마스킹 처리하여 조인하는 방법밖에는 없겠습니다.

예)

고객번호 1234, 아이디 : hong1

고객번호 1234, 아이디 : hong2

 

댓글등록
SQL문을 포맷에 맞게(깔끔하게) 등록하려면 code() 버튼을 클릭하여 작성 하시면 됩니다.
로그인 사용자만 댓글을 작성 할 수 있습니다. 로그인, 회원가입