용어정리
Data Catalog는 데이터 거버넌스(Data Governance)를 지원하는 서비스입니다. 따라서 데이터 거버넌스 분야에 사용되는 용어가 다수 사용됩니다. 이 문서에서는 다음과 같은 데이터 거버넌스(Data Governance)와 Data Catalog 서비스에서 사용되는 용어를 먼저 정리힙니다.
- Data Governance 용어 참조
Data Governance
Data Governance란 기업에서 가치 있는 양질의 데이터를 지속적으로 발굴하고 관리하여 비즈니스 자산으로 활용하기 위한 데이터 통합 관리 체계다.
- 동의어: 데이터 거버넌스, 데이터 통합 관리
데이터가 다양한 저장소 분산고 데이터 양이 급증하면 다음과 같은 상황이 발생할 수데이터가 통합되기 어렵되고 결과적으로 사용빈도가 없는 다크 데이터가 증가하게 된다. 데이터 통합 및 관리 부족으로 발생할 수있는 의도하지 않는 정보 노출과 관리 비용을 줄이고, 고품질의 데이터를 발굴하여 데이터를 높이는 지속적인 프로세스를 데이터를 Data Governance리고 한다.
Data Havest(Data Havesting)
- 유사 용어: Information Havesting
data harvesting in the online world refers to gathering user information (by way of email addresses, IM handles, social media sites, surfing behaviors, online ads clicked on, etc.) from the Internet. Data harvesting is the leading method spammers use to acquire new addresses.
Historical perspective: In March, 2018 The New York Times reported that 50 million Facebook users had their profile information harvested by a Trump-connected data analytics firm Cambridge Analytica via a personality app on the site, later prompting a #DeleteFacebook movement.
To see what’s connected to your Facebook account, login to Facebook and go to your Settings. From there, check the Active tab under the Apps and Websites. The panel will show you all the apps that have access to your Facebook account.
To see what’s connected to your Google account, go to myaccount.google.com and from there, go to Apps with account access under the Sign-in & security. The next page will show you all the apps that have access to your Google account as well as all the sites you have saved passwords for using Google Smart Lock.
- 출처
Data Steward
- 동의어: 데이터 관리자
데이터 거버넌스 또는 데이터 책임 프로그램에 의해 설정된 데이터 관련 책임을 갖는 사람을 의미한다. Data Steward의 역할에 따라 다음과 같이 여러가지 유형으로 구분할 수있다.
- Data Quality Steward(데이터 품질 관리자)
- Data Definition Steward(데이터 정의 관리자)
Data Usage Steward(데이터 사용 관리자)
Technical Metadata
“Technical metadata“는 데이터 변환 룰, 데이터 스토리지 구조(Data Storage Structure), 시멘틱 레이어와 인터페이스 레이어에 대한 메타 정보를 의미한다.