Date 2/800: Một định nghĩa về Data Profiling
Data profiling là 1 quá trình phân tích Raw Data để có cái nhìn sâu bên trong. Mục tiêu của nó là phân tích metadata trong khi metadata này ko available khi nó available.Data profiling bao gồm các giải thuật phân tích và thống kê khác nhau.
Data profiling is a process of analyzing raw data for the purpose of characterizing
the information embedded within a data set. Data profiling consists of different
statistical and analytical algorithms that provide insight into the content of data sets,
and qualitative characteristics of those values. One goal of profiling data is to
discover metadata when it is not available and to validate metadata when it is
available. Data profiling incorporates column analysis, data type determination,
cross-table analyses, and exploration and discovery of relationships and dependencies
across columns. The result is a constructive process of information inference to prepare a data set for later integration.
Post a Comment