IPM을 꿈꾸는 사람들

스마트팜 데이터 활용를 위한 표준화 필요성 본문

스마트팜은 SMART하게

스마트팜 데이터 활용를 위한 표준화 필요성

오늘을 살아 2024. 10. 22. 21:00

 

스마트팜 데이터를 활용하기 위해서는 표준화가 선행되어야 합니다.
" 표준

사물의 정도가 성격 따위를 위한 근거나 기준

 

" 표준화 "

사물의 정도, 성격 따위를 알기 위한 근거나 기준을 마련함

 

" 데이터 표준화 "

현실 세계의 정보를 컴퓨터로 관리하기 위해

데이터베이스(DB)에 저장하는 항목의 명칭, 뜻, 형식, 유효값

규칙, 관리 절차 등의 특정 기준에 따라 표준을 만드는 일

 

따라서 

" 누구나 같은 의미로 이해하고 같은 방법으로

사용할 수 있는 기준을 의미 " 합니다.

 

누구나 같은 의미로 이해하고 같은 방법으로 사용
● 전산
● 현업
● 고객
● 의미를 명확하게 알 수 있는 이름
● 유일한 의미를 가지는 용어
● 데이터 표현 방법
● 제약조건

 

데이터 표준화를 반드시 해야 하는 이유

  • 표준이 서로 맞지 않는 것을 합치거나 연계할 때 표준화 이슈는 반드시 발생
  • 표준을 준용해야만 여러 제품을 쉽게 연결하고 통합할 수 있음
  • 비표준데이터는 다양한 사용자 간 의사소통의 혼란, 부정확한 정보의 생산, 관리비용의 증가
  • 믿을만한 정보를 만들기 위해서 데이터 품질 확보가 중요
  • 그 근간은 데이터 표준화에 있음

 

 

데이터 표준화 의미란?

대상 설 명
데이터 명칭 데이터를 유일하게 구별할 수 있는 유일성, 의미 전달의 충분성,
그리고 업무적 보편성을 갖는 이름으로 정의하여야 함
데이터 정의 데이터를 제3자의 입장에서도 쉽게 이해할 수 있도록 
해당 데이터가 의미하는 범위 및 자격 요건 등을 규정
데이터 형식 업무 규칙 및 사용목적과 유사한 데이터에 대해 일관되게
데이터 형식을 정의함으로써 데이터 입력 오류, 통제 위험 등을 최소화함
자료형(숫자, 날짜, 문자 등), 길이(크기)
데이터 규칙 기본값, 허용값, 허용범위 등과 같이 발생할 수 있는 데이터값을
사전에 지정함으로써 데이터의 정합성 및 완전성을 향상시킴

 

 

비표준 데이터 유형과 문제점

구분 문제점
비표준
데이터
증상
- 필수 데이터 값의 누락
- 유효형식 및 값 범위 미준수
- 동일 데이터의 중복
- 필요 시점에 데이터 누락
- 시스템 간의 데이터 불일치
업무 활용 - 시스템의 프로세스 수행 정확도 저하
- 부정확한 자료의 저장 활용
- 별도 표준 변환 작업 비용 발생
- 데이터 제공자 - 수요자 간 간극 발생
- 정보 연계와 통합의 단절

 

 

데이터 표준 구성 요소


" 표준단어 " 란 표준용어를 구성하기 위해서 단어의 표준을 정의
" 표준도메인 " 이란 표준용어에서 사용하는 데이터의 값이 공통으로 갖는 데이터 형식과 값의 영역 표준을 정의
" 표준용어 " 란 데이터 사용자 간의 명확한 의사소통을 위해 공공데이터베이스에서 업무적으로 사용되고 있는 용어의 표준을 정의
" 표준코드 " 란 표준용어 중에서 코드 도메인에 해당하는 용어를 대상으로 값을 정의



표준단어 명명 규칙

명사형 단어만 사용 → 동사/부사/접속사/복수형/소유격 사용 불가
축약단어 사용 불가  → 주민번호(×), 주민등록번호
특수문자, 띄어쓰기 사용 불가
숫자만 사용 불가 → 1(×), 200(×), 12월(○)
접두사/접미사 단독 사용 불가 → 기_납부(×), 기납부(○)
고유명사는 단일어 사용  → 금융_결제원(×), 금융결제원(○)
한글화 적용 우선 단, 범용적인 경우 예외(약어 등) → IMF(○)

 

 

표준 도메인 분류 및 명명 규칙

상위 도메인 그룹 도메인 분류
금액 가격, 가액, 금액, 급여액, 보상금, 환급금.....
날짜/시간 년도, 연월, 일시, 일자, 월, 일....
내용 내용, 비고, 설명.....
명칭 명, 아이디, 주소.....
번호 순번, 비밀번호, 전화번호.....
비율 금리, 비율, 세율, 환율, 이율....
수량 건수, 길이, 량, 차수, 평수.....
여부 여부, 유무
코드 코드