Geoscience AI
모든 분야의 데이터들이 저마다의 특성이 있으나 인공지능 적용 분야에 있어, 지질자원 분야의 데이터들은 일반적인 데이터 특성과는 달리 조금 더 구별되는 주요 특성들을 가지고 있다. 제조·생산 분야에서 정기적, 주기적으로 획득되는 팩토리 데이터와 달리 땅은 획득할 수 있는 데이터 샘플이 양적인 측면에서 매우 제한적이다. 땅이라는 대상의 특성상 다양한 잡음원과 불확실성 등 더티 데이터가 될 수 밖에 없다. 위치 및 지역에 따라 그 통계적 특성이 매우 달라지는 데이터는 학습 모델의 일반화가 용이하지 않다는 점도 큰 어려움으로 작용한다.
이러한 이질적인 데이터 환경으로 인해 래퍼런스 인공지능 모델들을 구조 변경 없이 적용했을 때 기대 이상의 낮은 퍼포먼스를 나타내는 경우들이 많다. 어느 정도 성공적인 성능을 나타내는 모형들이 개발되었을 때도 이러한 모델들이 지질자원 분야 내에서 확대 재생산되지 않고 사장되기도 한다. 이는 제조, 산업 분야 대비 인공지능 생태계가 잘 갖추어져 있지 못하다는 관점에서 바라볼 수도 있다. 이는 비단 국내에만 국한되는 것이 아니다.
https://www.kigam.re.kr/gallery.es?mid=a10703020000&bid=0004&list_no=5192&act=view
댓글
댓글 쓰기