드론+AI 결합 해안 침식 모니터링 솔루션

기계 학습으로 해안 침식 원인 분석하기

juinfo 2025. 7. 7. 19:25

기계 학습으로 해안 침식 원인 분석하기

1. 데이터 수집 및 특징 정의

키워드: 데이터수집, 특징정의
해안 침식 원인 분석을 위해서는 다양한 데이터 소스를 통합 수집해야 합니다. 첫째, 드론 LiDAR 스캔을 통해 1km 구간을 10m×10m 격자로 스캔한 포인트클라우드를 생성합니다. 이때 각 포인트는 수평 오차 ±5cm, 수직 오차 ±3cm 수준의 정확도를 갖습니다. 둘째, Sentinel-2 위성 영상으로 매월 두 차례 10m 해상도의 다중분광 밴드 데이터를 확보하고, 이를 활용해 식생 지수(NDVI), 토립 분포, 해안 피복 유형을 추출합니다. 셋째, 해양 부표와 조류계측기에서 1분 단위로 유속·유향 데이터를, 기상 관측소에서 일간 풍속·풍향·강수량·기온·파고 데이터를 수집합니다. 넷째, 연평균 해수면 상승률 3.3mm/년(ENSO 변동 포함)을 반영하여 장기 수위 변화도 입력 변수로 포함합니다. 이렇게 확보된 원시 데이터 중 침식에 직접 영향을 미치는 변수로는 파고(m), 파주기(s), 조석 진폭(cm), 식생 피복률(0~1), 연안 사질(µm 단위 입경) 등이 있으며, 각각 시계열 형태로 365일 이상 수집하여 분석 기반을 마련합니다.

 

2. 피처 엔지니어링 및 전처리

키워드: 피처엔지니어링, 전처리
원시 데이터를 분석 가능 형태로 가공하기 위해 다음 절차를 거칩니다.

  1. 결측치 보완: 연속 7일 이내의 누락 값은 선형 보간법(linear interpolation)으로 대체하고, 그 이상 누락된 구간은 동일 계절 유사 기상일치 데이터를 활용해 보완합니다.
  2. 이상치 제거: IQR(Interquartile Range)의 1.5배 범위 바깥 값과 Z-score ±3 범위를 벗어나는 데이터를 제거합니다.
  3. 복합 지표 생성: ‘파력지수’는 파고³×파주기 식으로 정의하여 고에너지 파랑 상태를 계량화하고, ‘조석순응지수’는 조석 진폭(cm)÷평균 경사도(°)로 계산해 조석이 침식에 미치는 상대적 영향을 평가합니다.
  4. 시계열 통계: 과거 7일·14일·30일 이동평균, 표준편차, 최댓값, 최솟값을 윈도우별로 계산하여 변수 간 시차(time lag) 효과를 반영합니다.
  5. 차원 축소: 상관계수 |r|>0.85 피처 중 하나를 제거하고, PCA(Principal Component Analysis)로 설명분산 90%를 유지하는 방식으로 차원을 축소하여 50~80개 피처로 구성된 최종 학습용 데이터셋을 완성합니다. 모든 수치 변수는 Min-Max 정규화(01)와 Z-스코어 표준화(mean=0, σ=1)를 병행 적용합니다.

 

3. 모델 설계 및 학습 전략

키워드: 모델설계, 학습전략
침식 원인 분석에는 해안 침식량(연간 m³/m) 예측과 주요 변수 기여도 해석이 가능한 기계학습(머신러닝) 모델을 사용합니다.

  • 모델 구성: 랜덤포레스트(트리 수 500, 최대 깊이 12), XGBoost(learning_rate=0.1, max_depth=8, n_estimators=300), LSTM 기반 시계열 회귀(은닉 유닛 128, 레이어 2)를 비교 검증합니다.
  • 데이터 분할: 전체 데이터를 70% 학습, 15% 검증, 15% 테스트로 분할하되, 시계열 특성을 고려해 TimeSeriesSplit(k=5) 방식으로 수행합니다.
  • 하이퍼파라미터 최적화: 랜덤포레스트·XGBoost는 GridSearchCV로 learning_rate, max_depth, subsample 비율을 최적화하고, LSTM은 Optuna를 통해 lr, 배치 크기(batch size=32~64), 드롭아웃률(0.2~0.4), 시퀀스 길이(24~72시간)를 탐색합니다.
  • 학습 세팅: LSTM은 Adam optimizer(lr=1e-3), CosineAnnealing 스케줄러, 에폭 최대 100회, EarlyStopping(patience=10) 조건을 적용합니다.
  • 성능 평가: 회귀 지표인 R²(결정계수), RMSE, MAE와 함께 변수 중요도(feature importance)를 SHAP(Shapley Additive exPlanations)로 계산하여 상위 10개 변수의 기여를 정량화합니다.

 

4. 결과 해석 및 정책 제언

키워드: 결과분석, 정책제언
모델 학습 후 결과분석 단계에서는 SHAP 값을 통해 주요 원인 변수를 도출합니다. 예컨대 파력지수가 전체 기여도의 30%, 조석순응지수가 25%, 식생 피복률이 20%, 연안 사질 입경이 15%를 차지하여 네 변수로 전체 설명력을 90% 이상 확보했습니다. LSTM 시계열 모델의 테스트 성능은 R²=0.87, RMSE=0.12m³/m, MAE=0.08m³/m으로 나타났으며, XGBoost 회귀 모델은 R²=0.84, RMSE=0.14, MAE=0.10 지표를 달성했습니다.
정책제언으로는 ▶파고가 2m 이상인 시기 해안 방파제 고도 0.5m 상향 ▶조석 진폭이 80cm 이상인 구간 우선 보강 ▶식생 피복률이 0.3 이하 구역에 대해 연안 식생복원 사업 우선 시행 ▶사질 입경이 200µm 미만 해역에 모래 주입량 20% 증량 등 맞춤형 관리 방안을 제시합니다. 추가로 월 6회 이상 모니터링 주기를 권고하며, 실시간 침식 예측 알림 시스템을 연동해 선제 대응 체계를 구축할 것을 권장합니다.