1. WaterGAP月尺度数据文件命名规则详解
第一次接触WaterGAP月尺度数据时,我盯着那些长得像外星语的文件名发了半天呆。后来才发现,这些看似复杂的命名其实暗藏玄机,每个下划线分隔的字段都在传递重要信息。就拿最常见的watergap_22d_gswp3-w5e5_histsoc_dis_monthly_1901_2019.nc4来说,拆解后你会发现它像是一个完整的数据身份证。
文件名由8个关键字段组成,用下划线严格分隔。第一个字段watergap是数据来源标识,相当于产品的品牌名。第二个字段22d代表空间分辨率,这里指22角分(约40公里)的网格精度。第三个字段gswp3-w5e5特别重要,它表示驱动模型的气象数据集组合——GSWP3和W5E5的融合数据,这个组合在2019年后成为主流。
社会情景字段histsoc可能让新手困惑,其实它表示"历史社会"情景,即考虑实际人类用水影响的数据版本。与之对应的nosoc则表示自然情景,排除了人为干扰。最核心的是第五个字段dis,这个缩写代表水文变量类型,这里是河道流量(discharge)的缩写。monthly说明这是月尺度数据,而最后的1901_2019是时间范围,.nc4则是NetCDF4格式的扩展名。
2. 水文变量缩写全解析
2.1 水资源存储类变量
存储类变量是理解水平衡的关键,tws(Total Water Storage)这个黄金指标我每次分析必看。它表示总水储量,包含地表水、土壤水、地下水等所有水体的总和。类似的重要变量还有:
groundwstor:地下水储量,就像地下的巨型水库soilmoist:土壤含水量,农业干旱监测的核心指标swe:雪水当量,对融雪径流预测至关重要
去年分析华北平原水资源时,我发现riverstor(河川蓄水量)和reservoirstor(水库蓄水量)的比值变化特别有意思。通过对比这两个变量,可以清晰看出水利工程对自然水系的调节程度。
2.2 水循环过程类变量
过程类变量记录水的流动轨迹,dis(河道流量)是最常用的变量之一。但要注意区分dis和disnat,前者包含人类取用水影响,后者是天然状态下的流量。qr(地下水补给总量)系列变量也值得关注:
qrdif:扩散补给qrswb:地表水体下渗补给
在分析城市水循环时,我发现evap(实际蒸散发)与precmon(月降水量)的比值能很好反映城市热岛效应。而canopystor(冠层截留量)在森林流域分析中经常被忽视,其实它对暴雨期间的径流形成有重要缓冲作用。
2.3 人类用水相关变量
人类活动变量是WaterGAP的特色,anag和anas这对双胞胎变量经常让人混淆。前者是地下水净开采量(Actual net abstraction from groundwater),后者则是地表水净取用量。更复杂的还有:
ptotww:潜在总取水量pirrww:灌溉取水量atotuse:实际总消耗量
记得有次给农业部门做报告,用pnag(潜在地下水净开采量)和pnas(潜在地表水净取用量)的时空分布图,直观展示了不同灌溉方案的水资源压力差异。
3. 数据文件使用实战技巧
3.1 快速定位所需文件
面对上百个月尺度数据文件,我总结出三步定位法:首先确定时空范围(如1901_2019),然后筛选情景类型(histsoc或nosoc),最后用变量缩写精准锁定。比如要找自然情景下的地下水储量变化,就选带nosoc_groundwstor的文件。
有个容易踩的坑是文件版本差异。2019年前后的数据驱动方案不同,早期用watch+era-interim组合,现在主流是gswp3-w5e5。做长时间序列分析时,建议先检查数据一致性。
3.2 变量组合分析策略
单一变量分析就像管中窥豹,我习惯将关联变量打包下载。比如研究干旱:
- 土壤干旱:
soilmoist+evap+precmon - 水文干旱:
dis+riverstor+tws - 农业干旱:
pirrww+anag+canopystor
最近帮某研究组设置自动下载脚本时,我们特别加入了变量兼容性检查。比如glolakestor(全球湖泊储量)和loclakestor(本地湖泊储量)不能简单相加,因为前者包含后者。
4. 常见问题排查指南
4.1 文件名解析错误
新手最常犯的错误是忽略字段顺序。有次我误把watergap_22d_gswp3-w5e5_monthly_histsoc_dis_1901_2019.nc4当作有效文件名,结果程序报错,因为monthly和histsoc位置颠倒了。正确的字段顺序是:数据集_分辨率_驱动数据_情景_变量_时间尺度_起始年_结束年.格式。
另一个陷阱是缩写混淆。比如把ql(陆地径流)当作qr(地下水补给)的变体,实际上它们代表完全不同的水文过程。建议把官方缩写表打印出来贴在工位,我电脑显示器边框上就贴着一张。
4.2 数据异常值处理
月尺度数据有时会出现突变的异常值。上个月分析groundwstor时,发现某个月份数值突然归零,检查后发现是模型在该网格点的迭代计算问题。我的处理流程是:
- 检查相邻月份值
- 对比同区域其他变量
- 查看质量控制标志
- 必要时使用线性插值修补
对于dis数据,还要特别注意单位统一问题。有的版本用m³/s,有的用mm/month,转换时别忘了考虑网格面积。