view in publisher's site

Daily pan evaporation modeling from local and cross-station data using three tree-based machine learning models

Highlights•Pan evaporation was estimated from local and cross-station data using three tree-based models.•The GBDT and RFs models generally outperformed the M5Tree and empirical models.•GBDT model was recommended due to best combination of accuracy and stability.•A distance of <100 km between two cross stations was suggested for external applications.AbstractAccurate estimation of pan evaporation (Ep) is required for many applications, e.g., water resources management, irrigation system design and hydrological modeling. However, the estimation of Ep for a target station can be difficult as a result of partial or complete lack of local meteorological data under many conditions. In this study, daily Ep was estimated from local (target-station) and cross-station data in the Poyang Lake Watershed of China using four empirical models and three tree-based machine learning models, including M5 model tree (M5Tree), random forests (RFs) and gradient boosting decision tree (GBDT). Daily meteorological data during 2001–2010 from 16 weather stations were used to train the models, while the data from 2011 to 2015 were used for testing. Two cross-station applications were considered between each of the 16 stations and the other 15 stations. The results showed that the radiation-based Priestley-Taylor model (on average RMSE = 1.13 mm d−1, NSE = 0.53, R2 = 0.57, MBE = 0.21 mm d−1) gave the most accurate daily Ep estimates among the four empirical models during testing, while the mass transfer-based Trabert model (on average RMSE = 1.38 mm d−1, NSE = 0.25, R2 = 0.46, MBE = 0.65 mm d−1) performed worst. The GBDT model outperformed the RFs model, M5Tree model and the empirical models under the same input combinations in terms of prediction accuracy (on average RMSE = 0.86 mm d−1, NSE = 0.68, R2 = 0.73, MBE = 0.07 mm d−1) and model stability (average percentage increase in testing RMSE = 16.3%). The RMSE values generally increased with the increase in the distance of two cross stations. A distance of less than 100 km between two cross stations is highly recommended for cross-station applications with satisfactory prediction accuracy (median percentage increase in RMSE <5% for cross-station application #1 and <20% for application #2) in the Poyang Lake Watershed of China and maybe elsewhere with similar climates.

مدل‌سازی تبخیر روزانه از داده‌های محلی و بین‌ایستگاهی با استفاده از سه مدل یادگیری ماشین پایه درختی

نکات برجسته * تبخیر از سطح آب با استفاده از داده‌های محلی و ایستگاه‌های عرضی با استفاده از سه مدل درختی برآورد شد. * مدل‌های GBDT و RFs به طور کلی عملکرد بهتری نسبت به مدل‌های M۵Tree و تجربی دارند. * مدل GBDT به دلیل بهترین ترکیب دقت و پایداری توصیه شد. * فاصله ۱۰۰ کیلومتری بین دو ایستگاه عرضی برای کاربردهای خارجی پیشنهاد شده‌است. برآورد دقیق تبخیر از تشت (Ep)برای بسیاری از کاربردها مانند مدیریت منابع آب، طراحی سیستم آبیاری و مدل‌سازی هیدرولوژیکی مورد نیاز است. با این حال، برآورد Ep برای یک ایستگاه هدف می‌تواند در نتیجه فقدان کامل یا جزئی داده‌های هواشناسی محلی تحت بسیاری از شرایط دشوار باشد. در این مطالعه، Ep روزانه از داده‌های محلی (ایستگاه هدف)و ایستگاه متقابل در دریاچه پویانگ چین با استفاده از چهار مدل تجربی و سه مدل یادگیری ماشین مبتنی بر درخت، شامل درخت مدل M۵ (M۵Tree)، جنگل‌های تصادفی (RFs)و درخت تصمیم تقویت شیب (GBDT)تخمین زده شد. داده‌های هواشناسی روزانه طی سال‌های ۲۰۰۱ تا ۲۰۱۰ از ۱۶ ایستگاه هواشناسی برای آموزش مدل‌ها مورد استفاده قرار گرفتند، در حالی که داده‌های سال ۲۰۱۱ تا ۲۰۱۵ برای آزمایش مورد استفاده قرار گرفتند. دو کاربرد ایستگاه متقابل بین هر یک از ۱۶ ایستگاه و ۱۵ ایستگاه دیگر در نظر گرفته شد. نتایج نشان داد که مدل پریستلی - تیلور مبتنی بر تابش (با میانگین RMSE = ۱.۱۳ mmd - ۱، NSE = ۰.۵۳، R۲ = ۰.۵۷، MBE = ۰.۲۱ mmd - ۱)دقیق‌ترین برآورد Ep روزانه را در میان چهار مدل تجربی در طول آزمایش ارائه می‌دهد، در حالی که مدل ترابرت مبتنی بر انتقال جرم (با میانگین RMSE = ۱.۳۸ mmd - ۱، NSE = ۰.۲۵، R۲ = ۰.۶۵ mmd - ۱)اجرا شده‌است. مدل GBDT از مدل RFs، مدل M۵Tree و مدل‌های تجربی تحت ترکیبات ورودی مشابه از نظر دقت پیش‌بینی (میانگین RMSE = ۰.۸۶ mmd - ۱، NSE = ۰.۶۸، R۲ = ۰.۷۳، MBE = ۰.۰۷ mmd - ۱)و پایداری مدل (میانگین درصد افزایش در RMSE = ۱۶.۳ %)بهتر عمل کرد. مقادیر RMSE به طور کلی با افزایش فاصله دو ایستگاه متقابل افزایش می‌یابد. فاصله کم‌تر از ۱۰۰ کیلومتر بین دو ایستگاه متقاطع برای کاربردهای ایستگاه متقابل با دقت پیش‌بینی رضایت‌بخش (درصد میانه افزایش RMSE به میزان ۵ % برای کاربرد ایستگاه متقابل # ۱ و ۲۰ % برای کاربرد # ۲)در دریاچه پویانگ چین و شاید در جاه‌ای دیگر با آب و هوای مشابه بسیار توصیه می‌شود.
ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

با استفاده از افزونه دانلود فایرفاکس چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.