view in publisher's site

Machine Learning To Predict Standard Enthalpy of Formation of Hydrocarbons

Thermodynamic properites of molecules are used widely in the study of reactive processes. Such properties are typically measured via experiments or calculated by a variety of computational chemistry methods. In this work, machine learning (ML) models for estimation of standard enthalpy of formation at 298.15 K are developed for three classes of acyclic and closed-shell hydrocarbons, viz. alkanes, alkenes, and alkynes. Initially, an extensive literature survey is performed to collect standard enthalpy data for training ML models. A commercial software (Dragon) is used to obtain a wide set of molecular descriptors by providing SMILES strings. The molecular descriptors are used as input features for the ML models. Support vector regression (SVR) and artificial neural networks are used with a two-level K-fold cross-validation (K-fold CV) workflow. The first level is for estimation of accuracy of both the ML models, and the second level is for generation of the final models. The SVR model is selected as the best model based on error estimates over 10-fold CV. The final SVR model is compared against conventional Benson’s group additivity for a set of octene isomers from the database, illustrating the advantages of the proposed ML modeling approach.

یادگیری ماشینی پیش‌بینی آنتالپی استاندارد تشکیل هیدروکربن‌ها

خواص ترمودینامیکی مولکول‌ها به طور گسترده در مطالعه فرآیندهای واکنشی مورد استفاده قرار می‌گیرند. چنین ویژگی‌هایی معمولا از طریق آزمایش‌ها اندازه‌گیری می‌شوند یا توسط روش‌های مختلف شیمی محاسباتی محاسبه می‌شوند. در این کار، مدل‌های یادگیری ماشین (ML)برای تخمین آنتالپی استاندارد تشکیل در ۲۹۸.۱۵ K برای سه کلاس از هیدروکربن‌های غیر حلقوی و پوسته بسته توسعه داده شده‌اند. آلکان ها، آلکان ها و آلکین ها. در ابتدا، یک بررسی ادبیات گسترده برای جمع‌آوری داده‌های آنتالپی استاندارد برای آموزش مدل‌های ML انجام می‌شود. یک نرم‌افزار تجاری (دراگون)برای به دست آوردن مجموعه گسترده‌ای از توصیف‌کننده‌های مولکولی با فراهم کردن رشته‌های SMIles استفاده می‌شود. توصیف‌کننده‌های مولکولی به عنوان ویژگی‌های ورودی برای مدل‌های ML استفاده می‌شوند. رگرسیون بردار پشتیبانی (SVR)و شبکه‌های عصبی مصنوعی با یک گردش کار اعتبارسنجی متقابل دو سطحی K شکل (K تا CV)مورد استفاده قرار می‌گیرند. سطح اول برای تخمین دقت هر دو مدل ML است، و سطح دوم برای تولید مدل‌های نهایی است. مدل SVR به عنوان بهترین مدل براساس خطای بیش از ۱۰ برابر CV انتخاب شده‌است. مدل نهایی SVR در مقابل جمع گرایی گروه بنسون معمولی برای مجموعه‌ای از ایزومرهای اکتن از پایگاه‌داده مقایسه می‌شود، که مزایای رویکرد مدل‌سازی ML پیشنهادی را نشان می‌دهد.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Physical and Theoretical Chemistry
  • ترجمه مقاله Physical and Theoretical Chemistry
  • مقاله شیمی فیزیک و نظری
  • ترجمه مقاله شیمی فیزیک و نظری
سفارش ترجمه مقاله و کتاب - شروع کنید

با استفاده از افزونه دانلود فایرفاکس چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.