استراتژی تغییر دنده برای کامیونهای سنگین برقی با گیربکس دستی خودکار مبتنی بر فیلتر کالمن توسعهیافته و یادگیری تقویتی
برای افزایش بهرهوری انرژی خودروهای الکتریکی و بهبود سازگاری آنها با محیطهای رانندگی پویا، این مطالعه از کامیونهای سنگین برقی با گیربکس دستی خودکار چند دندهای (AMT) به عنوان هدف تحقیق استفاده کرد و یک استراتژی بهینه برای تغییر راندمان سیستم بر اساس فیلتر کالمن توسعهیافته و تصحیح الگوریتم گرادیان سیاست قطعی عمیق (EKF-DDPG) ارائه داد. ابتدا، بر اساس مدل گراف باند یکپارچه، مکانیسم تلفات و ویژگیهای راندمان دینامیکی سیستم محرک الکتریکی مورد تجزیه و تحلیل قرار گرفت و یک استراتژی تغییر بر اساس راندمان بهینه سیستم توسعه داده شد. دوم، با توجه به تأثیر جرم و شیب خودرو، از الگوریتم EKF-DDPG برای اصلاح استراتژی تغییر بر اساس راندمان بهینه سیستم به صورت آفلاین استفاده شد. در نهایت، اثربخشی و برتری استراتژی پیشنهادی از طریق ترکیبی از شبیهسازیها و آزمایشهای واقعی خودرو تأیید شد. نتایج تحقیق نشان میدهد که استراتژی پیشنهادی به کنترل بلادرنگ راندمان خروجی بهینه سیستم محرک الکتریکی، اصلاح منحنی تغییر برای کاهش تغییر چرخهای در محیطهای رانندگی پویا و کاهش 4.45 درصدی مصرف انرژی خودرو در مقایسه با استراتژی تغییر اقتصادی سنتی دست مییابد.
مقدمه
با تشدید آلودگی محیط زیست و بحران جهانی انرژی، تحول الکتریکی در صنعت خودرو توجه فزایندهای را به خود جلب کرده است. در حال حاضر، کامیونهای سنگین 54.3 درصد از انتشار کربن در صنعت خودرو را تشکیل میدهند و نرخ نفوذ الکتریکی آن تنها 0.7 درصد است (هائو، لو، یانگ، ژنگ و وانگ، 2024). بنابراین، گذار این کامیونها از سوختهای فسیلی به برق، پتانسیل قابل توجهی برای صرفهجویی در مصرف انرژی و مزایای زیستمحیطی دارد. کامیونهای سنگین برقی AMT با بهرهگیری از مزایای هزینههای تولید پایین، راندمان بالا و قابلیت اطمینان عملیاتی گیربکسهای AMT، به یک مدل اصلی برای وسایل نقلیه تجاری سنگین تبدیل شدهاند (لیو، دو، چنگ، ژو و ما، 2023). برای تحقق کامل پتانسیل صرفهجویی در مصرف انرژی، بسیاری از تولیدکنندگان تعداد دندههای AMT را برای کاهش اتلاف انرژی افزایش میدهند. با این حال، این راه حل منجر به هزینههای بالاتر میشود (کوون، لی و لیم، 2023). بنابراین، بهینهسازی کنترل تعویض دنده، کلید کاهش مصرف انرژی در کامیونهای سنگین برقی AMT چند دندهای میشود.
بهینهسازی کنترل شیفت را میتوان به بهینهسازی کنترل شیفت در لایه اجرا و بهینهسازی کنترل شیفت در لایه کاربرد تقسیم کرد. مورد اول، بهبود کیفیت شیفت (شامل معیارهایی مانند شوک شیفت، زمان پاسخ شیفت و نرمی شیفت) را به عنوان هدف اصلی برای دستیابی به کنترل بهینه وضعیت محرک شیفت در نظر میگیرد. برخی از محققان با تنظیم افزایش و کاهش فشار در سیستم هیدرولیک شیفت (یان، وو و شی، 2024) و کنترل درگیری و قطع کلاچ (چنگ و همکاران، 2024) کیفیت شیفت را بهبود بخشیدهاند. این روش کنترلی برای تخمین دقیق آستانههای محدودیت خاص برای دستیابی به عملکرد بهینه، به تجربه مهندسی متکی است (چن، 2025). با پیشرفت تحقیقات، محققان الگوریتمهای بهینهسازی هوشمندی را برای جبران کمبود تجربه مهندسی از طریق ویژگیهای خود الگوریتمها، مانند کنترل پیشبین مدل و کنترل ردیابی مقاوم، معرفی کردهاند (اویانگ و همکاران، 2022). با این حال، بهبود کیفیت تعویض دنده همیشه توسط معماری ذاتی سیستم انتقال قدرت محدود میشود. برخی مطالعات شروع به کنار گذاشتن محرک تعویض دنده اصلی و بهبود بیشتر کیفیت تعویض دنده با طراحی هماهنگکنندههای معقولتر (Mo, Wu, Walker, & Zhang, 2021) و محرکهای هیدرولیکی (Wang, Ma, Xie, Guo, & Yin, 2023) کردهاند. تحقیقات در مورد بهینهسازی کنترل تعویض دنده در لایه اجرا، موضوع بهبود کیفیت تعویض دنده را به طور عمیق بررسی کرده است، اما به طور کلی بهینهسازی مصرف انرژی را تضعیف کرده است (Ouyang, Huang, Li, Chen, & Chen, 2020)، بنابراین تمرکز این مطالعه بر روی این موضوع نیست.
بهینهسازی کنترل تعویض دنده در لایه کاربرد بر بهبود مصرف انرژی و سازگاری با محیط تمرکز دارد. این روش، کنترل بهینه منحنی تعویض دنده و نقطه تعویض دنده را بر اساس وضعیت فعلی خودرو، نیت راننده و اطلاعات محیط رانندگی پویا به دست میآورد. از آنجایی که بهینهسازی کنترل تعویض دنده در لایه کاربرد شامل عوامل زیادی است و تمرکزهای متفاوتی دارد، استراتژیهای معمول کنترل تعویض دنده پدیدار شدهاند، مانند استراتژی تعویض دنده دینامیکی که بر عملکرد قدرت تأکید دارد (یین و همکاران، 2022) و استراتژی تعویض دنده اقتصادی که بر عملکرد اقتصادی تأکید دارد (لین و همکاران، 2021، ژو؛ 2018). با پیشرفت تحقیقات، برخی از محققان معتقدند که استراتژیهای تعویض دنده موجود به شدت تحت تأثیر عوامل محدودکنندهای مانند انحرافات مدل عددی و ذهنیت طراح قرار دارند و استراتژیهای تعویض دنده مبتنی بر دادههای بزرگ را پیشنهاد کردهاند که بیشتر بر پر کردن چنین شکافهایی تمرکز دارند.با این حال، این استراتژیهای تغییر با هزینههای بالقوه بالایی همراه هستند. بنابراین، با توجه به بهرهوری انرژی خودرو و هزینههای توسعه، تحقیقات بهینهسازی مبتنی بر استراتژی تغییر اقتصادی به راهحل بهینه برای کنترل تغییر در لایه کاربرد تبدیل شده است.
عقلانیت استراتژی تعویض دنده اقتصادی، نوع اصلی استراتژیهای تعویض دنده مورد استفاده، توانایی سیستم محرک الکتریکی خودرو را برای عملکرد کامل در محدوده راندمان بالا تعیین میکند. در حال حاضر، تحقیقات در مورد بهینهسازی استراتژی تعویض دنده اقتصادی عمدتاً به دو دسته تقسیم میشود: بهینهسازی سنتی و مبتنی بر کنترل هوشمند. مورد اول از الگوریتمهای بهینهسازی استفاده میکند یا ویژگیهای راندمان اجزای متعدد را برای بهینهسازی استراتژی تعویض دنده در نظر میگیرد. روزگار و آنجلس (2018) یک استراتژی تعویض دنده پیشنهاد کردند که یک روش متغیر را با یک الگوریتم ژنتیک ترکیب میکند تا به تعویض دنده سریع و کاهش اتلاف انرژی دست یابد. وانگ، ژانگ، شی، لی و یین (2024) الگوریتم DIRECT و یک کنترلکننده فازی چند پارامتری را برای اصلاح استراتژی تعویض دنده اقتصادی معرفی کردند که مصرف انرژی را 5.59٪ کاهش میدهد و در عین حال تعادل بین شارژ و دشارژ باتری را حفظ میکند. نگوین، واکر و ژانگ (2020) یک استراتژی تعویض دنده ارائه دادند که عامل اولویت درگیری چرخدندهها را با راندمان معادل موتور ترکیب میکند و در مقایسه با استراتژی تعویض دنده اقتصادی سنتی، 9.1٪ از اتلاف انرژی را کاهش میدهد. وانگ و همکاران (2021) یک استراتژی تعویض دنده اقتصادی بهینه را بر اساس راندمان ترکیبی موتور الکتریکی، باتری و سیستم انتقال قدرت مکانیکی پیشنهاد کردند. با این حال، راندمان باتری و سیستم انتقال قدرت نسبتاً ایدهآل است. استراتژیهای تعویض دنده در این مطالعات معمولاً بر اساس راندمان بهینه موتور فرموله و بهینه میشوند. با این حال، نادیده گرفتن ویژگیهای راندمان برخی از اجزای درایو الکتریکی، مانع از آن میشود که استراتژی تعویض دنده به طور دقیق تغییرات راندمان در اجزای منفرد و سیستم کلی را با تغییر دینامیک محیطهای رانندگی منعکس کند.
بهینهسازی استراتژی تعویض دنده اقتصادی مبتنی بر کنترل هوشمند، تطبیق تعاملی شرایط جاده-انسان-وسیله نقلیه را در نظر میگیرد. این روش عواملی مانند محیط جاده، اهداف رانندگی و شرایط رانندگی را شناسایی میکند و از روشهایی مانند شبکههای عصبی و یادگیری تقویتی عمیق برای بهبود استراتژی تعویض دنده استفاده میکند. هایاشی، شیمیزو، دوت، تاکایاما و هیراکو (1995) یک استراتژی تعویض دنده پیشنهاد کردند که شبکههای عصبی و کنترل منطق فازی را برای رسیدگی به مسائل ناشی از تغییرات جرم خودرو در یک محدوده وسیع ترکیب میکند. یو، وو، منگ، سان و کین (2024) بار یک وسیله نقلیه مهندسی و شیب جاده را تشخیص دادند و از ضرایب اصلاح برای تنظیم استراتژی تعویض دنده اقتصادی بر اساس آن استفاده کردند که به جلوگیری از تعویض دنده تصادفی و مکرر کمک میکند. لین و همکاران (2021) از شبکههای عصبی برای شناسایی سبک و قصد رانندگی استفاده کردند و بر این اساس ضرایب اصلاح پویا را برای دستیابی به هماهنگی بین قدرت و اقتصاد معرفی کردند. با در نظر گرفتن رفتارهای رانندگی بلندمدت و کوتاهمدت و محیط رانندگی، فنگ، کین، لیو، سان و گو (2023) رفتارهای رانندگی کوتاهمدت را بر اساس پراکندگی کولبک-لیبلر (KL) و شبکههای عصبی حافظه کوتاهمدت بلندمدت شناسایی کردند. او استراتژی تعویض دنده را با استفاده از برنامهنویسی پویا و یک الگوریتم ژنتیک چندهدفه بهبود بخشید. لی، هو، فو، لی و لی (2022) شرایط رانندگی وسایل نقلیه الکتریکی را بر اساس زنجیرههای مارکوف پیشبینی کردند. او آن را با یک الگوریتم حریصانه ترکیب کرد تا نقاط تعویض دنده استراتژی تعویض دنده اقتصادی را در زمان واقعی بهینه کند و در نتیجه سازگاری استراتژی تعویض دنده اقتصادی را با شرایط کاری بهبود بخشد. یانگ، لیو، سونگ، ژانگ و زنگ (2023) از فناوری ادغام دادهها برای ساخت یک کنترلکننده پیشبینی سرعت خودرو استفاده کردند و یک استراتژی بهینهسازی چندهدفه در زمان واقعی پیشنهاد دادند که میتواند به طور مؤثر پدیده تعویض دنده مکرر در وسایل نقلیه اتوبوس را کاهش دهد. این مطالعات استراتژیهای تعویض دنده پویا را برای بهبود سازگاری با شرایط کاری و از بین بردن مشکلاتی مانند تعویض دنده چرخهای معرفی کردند. با این حال، آنها نتوانستند به طور قابل توجهی صرفهجویی در تعویض دنده را بهبود بخشند.
برای پرداختن به این مشکلات، ما یک استراتژی بهینه برای تغییر راندمان سیستم بر اساس فیلتر کالمن توسعهیافته و الگوریتم تصحیح گرادیان سیاست قطعی عمیق (EKF-DDPG) پیشنهاد میکنیم. با استفاده از مدل گراف باند یکپارچه سیستم محرک الکتریکی، مکانیسمهای تلفات و ویژگیهای راندمان دینامیکی هر جزء را تجزیه و تحلیل کردیم تا یک استراتژی تغییر بر اساس راندمان بهینه سیستم تدوین کنیم. سیگنالهای جرم و شیب خودرو که توسط EKF شناسایی میشوند، به عنوان بخشی از تابع پاداش به الگوریتم DDPG معرفی شدند تا ضرایب اصلاح را در محیطهای رانندگی پویای مختلف به دست آوریم و به بهینهسازی آفلاین استراتژی تغییر در شرایط کاری مختلف دست یابیم. جدول 1 مقایسهای از استراتژی تغییر پیشنهادی ما با سایر استراتژیهای تغییر را نشان میدهد که به وضوح برتری تحقیقات ما را نشان میدهد.(منبع).