استراتژی تغییر دنده برای کامیون‌های سنگین برقی با گیربکس دستی خودکار مبتنی بر فیلتر کالمن توسعه‌یافته و یادگیری تقویتی

برای افزایش بهره‌وری انرژی خودروهای الکتریکی و بهبود سازگاری آنها با محیط‌های رانندگی پویا، این مطالعه از کامیون‌های سنگین برقی با گیربکس دستی خودکار چند دنده‌ای (AMT) به عنوان هدف تحقیق استفاده کرد و یک استراتژی بهینه برای تغییر راندمان سیستم بر اساس فیلتر کالمن توسعه‌یافته و تصحیح الگوریتم گرادیان سیاست قطعی عمیق (EKF-DDPG) ارائه داد. ابتدا، بر اساس مدل گراف باند یکپارچه، مکانیسم تلفات و ویژگی‌های راندمان دینامیکی سیستم محرک الکتریکی مورد تجزیه و تحلیل قرار گرفت و یک استراتژی تغییر بر اساس راندمان بهینه سیستم توسعه داده شد. دوم، با توجه به تأثیر جرم و شیب خودرو، از الگوریتم EKF-DDPG برای اصلاح استراتژی تغییر بر اساس راندمان بهینه سیستم به صورت آفلاین استفاده شد. در نهایت، اثربخشی و برتری استراتژی پیشنهادی از طریق ترکیبی از شبیه‌سازی‌ها و آزمایش‌های واقعی خودرو تأیید شد. نتایج تحقیق نشان می‌دهد که استراتژی پیشنهادی به کنترل بلادرنگ راندمان خروجی بهینه سیستم محرک الکتریکی، اصلاح منحنی تغییر برای کاهش تغییر چرخه‌ای در محیط‌های رانندگی پویا و کاهش 4.45 درصدی مصرف انرژی خودرو در مقایسه با استراتژی تغییر اقتصادی سنتی دست می‌یابد.

مقدمه

با تشدید آلودگی محیط زیست و بحران جهانی انرژی، تحول الکتریکی در صنعت خودرو توجه فزاینده‌ای را به خود جلب کرده است. در حال حاضر، کامیون‌های سنگین 54.3 درصد از انتشار کربن در صنعت خودرو را تشکیل می‌دهند و نرخ نفوذ الکتریکی آن تنها 0.7 درصد است (هائو، لو، یانگ، ژنگ و وانگ، 2024). بنابراین، گذار این کامیون‌ها از سوخت‌های فسیلی به برق، پتانسیل قابل توجهی برای صرفه‌جویی در مصرف انرژی و مزایای زیست‌محیطی دارد. کامیون‌های سنگین برقی AMT با بهره‌گیری از مزایای هزینه‌های تولید پایین، راندمان بالا و قابلیت اطمینان عملیاتی گیربکس‌های AMT، به یک مدل اصلی برای وسایل نقلیه تجاری سنگین تبدیل شده‌اند (لیو، دو، چنگ، ژو و ما، 2023). برای تحقق کامل پتانسیل صرفه‌جویی در مصرف انرژی، بسیاری از تولیدکنندگان تعداد دنده‌های AMT را برای کاهش اتلاف انرژی افزایش می‌دهند. با این حال، این راه حل منجر به هزینه‌های بالاتر می‌شود (کوون، لی و لیم، 2023). بنابراین، بهینه‌سازی کنترل تعویض دنده، کلید کاهش مصرف انرژی در کامیون‌های سنگین برقی AMT چند دنده‌ای می‌شود.

بهینه‌سازی کنترل شیفت را می‌توان به بهینه‌سازی کنترل شیفت در لایه اجرا و بهینه‌سازی کنترل شیفت در لایه کاربرد تقسیم کرد. مورد اول، بهبود کیفیت شیفت (شامل معیارهایی مانند شوک شیفت، زمان پاسخ شیفت و نرمی شیفت) را به عنوان هدف اصلی برای دستیابی به کنترل بهینه وضعیت محرک شیفت در نظر می‌گیرد. برخی از محققان با تنظیم افزایش و کاهش فشار در سیستم هیدرولیک شیفت (یان، وو و شی، 2024) و کنترل درگیری و قطع کلاچ (چنگ و همکاران، 2024) کیفیت شیفت را بهبود بخشیده‌اند. این روش کنترلی برای تخمین دقیق آستانه‌های محدودیت خاص برای دستیابی به عملکرد بهینه، به تجربه مهندسی متکی است (چن، 2025). با پیشرفت تحقیقات، محققان الگوریتم‌های بهینه‌سازی هوشمندی را برای جبران کمبود تجربه مهندسی از طریق ویژگی‌های خود الگوریتم‌ها، مانند کنترل پیش‌بین مدل و کنترل ردیابی مقاوم، معرفی کرده‌اند (اویانگ و همکاران، 2022). با این حال، بهبود کیفیت تعویض دنده همیشه توسط معماری ذاتی سیستم انتقال قدرت محدود می‌شود. برخی مطالعات شروع به کنار گذاشتن محرک تعویض دنده اصلی و بهبود بیشتر کیفیت تعویض دنده با طراحی هماهنگ‌کننده‌های معقول‌تر (Mo, Wu, Walker, & Zhang, 2021) و محرک‌های هیدرولیکی (Wang, Ma, Xie, Guo, & Yin, 2023) کرده‌اند. تحقیقات در مورد بهینه‌سازی کنترل تعویض دنده در لایه اجرا، موضوع بهبود کیفیت تعویض دنده را به طور عمیق بررسی کرده است، اما به طور کلی بهینه‌سازی مصرف انرژی را تضعیف کرده است (Ouyang, Huang, Li, Chen, & Chen, 2020)، بنابراین تمرکز این مطالعه بر روی این موضوع نیست.

بهینه‌سازی کنترل تعویض دنده در لایه کاربرد بر بهبود مصرف انرژی و سازگاری با محیط تمرکز دارد. این روش، کنترل بهینه منحنی تعویض دنده و نقطه تعویض دنده را بر اساس وضعیت فعلی خودرو، نیت راننده و اطلاعات محیط رانندگی پویا به دست می‌آورد. از آنجایی که بهینه‌سازی کنترل تعویض دنده در لایه کاربرد شامل عوامل زیادی است و تمرکزهای متفاوتی دارد، استراتژی‌های معمول کنترل تعویض دنده پدیدار شده‌اند، مانند استراتژی تعویض دنده دینامیکی که بر عملکرد قدرت تأکید دارد (یین و همکاران، 2022) و استراتژی تعویض دنده اقتصادی که بر عملکرد اقتصادی تأکید دارد (لین و همکاران، 2021، ژو؛ 2018). با پیشرفت تحقیقات، برخی از محققان معتقدند که استراتژی‌های تعویض دنده موجود به شدت تحت تأثیر عوامل محدودکننده‌ای مانند انحرافات مدل عددی و ذهنیت طراح قرار دارند و استراتژی‌های تعویض دنده مبتنی بر داده‌های بزرگ را پیشنهاد کرده‌اند که بیشتر بر پر کردن چنین شکاف‌هایی تمرکز دارند.با این حال، این استراتژی‌های تغییر با هزینه‌های بالقوه بالایی همراه هستند. بنابراین، با توجه به بهره‌وری انرژی خودرو و هزینه‌های توسعه، تحقیقات بهینه‌سازی مبتنی بر استراتژی تغییر اقتصادی به راه‌حل بهینه برای کنترل تغییر در لایه کاربرد تبدیل شده است.

عقلانیت استراتژی تعویض دنده اقتصادی، نوع اصلی استراتژی‌های تعویض دنده مورد استفاده، توانایی سیستم محرک الکتریکی خودرو را برای عملکرد کامل در محدوده راندمان بالا تعیین می‌کند. در حال حاضر، تحقیقات در مورد بهینه‌سازی استراتژی تعویض دنده اقتصادی عمدتاً به دو دسته تقسیم می‌شود: بهینه‌سازی سنتی و مبتنی بر کنترل هوشمند. مورد اول از الگوریتم‌های بهینه‌سازی استفاده می‌کند یا ویژگی‌های راندمان اجزای متعدد را برای بهینه‌سازی استراتژی تعویض دنده در نظر می‌گیرد. روزگار و آنجلس (2018) یک استراتژی تعویض دنده پیشنهاد کردند که یک روش متغیر را با یک الگوریتم ژنتیک ترکیب می‌کند تا به تعویض دنده سریع و کاهش اتلاف انرژی دست یابد. وانگ، ژانگ، شی، لی و یین (2024) الگوریتم DIRECT و یک کنترل‌کننده فازی چند پارامتری را برای اصلاح استراتژی تعویض دنده اقتصادی معرفی کردند که مصرف انرژی را 5.59٪ کاهش می‌دهد و در عین حال تعادل بین شارژ و دشارژ باتری را حفظ می‌کند. نگوین، واکر و ژانگ (2020) یک استراتژی تعویض دنده ارائه دادند که عامل اولویت درگیری چرخ‌دنده‌ها را با راندمان معادل موتور ترکیب می‌کند و در مقایسه با استراتژی تعویض دنده اقتصادی سنتی، 9.1٪ از اتلاف انرژی را کاهش می‌دهد. وانگ و همکاران (2021) یک استراتژی تعویض دنده اقتصادی بهینه را بر اساس راندمان ترکیبی موتور الکتریکی، باتری و سیستم انتقال قدرت مکانیکی پیشنهاد کردند. با این حال، راندمان باتری و سیستم انتقال قدرت نسبتاً ایده‌آل است. استراتژی‌های تعویض دنده در این مطالعات معمولاً بر اساس راندمان بهینه موتور فرموله و بهینه می‌شوند. با این حال، نادیده گرفتن ویژگی‌های راندمان برخی از اجزای درایو الکتریکی، مانع از آن می‌شود که استراتژی تعویض دنده به طور دقیق تغییرات راندمان در اجزای منفرد و سیستم کلی را با تغییر دینامیک محیط‌های رانندگی منعکس کند.

بهینه‌سازی استراتژی تعویض دنده اقتصادی مبتنی بر کنترل هوشمند، تطبیق تعاملی شرایط جاده-انسان-وسیله نقلیه را در نظر می‌گیرد. این روش عواملی مانند محیط جاده، اهداف رانندگی و شرایط رانندگی را شناسایی می‌کند و از روش‌هایی مانند شبکه‌های عصبی و یادگیری تقویتی عمیق برای بهبود استراتژی تعویض دنده استفاده می‌کند. هایاشی، شیمیزو، دوت، تاکایاما و هیراکو (1995) یک استراتژی تعویض دنده پیشنهاد کردند که شبکه‌های عصبی و کنترل منطق فازی را برای رسیدگی به مسائل ناشی از تغییرات جرم خودرو در یک محدوده وسیع ترکیب می‌کند. یو، وو، منگ، سان و کین (2024) بار یک وسیله نقلیه مهندسی و شیب جاده را تشخیص دادند و از ضرایب اصلاح برای تنظیم استراتژی تعویض دنده اقتصادی بر اساس آن استفاده کردند که به جلوگیری از تعویض دنده تصادفی و مکرر کمک می‌کند. لین و همکاران (2021) از شبکه‌های عصبی برای شناسایی سبک و قصد رانندگی استفاده کردند و بر این اساس ضرایب اصلاح پویا را برای دستیابی به هماهنگی بین قدرت و اقتصاد معرفی کردند. با در نظر گرفتن رفتارهای رانندگی بلندمدت و کوتاه‌مدت و محیط رانندگی، فنگ، کین، لیو، سان و گو (2023) رفتارهای رانندگی کوتاه‌مدت را بر اساس پراکندگی کولبک-لیبلر (KL) و شبکه‌های عصبی حافظه کوتاه‌مدت بلندمدت شناسایی کردند. او استراتژی تعویض دنده را با استفاده از برنامه‌نویسی پویا و یک الگوریتم ژنتیک چندهدفه بهبود بخشید. لی، هو، فو، لی و لی (2022) شرایط رانندگی وسایل نقلیه الکتریکی را بر اساس زنجیره‌های مارکوف پیش‌بینی کردند. او آن را با یک الگوریتم حریصانه ترکیب کرد تا نقاط تعویض دنده استراتژی تعویض دنده اقتصادی را در زمان واقعی بهینه کند و در نتیجه سازگاری استراتژی تعویض دنده اقتصادی را با شرایط کاری بهبود بخشد. یانگ، لیو، سونگ، ژانگ و زنگ (2023) از فناوری ادغام داده‌ها برای ساخت یک کنترل‌کننده پیش‌بینی سرعت خودرو استفاده کردند و یک استراتژی بهینه‌سازی چندهدفه در زمان واقعی پیشنهاد دادند که می‌تواند به طور مؤثر پدیده تعویض دنده مکرر در وسایل نقلیه اتوبوس را کاهش دهد. این مطالعات استراتژی‌های تعویض دنده پویا را برای بهبود سازگاری با شرایط کاری و از بین بردن مشکلاتی مانند تعویض دنده چرخه‌ای معرفی کردند. با این حال، آنها نتوانستند به طور قابل توجهی صرفه‌جویی در تعویض دنده را بهبود بخشند.

برای پرداختن به این مشکلات، ما یک استراتژی بهینه برای تغییر راندمان سیستم بر اساس فیلتر کالمن توسعه‌یافته و الگوریتم تصحیح گرادیان سیاست قطعی عمیق (EKF-DDPG) پیشنهاد می‌کنیم. با استفاده از مدل گراف باند یکپارچه سیستم محرک الکتریکی، مکانیسم‌های تلفات و ویژگی‌های راندمان دینامیکی هر جزء را تجزیه و تحلیل کردیم تا یک استراتژی تغییر بر اساس راندمان بهینه سیستم تدوین کنیم. سیگنال‌های جرم و شیب خودرو که توسط EKF شناسایی می‌شوند، به عنوان بخشی از تابع پاداش به الگوریتم DDPG معرفی شدند تا ضرایب اصلاح را در محیط‌های رانندگی پویای مختلف به دست آوریم و به بهینه‌سازی آفلاین استراتژی تغییر در شرایط کاری مختلف دست یابیم. جدول 1 مقایسه‌ای از استراتژی تغییر پیشنهادی ما با سایر استراتژی‌های تغییر را نشان می‌دهد که به وضوح برتری تحقیقات ما را نشان می‌دهد.(منبع).