تخمین الگوهای ترافیک کامیون زمانی در سیستم‌های بزرگراه روستایی: یک رویکرد یادگیری ماشینی با آگاهی مکانی

آمار ترافیک کامیون‌ها در سطح سیستم یا شبکه برای برنامه‌ریزی حمل و نقل، طراحی زیرساخت‌ها و مدیریت شبکه‌های حمل و نقل بسیار مهم است. با این حال، تولید این آمار چالش برانگیزتر از کل ترافیک است. روش‌های فعلی تا حد زیادی به قضاوت مهندسی بستگی دارند، که آنها را به نیروی کار زیاد، مستعد خطای انسانی و در حوزه‌های قضایی متناقض تبدیل می‌کند. این مطالعه با هدف پرداختن به این چالش‌ها با ارائه یک راه حل یادگیری ماشین (ML)، با استفاده از الگوریتم طبقه‌بندی مکانی جنگل تصادفی، برای خودکارسازی تخصیص ایستگاه‌های شمارش کوتاه مدت (SCS) به گروه‌های الگوی ترافیک کامیون زمانی (TTPG) و انتساب آنها به بخش‌های جاده‌ای فاقد داده‌های حجمی، انجام شده است. این مطالعه همچنین بر شناسایی عوامل کلیدی مؤثر بر الگوهای ترافیک کامیون و ایجاد مدل‌هایی که محدودیت‌های داده‌ها را برطرف می‌کنند، تمرکز دارد. این روش با استفاده از داده‌های برنامه نظارت بر ترافیک مانیتوبا در سال ۲۰۱۹ آزمایش شد و به نرخ دقت بیش از ۸۰٪ دست یافت که پتانسیل آن را برای استفاده گسترده‌تر نشان می‌دهد. رویکرد پیشنهادی یادگیری ماشین، روشی خودکار، قابل اعتماد، دقیق و قابل انتقال برای تجزیه و تحلیل الگوهای ترافیک کامیون ارائه می‌دهد و زمان پردازش و اتکا به تخصص ذهنی را کاهش می‌دهد.

۱. مقدمه

تولید آمار ترافیک در سطح سیستم (یا در سطح شبکه) یک هدف اساسی از یک برنامه نظارت بر ترافیک است (Regehr و همکاران، ۲۰۱۷؛ اداره فدرال بزرگراه‌های ایالات متحده، ۲۰۱۶)، با توجه به نیاز به این آمار در برنامه‌ریزی، طراحی، بهره‌برداری و مدیریت شبکه‌های حمل و نقل (Li و همکاران، ۲۰۱۷). در مقایسه با کل ترافیک، تولید اطلاعات حجم کامیون در سطح سیستم، نیازمند منابع جمع‌آوری داده و تلاش‌های رویه‌ای اضافی است. علیرغم این چالش‌ها، اطلاعات حجم کامیون، از جمله توزیع‌های زمانی و مکانی در سطح شبکه، به عنصری حیاتی برای طراحی و ارزیابی زیرساخت‌ها (Li و همکاران، ۲۰۱۷؛ Tran و همکاران، ۲۰۲۴)، نظارت بر عملکرد بزرگراه‌ها (Zhong و Liu، ۲۰۰۷)، تجزیه و تحلیل ایمنی جاده‌ها (Zarei و Hellinga، ۲۰۲۳) و ارزیابی‌های تاب‌آوری زنجیره تأمین (Patnala و همکاران، ۲۰۲۳) تبدیل شده است. دستورالعمل‌های نظارت بر ترافیک در آمریکای شمالی، دستورالعمل‌های روش‌شناختی کلی زیر را برای توسعه آمار ترافیک و ترافیک کامیون‌ها در سطح سیستم ارائه می‌دهند (Regehr و همکاران، ۲۰۱۷؛ اداره بزرگراه‌های فدرال ایالات متحده، ۲۰۱۶؛ Regehr و Reimer، ۲۰۱۳):

۱. فرمول‌بندی گروه‌های الگوی ترافیک (یا ترافیک کامیون) (TPG یا TTPG) از ایستگاه‌های شمارش پیوسته (CCS) که الگوهای ساعتی، روزهای هفته و ماهانه مشابهی را نشان می‌دهند. این مرحله معمولاً از تکنیک‌های خوشه‌بندی آماری استفاده می‌کند.

۲. اختصاص ایستگاه‌های شمارش کوتاه‌مدت (SCS) به گروه‌ها به طوری که بتوان از عوامل زمانی گروه (بر اساس کلاس وسیله نقلیه، در صورت وجود) برای تخمین حجم سالانه استفاده کرد. این مرحله، تخمین حجم را برای بخش‌هایی از شبکه که در آنها شمارش‌های کوتاه‌مدت نمونه وجود دارد، ارائه می‌دهد.

۳. نسبت دادن اطلاعات مربوط به حجم به بخش‌هایی که فاقد داده‌های شمارش کوتاه‌مدت هستند. این مرحله برای دستیابی به پوشش کامل در سطح سیستم ضروری است.

مراحل فوق ساده به نظر می‌رسند، با این حال، نیازهای مختلف ذینفعان به داده‌ها، تغییرات در قابلیت‌ها و استقرار تجهیزات جمع‌آوری داده‌ها و محدودیت‌های منابع منجر به رویه‌های متناقض در حوزه‌های قضایی آمریکای شمالی می‌شود (اداره بزرگراه‌های فدرال ایالات متحده، ۲۰۱۶؛ زروبک، ۲۰۲۳). مشکلاتی در کاربرد مراحل واگذاری و تخصیص، عمدتاً به دلیل اتکای آنها به قضاوت متخصصانی که از فعالیت در منطقه مورد نظر آگاهی دارند، ایجاد می‌شود. این امر به ویژه در مورد داده‌های ترافیک کامیون صادق است (Regehr and Reimer, ۲۰۱۳). در مرحله واگذاری، گاهی اوقات تعیین اینکه کدام TTPG مناسب‌ترین است، به دلیل محدودیت دسترسی به داده‌ها (معمولاً فقط ۲۴ تا ۴۸ ساعت در یک سال نمونه) و طیف وسیعی از متغیرهای توضیحی که بر الگوهای ترافیک کامیون تأثیر می‌گذارند، دشوار است. در مرحله تخصیص، کمبود داده‌های نمونه، اتکای بیشتر به دانش حوزه صنعت محلی و قضاوت کارشناسی را ضروری می‌سازد. علیرغم عملی بودن و دقت بالقوه حل مسائل تخصیص و انتساب از طریق به کارگیری قضاوت متخصصان، انجام این کار نیازمند نیروی کار زیاد، مستعد خطاهای انسانی است و قابلیت انتقال و ثبات رویه بین سازمان‌ها را محدود می‌کند. بنابراین، نیاز به راهکاری سریع، از نظر محاسباتی ارزان، بالقوه خودکار و قابل انتقال به سایر حوزه‌های قضایی بدون قرار گرفتن در معرض قضاوت انسانی و خطاهای احتمالی وجود دارد.

این مطالعه یک راهکار یادگیری ماشین (ML) مبتنی بر الگوریتم طبقه‌بندی جنگل تصادفی برای تخصیص و انتساب الگوهای ترافیک کامیون زمانی در یک سیستم بزرگراه روستایی ارائه می‌دهد. به طور خاص، اهداف این مطالعه عبارتند از:

۱. شناسایی مرتبط‌ترین ویژگی‌هایی که شباهت‌های آماری مشاهده‌شده بین CCSها در یک TTPG و تفاوت‌های مشاهده‌شده بین آن TTPGها را توضیح می‌دهند؛ و
۲. ایجاد و ارزیابی مدل‌ها، با استفاده از ویژگی‌های شناسایی‌شده، برای اختصاص SCSها به TTPGها و نسبت دادن الگوهای زمانی به بخش‌های جاده‌ای که در غیر این صورت نظارت نمی‌شوند.

این مطالعه با قرار دادن آنها به عنوان مسائل طبقه‌بندی مکانی و حل آنها با رویکردهای یادگیری ماشینی، این اهداف را دنبال می‌کند: یعنی روش‌های مهندسی ویژگی و تکنیک‌های ساخت مدل برای اهداف اول و دوم، به ترتیب. مورد اول، اثربخشی هر ویژگی را در تقسیم داده‌های ورودی به گروه‌های مشابه محاسبه می‌کند تا با حفظ مهم‌ترین ویژگی‌ها، تعداد ویژگی‌های درگیر در کار طبقه‌بندی را کاهش دهد. مورد دوم شامل مجموعه‌ای از تکنیک‌هایی است که برای غلبه بر مشکلات ناشی از مجموعه داده‌های نامتوازن استفاده می‌شود. برای نشان دادن کاربرد این رویکرد، این مطالعه از داده‌های به‌دست‌آمده از برنامه نظارت بر ترافیک در مانیتوبا، کانادا استفاده می‌کند. در مانیتوبا، مراحل انتساب و انتساب در حال حاضر با استفاده از دو الگوریتم پشتیبانی تصمیم‌گیری مختلف که توسط متخصصان حوزه توسعه داده شده‌اند، انجام می‌شود (Regehr and Reimer, 2013). اگرچه این تحلیل بر بزرگراه‌های روستایی در مانیتوبا تمرکز دارد، اما این روش قابل تعمیم به مناطق دیگر نیز هست.

۲. مرور ادبیات

مرور ادبیات موجود، نقاط قوت و زمینه‌های بهبود مطالعات مرتبطی را که به تخمین ترافیک در سطح سیستم یا اطلاعات ترافیک کامیون‌ها پرداخته‌اند، برجسته کرده است. مشکل کلی که در این مطالعات با آن مواجه هستیم، تخمین (یا پیش‌بینی) پارامترهای ترافیک (یعنی حجم، توزیع زمانی، وزن) در مکان‌هایی است که داده‌های مشاهده‌شده محدود یا بدون داده وجود دارد، بر اساس ویژگی‌هایی که بر این پارامترها تأثیر می‌گذارند. چندین مطالعه بدون ارائه راه‌حلی برای پوشش در سطح سیستم، به مسئله تخصیص پرداخته‌اند (باقری و همکاران، ۲۰۱۵؛ لیو و همکاران، ۲۰۲۰). از سوی دیگر، برخی مطالعات با استفاده از الگوریتم‌های آماری یا یادگیری ماشین، راه‌حل‌هایی برای پوشش در سطح سیستم ارائه داده‌اند. یک فرض اساسی در این مطالعات این است که مقادیر AADT در SCSها شناخته شده و از قبل به گروه‌های تعریف‌شده اختصاص داده شده‌اند (داس و تساپاکیس، ۲۰۲۰؛ پولوگورتا و متیو، ۲۰۲۱؛ یبوآ و همکاران، ۲۰۲۳؛ ژانگ و چن، ۲۰۲۳). تنها تعداد محدودی از مطالعات، هر دو مسئله (یعنی تخصیص و انتساب) را به طور همزمان بررسی کرده‌اند (گنجی و همکاران، 2020)، به ویژه برای اطلاعات ترافیک کامیون (ریگر و ریمر، 2013). در مورد مسئله تخصیص، این کار معمولاً زمانی انجام می‌شود که نیاز به گسترش داده‌های ثبت شده با پوشش زمانی محدود یا پارامترهای محدود (به عنوان مثال، توزیع طبقه‌بندی وسایل نقلیه، الگوی زمانی ترافیک، توزیع وزن وسایل نقلیه) با استفاده از مجموعه‌ای از عوامل باشد. به عنوان مثال، باقری و همکاران (باقری و همکاران، 2015) یک راه حل تطبیق الگو مبتنی بر بیزی برای اختصاص SCSها به TPGها برای تخمین AADT در آلبرتا، کانادا پیشنهاد کردند. آنها الگوهای ترافیک فصلی SCSها را بر اساس داده‌های تاریخی تخمین زدند و سپس از آن عوامل برای اختصاص آنها به یک گروه با استفاده از الگوریتم‌های تطبیق الگو استفاده کردند. آنها دریافتند که فاصله تا نزدیکترین CCS واقع در همان جاده کلاس عملکردی، یک ویژگی پیش‌بینی‌کننده قوی در تجزیه و تحلیل‌های آنها بود. در مطالعه دیگری، لیو و همکاران… (لیو و همکاران، 2020) یک رویکرد خوشه‌بندی k-means بهبود یافته برای اختصاص CCS های غیر وزنی در حال حرکت (WIM) به CCS های WIM پیشنهاد دادند. هدف آنها بهبود پوشش مکانی اطلاعات وزن کامیون بود. آنها مدل خوشه‌بندی خود را بر اساس فاصله بین ایستگاه‌ها، حجم کامیون‌ها و توزیع کلاس وسایل نقلیه ایجاد کردند. رویکرد آنها اهمیت فواصل مکانی را در فرآیند تخصیص تشخیص می‌داد، اما محدود به CCS های غیر وزنی بود و نمی‌توانست اطلاعات وزنی در سطح سیستم ارائه دهد. رگر و ریمر (Regehr and Reimer, 2013) نیز رویکردی برای مسئله تخصیص برای محاسبه AADTT در SCS ها در مانیتوبا، کانادا پیشنهاد کردند. آنها TTPG ها را تعریف و تولید کردند و سپس یک الگوریتم پشتیبانی تصمیم‌گیری (یعنی مجموعه‌ای از قوانین) را بر اساس دانش دامنه با در نظر گرفتن رابطه مکانی ایستگاه‌ها توسعه دادند.

در مورد مشکل انتساب، اکثر مطالعات از مدل‌های رگرسیون یادگیری ماشینی با تمرکز بر جاده‌های کم‌حجم که داده‌های مشاهده‌شده در آن‌ها کمتر در دسترس هستند، استفاده کرده‌اند. به عنوان مثال، داس و تساپاکیس (Das and Tsapakis, 2020) یک رویکرد یادگیری ماشینی برای تخمین AADT در جاده‌های کم‌حجم در ورمونت، ایالات متحده، که هیچ مشاهده‌ای ثبت نشده بود، پیشنهاد دادند. آن‌ها از مدل رگرسیون جنگل تصادفی برای تخمین AADT در SCSها استفاده کردند و سپس بر اساس نمودار وابستگی جزئی، قوانین تصمیم‌گیری را از مدل خود ایجاد کردند. این قوانین طیف وسیعی از مقادیر AADT ممکن را برای هر جاده کم‌حجم ارائه دادند. آن‌ها ویژگی‌های زیر را در مدل خود در نظر گرفتند: تراکم جمعیت، تراکم خانوار، تراکم مشخصه منطقه محل کار، تراکم مشخصه منطقه سکونت و فاصله تا بزرگراه بین ایالتی و ایالات متحده. گنجی و همکاران (Ganji et al., 2020) AADT در کل سیستم را به عنوان نماینده‌ای برای محاسبه انتشار گازهای گلخانه‌ای تخمین زدند. آن‌ها از رویکرد انتساب پیشنهادی باقری و همکاران استفاده کردند. (باقری و همکاران، ۲۰۱۵) برای محاسبه AADT در SCSها و سپس یک الگوریتم ماشین بردار پشتیبان برای درون‌یابی مقادیر AADT در بخش‌های جاده‌ای بدون هیچ مشاهده‌ای. ویژگی‌های مکانی که آنها در تحلیل خود در نظر گرفتند، فاصله بین جاده‌ها و ایستگاه‌ها و کاربری اراضی اطراف بود. تحقیقات مشابه دیگری توسط پولوگورتا و متیو (پولوگورتا و متیو، ۲۰۲۱) برای مدل‌سازی رابطه بین AADT، ویژگی‌های جاده، پارامترهای اجتماعی-اقتصادی و سایر ویژگی‌های مکانی برای ارائه تخمین‌های AADT در سطح سیستم انجام شد. آنها گزارش دادند که مدل مکانی توسعه‌یافته (رگرسیون وزنی جغرافیایی) نسبت به مدل غیرمکانی عملکرد بهتری داشته است، به طوری که تراکم جاده، AADT مشاهده‌شده در نزدیکی و کاربری اراضی به عنوان تأثیرگذارترین ویژگی‌ها در نظر گرفته شده‌اند. یبوآ و همکاران. (Yeboah و همکاران، 2023) همچنین تخمین AADT در سطح سیستم را در لوئیزیانا، ایالات متحده بررسی کردند. تحقیقات آنها رابطه قوی بین AADT، طبقه‌بندی جاده‌ها، کاربری زمین، تعداد خطوط، تراکم جمعیت و سن، تراکم خانوار و درآمد را نشان داد (Yeboah و همکاران، 2023). در مورد حجم ترافیک کامیون‌ها، ژانگ و چن (Zhang و Chen، 2023) یک مدل رگرسیون جنگل تصادفی را برای تخمین AADTT در سطح سیستم در کنتاکی، ایالات متحده معرفی کردند. آنها تأثیر ویژگی‌های جاده، توپولوژی شبکه، داده‌های اجتماعی-جمعیتی و داده‌های مبتنی بر پروب را با مدل‌های مختلف یادگیری ماشین بررسی کردند. نوآوری اصلی کار آنها استفاده از داده‌های مبتنی بر پروب به عنوان یک ویژگی توضیحی برای حجم ترافیک کامیون‌ها بود. در دسترس بودن داده‌های پروب، جایگزینی برای روش سنتی سه مرحله‌ای برای تخمین حجم در سطح سیستم است که قبلاً توضیح داده شد. نکته قابل توجه این است که با توجه به پتانسیل آن، استفاده از داده‌های مبتنی بر کاوشگر برای تخمین AADTها و AADTTها به یک خط تحقیق محبوب تبدیل شده و همچنین مورد توجه ارائه دهندگان داده‌های تجاری قرار گرفته است (به عنوان مثال، StreetLight Data (Zrobek et al., 2024)). Zrobek et al. خلاصه‌ای مختصر از مباحث تحقیقاتی مبتنی بر کاوشگر ارائه می‌دهد (Zrobek et al., 2024). Reimer و Regehr (Regehr and Reimer, 2013) نیز با توسعه یک الگوریتم پشتیبانی تصمیم‌گیری (متفاوت از الگوریتمی که برای مسئله تخصیص توسعه دادند) به مسئله انتساب پرداختند تا حجم کامیون‌ها را به بخش‌های جاده با استفاده از حجم‌های شناخته شده در بخش‌های مجاور و نزدیک نسبت دهند. مجموعه قوانینی که آنها توسعه دادند بر اساس رابطه مکانی بین بخش هدف و CCS یا SCS مربوطه بود (منبع).