تخمین الگوهای ترافیک کامیون زمانی در سیستمهای بزرگراه روستایی: یک رویکرد یادگیری ماشینی با آگاهی مکانی
آمار ترافیک کامیونها در سطح سیستم یا شبکه برای برنامهریزی حمل و نقل، طراحی زیرساختها و مدیریت شبکههای حمل و نقل بسیار مهم است. با این حال، تولید این آمار چالش برانگیزتر از کل ترافیک است. روشهای فعلی تا حد زیادی به قضاوت مهندسی بستگی دارند، که آنها را به نیروی کار زیاد، مستعد خطای انسانی و در حوزههای قضایی متناقض تبدیل میکند. این مطالعه با هدف پرداختن به این چالشها با ارائه یک راه حل یادگیری ماشین (ML)، با استفاده از الگوریتم طبقهبندی مکانی جنگل تصادفی، برای خودکارسازی تخصیص ایستگاههای شمارش کوتاه مدت (SCS) به گروههای الگوی ترافیک کامیون زمانی (TTPG) و انتساب آنها به بخشهای جادهای فاقد دادههای حجمی، انجام شده است. این مطالعه همچنین بر شناسایی عوامل کلیدی مؤثر بر الگوهای ترافیک کامیون و ایجاد مدلهایی که محدودیتهای دادهها را برطرف میکنند، تمرکز دارد. این روش با استفاده از دادههای برنامه نظارت بر ترافیک مانیتوبا در سال ۲۰۱۹ آزمایش شد و به نرخ دقت بیش از ۸۰٪ دست یافت که پتانسیل آن را برای استفاده گستردهتر نشان میدهد. رویکرد پیشنهادی یادگیری ماشین، روشی خودکار، قابل اعتماد، دقیق و قابل انتقال برای تجزیه و تحلیل الگوهای ترافیک کامیون ارائه میدهد و زمان پردازش و اتکا به تخصص ذهنی را کاهش میدهد.
۱. مقدمه
تولید آمار ترافیک در سطح سیستم (یا در سطح شبکه) یک هدف اساسی از یک برنامه نظارت بر ترافیک است (Regehr و همکاران، ۲۰۱۷؛ اداره فدرال بزرگراههای ایالات متحده، ۲۰۱۶)، با توجه به نیاز به این آمار در برنامهریزی، طراحی، بهرهبرداری و مدیریت شبکههای حمل و نقل (Li و همکاران، ۲۰۱۷). در مقایسه با کل ترافیک، تولید اطلاعات حجم کامیون در سطح سیستم، نیازمند منابع جمعآوری داده و تلاشهای رویهای اضافی است. علیرغم این چالشها، اطلاعات حجم کامیون، از جمله توزیعهای زمانی و مکانی در سطح شبکه، به عنصری حیاتی برای طراحی و ارزیابی زیرساختها (Li و همکاران، ۲۰۱۷؛ Tran و همکاران، ۲۰۲۴)، نظارت بر عملکرد بزرگراهها (Zhong و Liu، ۲۰۰۷)، تجزیه و تحلیل ایمنی جادهها (Zarei و Hellinga، ۲۰۲۳) و ارزیابیهای تابآوری زنجیره تأمین (Patnala و همکاران، ۲۰۲۳) تبدیل شده است. دستورالعملهای نظارت بر ترافیک در آمریکای شمالی، دستورالعملهای روششناختی کلی زیر را برای توسعه آمار ترافیک و ترافیک کامیونها در سطح سیستم ارائه میدهند (Regehr و همکاران، ۲۰۱۷؛ اداره بزرگراههای فدرال ایالات متحده، ۲۰۱۶؛ Regehr و Reimer، ۲۰۱۳):
۱. فرمولبندی گروههای الگوی ترافیک (یا ترافیک کامیون) (TPG یا TTPG) از ایستگاههای شمارش پیوسته (CCS) که الگوهای ساعتی، روزهای هفته و ماهانه مشابهی را نشان میدهند. این مرحله معمولاً از تکنیکهای خوشهبندی آماری استفاده میکند.
۲. اختصاص ایستگاههای شمارش کوتاهمدت (SCS) به گروهها به طوری که بتوان از عوامل زمانی گروه (بر اساس کلاس وسیله نقلیه، در صورت وجود) برای تخمین حجم سالانه استفاده کرد. این مرحله، تخمین حجم را برای بخشهایی از شبکه که در آنها شمارشهای کوتاهمدت نمونه وجود دارد، ارائه میدهد.
۳. نسبت دادن اطلاعات مربوط به حجم به بخشهایی که فاقد دادههای شمارش کوتاهمدت هستند. این مرحله برای دستیابی به پوشش کامل در سطح سیستم ضروری است.
مراحل فوق ساده به نظر میرسند، با این حال، نیازهای مختلف ذینفعان به دادهها، تغییرات در قابلیتها و استقرار تجهیزات جمعآوری دادهها و محدودیتهای منابع منجر به رویههای متناقض در حوزههای قضایی آمریکای شمالی میشود (اداره بزرگراههای فدرال ایالات متحده، ۲۰۱۶؛ زروبک، ۲۰۲۳). مشکلاتی در کاربرد مراحل واگذاری و تخصیص، عمدتاً به دلیل اتکای آنها به قضاوت متخصصانی که از فعالیت در منطقه مورد نظر آگاهی دارند، ایجاد میشود. این امر به ویژه در مورد دادههای ترافیک کامیون صادق است (Regehr and Reimer, ۲۰۱۳). در مرحله واگذاری، گاهی اوقات تعیین اینکه کدام TTPG مناسبترین است، به دلیل محدودیت دسترسی به دادهها (معمولاً فقط ۲۴ تا ۴۸ ساعت در یک سال نمونه) و طیف وسیعی از متغیرهای توضیحی که بر الگوهای ترافیک کامیون تأثیر میگذارند، دشوار است. در مرحله تخصیص، کمبود دادههای نمونه، اتکای بیشتر به دانش حوزه صنعت محلی و قضاوت کارشناسی را ضروری میسازد. علیرغم عملی بودن و دقت بالقوه حل مسائل تخصیص و انتساب از طریق به کارگیری قضاوت متخصصان، انجام این کار نیازمند نیروی کار زیاد، مستعد خطاهای انسانی است و قابلیت انتقال و ثبات رویه بین سازمانها را محدود میکند. بنابراین، نیاز به راهکاری سریع، از نظر محاسباتی ارزان، بالقوه خودکار و قابل انتقال به سایر حوزههای قضایی بدون قرار گرفتن در معرض قضاوت انسانی و خطاهای احتمالی وجود دارد.
این مطالعه یک راهکار یادگیری ماشین (ML) مبتنی بر الگوریتم طبقهبندی جنگل تصادفی برای تخصیص و انتساب الگوهای ترافیک کامیون زمانی در یک سیستم بزرگراه روستایی ارائه میدهد. به طور خاص، اهداف این مطالعه عبارتند از:
۱. شناسایی مرتبطترین ویژگیهایی که شباهتهای آماری مشاهدهشده بین CCSها در یک TTPG و تفاوتهای مشاهدهشده بین آن TTPGها را توضیح میدهند؛ و
۲. ایجاد و ارزیابی مدلها، با استفاده از ویژگیهای شناساییشده، برای اختصاص SCSها به TTPGها و نسبت دادن الگوهای زمانی به بخشهای جادهای که در غیر این صورت نظارت نمیشوند.
این مطالعه با قرار دادن آنها به عنوان مسائل طبقهبندی مکانی و حل آنها با رویکردهای یادگیری ماشینی، این اهداف را دنبال میکند: یعنی روشهای مهندسی ویژگی و تکنیکهای ساخت مدل برای اهداف اول و دوم، به ترتیب. مورد اول، اثربخشی هر ویژگی را در تقسیم دادههای ورودی به گروههای مشابه محاسبه میکند تا با حفظ مهمترین ویژگیها، تعداد ویژگیهای درگیر در کار طبقهبندی را کاهش دهد. مورد دوم شامل مجموعهای از تکنیکهایی است که برای غلبه بر مشکلات ناشی از مجموعه دادههای نامتوازن استفاده میشود. برای نشان دادن کاربرد این رویکرد، این مطالعه از دادههای بهدستآمده از برنامه نظارت بر ترافیک در مانیتوبا، کانادا استفاده میکند. در مانیتوبا، مراحل انتساب و انتساب در حال حاضر با استفاده از دو الگوریتم پشتیبانی تصمیمگیری مختلف که توسط متخصصان حوزه توسعه داده شدهاند، انجام میشود (Regehr and Reimer, 2013). اگرچه این تحلیل بر بزرگراههای روستایی در مانیتوبا تمرکز دارد، اما این روش قابل تعمیم به مناطق دیگر نیز هست.
۲. مرور ادبیات
مرور ادبیات موجود، نقاط قوت و زمینههای بهبود مطالعات مرتبطی را که به تخمین ترافیک در سطح سیستم یا اطلاعات ترافیک کامیونها پرداختهاند، برجسته کرده است. مشکل کلی که در این مطالعات با آن مواجه هستیم، تخمین (یا پیشبینی) پارامترهای ترافیک (یعنی حجم، توزیع زمانی، وزن) در مکانهایی است که دادههای مشاهدهشده محدود یا بدون داده وجود دارد، بر اساس ویژگیهایی که بر این پارامترها تأثیر میگذارند. چندین مطالعه بدون ارائه راهحلی برای پوشش در سطح سیستم، به مسئله تخصیص پرداختهاند (باقری و همکاران، ۲۰۱۵؛ لیو و همکاران، ۲۰۲۰). از سوی دیگر، برخی مطالعات با استفاده از الگوریتمهای آماری یا یادگیری ماشین، راهحلهایی برای پوشش در سطح سیستم ارائه دادهاند. یک فرض اساسی در این مطالعات این است که مقادیر AADT در SCSها شناخته شده و از قبل به گروههای تعریفشده اختصاص داده شدهاند (داس و تساپاکیس، ۲۰۲۰؛ پولوگورتا و متیو، ۲۰۲۱؛ یبوآ و همکاران، ۲۰۲۳؛ ژانگ و چن، ۲۰۲۳). تنها تعداد محدودی از مطالعات، هر دو مسئله (یعنی تخصیص و انتساب) را به طور همزمان بررسی کردهاند (گنجی و همکاران، 2020)، به ویژه برای اطلاعات ترافیک کامیون (ریگر و ریمر، 2013). در مورد مسئله تخصیص، این کار معمولاً زمانی انجام میشود که نیاز به گسترش دادههای ثبت شده با پوشش زمانی محدود یا پارامترهای محدود (به عنوان مثال، توزیع طبقهبندی وسایل نقلیه، الگوی زمانی ترافیک، توزیع وزن وسایل نقلیه) با استفاده از مجموعهای از عوامل باشد. به عنوان مثال، باقری و همکاران (باقری و همکاران، 2015) یک راه حل تطبیق الگو مبتنی بر بیزی برای اختصاص SCSها به TPGها برای تخمین AADT در آلبرتا، کانادا پیشنهاد کردند. آنها الگوهای ترافیک فصلی SCSها را بر اساس دادههای تاریخی تخمین زدند و سپس از آن عوامل برای اختصاص آنها به یک گروه با استفاده از الگوریتمهای تطبیق الگو استفاده کردند. آنها دریافتند که فاصله تا نزدیکترین CCS واقع در همان جاده کلاس عملکردی، یک ویژگی پیشبینیکننده قوی در تجزیه و تحلیلهای آنها بود. در مطالعه دیگری، لیو و همکاران… (لیو و همکاران، 2020) یک رویکرد خوشهبندی k-means بهبود یافته برای اختصاص CCS های غیر وزنی در حال حرکت (WIM) به CCS های WIM پیشنهاد دادند. هدف آنها بهبود پوشش مکانی اطلاعات وزن کامیون بود. آنها مدل خوشهبندی خود را بر اساس فاصله بین ایستگاهها، حجم کامیونها و توزیع کلاس وسایل نقلیه ایجاد کردند. رویکرد آنها اهمیت فواصل مکانی را در فرآیند تخصیص تشخیص میداد، اما محدود به CCS های غیر وزنی بود و نمیتوانست اطلاعات وزنی در سطح سیستم ارائه دهد. رگر و ریمر (Regehr and Reimer, 2013) نیز رویکردی برای مسئله تخصیص برای محاسبه AADTT در SCS ها در مانیتوبا، کانادا پیشنهاد کردند. آنها TTPG ها را تعریف و تولید کردند و سپس یک الگوریتم پشتیبانی تصمیمگیری (یعنی مجموعهای از قوانین) را بر اساس دانش دامنه با در نظر گرفتن رابطه مکانی ایستگاهها توسعه دادند.
در مورد مشکل انتساب، اکثر مطالعات از مدلهای رگرسیون یادگیری ماشینی با تمرکز بر جادههای کمحجم که دادههای مشاهدهشده در آنها کمتر در دسترس هستند، استفاده کردهاند. به عنوان مثال، داس و تساپاکیس (Das and Tsapakis, 2020) یک رویکرد یادگیری ماشینی برای تخمین AADT در جادههای کمحجم در ورمونت، ایالات متحده، که هیچ مشاهدهای ثبت نشده بود، پیشنهاد دادند. آنها از مدل رگرسیون جنگل تصادفی برای تخمین AADT در SCSها استفاده کردند و سپس بر اساس نمودار وابستگی جزئی، قوانین تصمیمگیری را از مدل خود ایجاد کردند. این قوانین طیف وسیعی از مقادیر AADT ممکن را برای هر جاده کمحجم ارائه دادند. آنها ویژگیهای زیر را در مدل خود در نظر گرفتند: تراکم جمعیت، تراکم خانوار، تراکم مشخصه منطقه محل کار، تراکم مشخصه منطقه سکونت و فاصله تا بزرگراه بین ایالتی و ایالات متحده. گنجی و همکاران (Ganji et al., 2020) AADT در کل سیستم را به عنوان نمایندهای برای محاسبه انتشار گازهای گلخانهای تخمین زدند. آنها از رویکرد انتساب پیشنهادی باقری و همکاران استفاده کردند. (باقری و همکاران، ۲۰۱۵) برای محاسبه AADT در SCSها و سپس یک الگوریتم ماشین بردار پشتیبان برای درونیابی مقادیر AADT در بخشهای جادهای بدون هیچ مشاهدهای. ویژگیهای مکانی که آنها در تحلیل خود در نظر گرفتند، فاصله بین جادهها و ایستگاهها و کاربری اراضی اطراف بود. تحقیقات مشابه دیگری توسط پولوگورتا و متیو (پولوگورتا و متیو، ۲۰۲۱) برای مدلسازی رابطه بین AADT، ویژگیهای جاده، پارامترهای اجتماعی-اقتصادی و سایر ویژگیهای مکانی برای ارائه تخمینهای AADT در سطح سیستم انجام شد. آنها گزارش دادند که مدل مکانی توسعهیافته (رگرسیون وزنی جغرافیایی) نسبت به مدل غیرمکانی عملکرد بهتری داشته است، به طوری که تراکم جاده، AADT مشاهدهشده در نزدیکی و کاربری اراضی به عنوان تأثیرگذارترین ویژگیها در نظر گرفته شدهاند. یبوآ و همکاران. (Yeboah و همکاران، 2023) همچنین تخمین AADT در سطح سیستم را در لوئیزیانا، ایالات متحده بررسی کردند. تحقیقات آنها رابطه قوی بین AADT، طبقهبندی جادهها، کاربری زمین، تعداد خطوط، تراکم جمعیت و سن، تراکم خانوار و درآمد را نشان داد (Yeboah و همکاران، 2023). در مورد حجم ترافیک کامیونها، ژانگ و چن (Zhang و Chen، 2023) یک مدل رگرسیون جنگل تصادفی را برای تخمین AADTT در سطح سیستم در کنتاکی، ایالات متحده معرفی کردند. آنها تأثیر ویژگیهای جاده، توپولوژی شبکه، دادههای اجتماعی-جمعیتی و دادههای مبتنی بر پروب را با مدلهای مختلف یادگیری ماشین بررسی کردند. نوآوری اصلی کار آنها استفاده از دادههای مبتنی بر پروب به عنوان یک ویژگی توضیحی برای حجم ترافیک کامیونها بود. در دسترس بودن دادههای پروب، جایگزینی برای روش سنتی سه مرحلهای برای تخمین حجم در سطح سیستم است که قبلاً توضیح داده شد. نکته قابل توجه این است که با توجه به پتانسیل آن، استفاده از دادههای مبتنی بر کاوشگر برای تخمین AADTها و AADTTها به یک خط تحقیق محبوب تبدیل شده و همچنین مورد توجه ارائه دهندگان دادههای تجاری قرار گرفته است (به عنوان مثال، StreetLight Data (Zrobek et al., 2024)). Zrobek et al. خلاصهای مختصر از مباحث تحقیقاتی مبتنی بر کاوشگر ارائه میدهد (Zrobek et al., 2024). Reimer و Regehr (Regehr and Reimer, 2013) نیز با توسعه یک الگوریتم پشتیبانی تصمیمگیری (متفاوت از الگوریتمی که برای مسئله تخصیص توسعه دادند) به مسئله انتساب پرداختند تا حجم کامیونها را به بخشهای جاده با استفاده از حجمهای شناخته شده در بخشهای مجاور و نزدیک نسبت دهند. مجموعه قوانینی که آنها توسعه دادند بر اساس رابطه مکانی بین بخش هدف و CCS یا SCS مربوطه بود (منبع).