متن‌کاوی گزارش‌های نهایی سوانح هوایی: مطالعه‌ی موردی سازمان هواپیمایی کشوری

حسن, پرهام; ضرغامی, حمیدرضا

متن‌کاوی گزارش‌های نهایی سوانح هوایی: مطالعه‌ی موردی سازمان هواپیمایی کشوری

مقالات آماده انتشار

نوع مقاله : علمی پژوهشی

نویسندگان

پرهام حسن ¹

حمیدرضا ضرغامی ²

¹ کارشناسی ارشد آمار ریاضی، دانشکده ریاضی، آمار و علوم کامپیوتر، دانشگاه تهران، ایران

² دانشیار مهندسی صنایع، دانشکده تحصیلات تکمیلی، دانشگاه علوم و فنون هوایی شهید ستاری، تهران، ایران

چکیده

در این پژوهش با هدف تحلیل محتوای گزارش‌های نهایی سوانح هوایی ایران طی بازه‌ی 2007 تا 2025، از روش‌های متن‌کاوی و الگوریتم‌های یادگیری ماشین استفاده شده است. داده‌ها شامل 139 گزارش از پایگاه داده سازمان هواپیمایی کشور بوده که پس از پیش‌پردازش متنی شامل حذف علائم اضافی، یکسان‌سازی واژگان، حذف ایست ‌واژه‌ها و ریشه‌یابی کلمات، مورد تحلیل قرار گرفتند. در بخش نخست، تحلیل فراوانی واژگان و سپس مدل‌سازی موضوعی (Topic Modeling) به‌وسیله الگوریتم‌ STM برای شناسایی مضامین اصلی متن‌ها به‌کار گرفته شد. نتایج نشان داد که موضوعات شامل عملکرد موتور، فرآیند تقرب و فرود، آموزش هوانوردی و سوانح بالگردی هستند. در ادامه، دسته‌بندی شدت سوانح در چهار گروه اصلی با بهره‌گیری از الگوریتم‌های نزدیک‌ترین همسایگی، ماشین بردار پشتیبان، بیز ساده، درخت تصمیم و جنگل تصادفی انجام گرفت. ارزیابی مدل‌ها نشان داد که الگوریتم جنگل تصادفی با دقت 69 درصد عملکرد بهتری نسبت به سایر مدل‌ها داشته است. نتایج این مطالعه بیانگر آن است که به‌کارگیری روش‌های متن‌کاوی در کنار الگوریتم‌های یادگیری ماشین می‌تواند ابزاری کارآمد برای شناسایی الگوهای پنهان در گزارش‌های سوانح هوایی و پشتیبانی از تصمیم‌گیری‌های ایمنی باشد. بر این اساس، پیشنهاد می‌شود در پژوهش‌های آینده بانک‌های داده‌ای جامع‌تر و استانداردتر از گزارش‌های سوانح فراهم گردد تا بستری مناسب برای انجام تحلیل‌های پیچیده‌تر و دقیق‌تر فراهم شود. همچنین بهره‌گیری از روش‌های پیشرفته‌تر مانند الگوریتم‌های یادگیری عمیق نیز می‌تواند دقت طبقه‌بندی را بهبود بیشتری دهد.

کلیدواژه‌ها

متن‌کاوی

سوانح هوایی

یادگیری ماشین

مدل‌سازی موضوعی

ایمنی پرواز

موضوعات

هوانوردی/خلبانی/مراقبت پرواز/ایمنی/استاندارد/اویونیک/مخابرات هوائی/...

عنوان مقاله English

Text Mining of Final Aviation Accident Reports: A Case Study of the Civil Aviation Organization of Iran

نویسندگان English

Parham Hassan ¹

Hamid Reza Zarghami ²

¹ M.Sc. in Mathematical Statistics, Faculty of Mathematics, Statistics and Computer Science, University of Tehran, Iran

² Associate Professor of Industrial Engineering, Faculty of Graduate Studies, Shahid Sattari University of Aerospace Science and Technology, Tehran, Iran

چکیده English

In this study, text mining methods and machine learning algorithms were employed to analyze the final reports of Iranian air accidents during the period 2007 to 2025. The dataset consisted of 139 reports from the Civil Aviation Organization database, which were analyzed after textual preprocessing, including the removal of redundant characters, word normalization, stop-word elimination, and stemming. In the first stage, word frequency analysis and then topic modeling using the STM algorithm were applied to identify the main topics of the texts. The results indicated that the dominant topics included engine performance, approach and landing processes, aviation training, and helicopter accidents. Subsequently, accident severity was classified into four main categories using K-Nearest Neighbors, Support Vector Machines, Naive Bayes, Decision Tree, and Random Forest algorithms. Model evaluation showed that the Random Forest (RF) algorithm achieved the highest performance with an accuracy of 69 percent. These findings suggest that the integration of text mining techniques with machine learning algorithms can serve as an effective tool for uncovering hidden patterns in aviation accident reports and supporting safety-related decision-making. Accordingly, it is recommended that future research focus on developing more comprehensive and standardized accident report databases in order to provide a stronger foundation for conducting more complex and precise analyses. Also, using more advanced methods such as deep learning algorithms can further improve classification accuracy.

کلیدواژه‌ها English

Text Mining

Air Accidents؛ Machine Learning؛ Topic Modeling؛ Flight Safety

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از 08 بهمن 1404

XML

تاریخ دریافت 11 مهر 1404
تاریخ بازنگری 16 آذر 1404
تاریخ پذیرش 18 آذر 1404
تاریخ اولین انتشار 08 بهمن 1404

تعداد مشاهده مقاله 86

فناوری در مهندسی هوافضا

متن‌کاوی گزارش‌های نهایی سوانح هوایی: مطالعه‌ی موردی سازمان هواپیمایی کشوری

Text Mining of Final Aviation Accident Reports: A Case Study of the Civil Aviation Organization of Iran

مقالات آماده انتشار، پذیرفته شده انتشار آنلاین از 08 بهمن 1404

فایل ها

سابقه مقاله

هم رسانی

ارجاع به این مقاله

آمار

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از 08 بهمن 1404