اطلاعات جغرافیایی
زهرا مرادی؛ محمدسعدی مسگری
چکیده
اهمیت روزافزون مسکن به لحاظ تأثیرات عمیق و قابلتوجهی که بر ابعاد مختلف اجتماعی، سیاسی و اقتصادی کشورها میگذارد، بر کسی پوشیده نیست؛ بنابراین برآورد دقیق و قابلاعتماد قیمت بهطورقطع امر سیاستگذاری در این زمینه را آسان مینماید. در شرایط مختلف ممکن است صدها عامل بهصورت زیرمجموعهای از عوامل ساختاری، مکانی و اجتماعی – ...
بیشتر
اهمیت روزافزون مسکن به لحاظ تأثیرات عمیق و قابلتوجهی که بر ابعاد مختلف اجتماعی، سیاسی و اقتصادی کشورها میگذارد، بر کسی پوشیده نیست؛ بنابراین برآورد دقیق و قابلاعتماد قیمت بهطورقطع امر سیاستگذاری در این زمینه را آسان مینماید. در شرایط مختلف ممکن است صدها عامل بهصورت زیرمجموعهای از عوامل ساختاری، مکانی و اجتماعی – اقتصادی بر قیمت املاک تأثیر بگذارد. بنابراین بایستی با در نظر گرفتن این عوامل، قیمت گذاری املاک بهطور کارآمد انجام شود. با توجه به ماهیت پیچیدهی بازار املاک در تحقیقات انجامشده از الگوریتمهای متداول یادگیری عمیق مانند DNN ، RNN، CNNو ... استفادهشده است، اما این الگوریتمها در خصوص دادههای جدولی چندان مناسب نمیباشند. از طرفی مدلهای یادگیری عمیق موجود در قیمتگذاری ملک نیز کاملاً قطعی هستند و عدم قطعیت دادهها را لحاظ نمیکنند. در این مقاله سعی شده است که در بهکارگیری روشهای یادگیری عمیق به ساختار جدولی دادههای املاک توجه شود. برای این منظور معماری عمیق جدید TabNet به کار گرفته شده است. این الگوریتم برخلاف سایر الگوریتمهای متداول یادگیری عمیق دادههای جدولی خام را بدون هیچگونه پیشپردازشی دریافت میکند. در این پژوهش همچنین با استفاده از تکنیکهای ترکیب موجود، منطق فازی با الگوریتمهای یادگیری عمیق ترکیب شده است تا ضمن یادگیری سریع و دقیقتر مسائل پیچیده، بر کاستی های قطعی بودن مدل های یادگیری عمیق و در نظر نگرفتن عدم قطعیت ذاتی دادهها در این مدل ها غلبه شود. همچنین با بهکارگیری سیستم اطلاعات مکانی (GIS) ارزیابی شفافتری ارائه شد تا بصری سازی کامل الگوی مکانی ویژگیهای ملک و همچنین ارتباط این ویژگیها و قیمتگذاری تضمین و متغیرهای مکانی نیز در مدل ارزشگذاری لحاظ شوند. بهمنظور ارزیابی روشهای پیشنهادی از دادههای املاک منطقهی پنج تهران استفاده شده است. ترتیب و اولویتبندی تأثیرگذاری ویژگیها در قیمتگذاری املاک مسکونی تهران توسط الگوریتم TabNet نشاندهندهی تأثیر قابلتوجه عوامل مکانی میباشد. بهطوریکه در این رتبهبندی پس از مساحت دو ویژگی مکانی طول و عرض جغرافیایی به ترتیب رتبهی دوم و سوم را دارا میباشند. درنهایت برای مجموعه دادهی تهران الگوریتمهای TabNet، DNN،CNN ، RNN، LSTM، خود رمزگذار و همچنین الگوریتم یادگیری ماشین XGBoost به کار گرفتهشده و معیارهای ارزیابیRMSE ،MAE و مقایسه شدند که بر اساس معیار، با به کارگیریTabNet پنج درصد بهبود دقت حاصل شد. درنهایت RMSE الگوریتم ترکیبی FuzzyTabNet برای دادهی تهران نسبت به الگوریتم پایهی TabNet 4.65% کاهش یافت. همچنین شبکهی خود رمزگذار فازی نیز نسبت به شبکهی خود رمزگذار معمولی 6.52 درصد بهبود یافت.