نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد مهندسی عمران نقشه‌برداری گرایش سیستم‌های اطلاعات جغرافیایی، دانشگاه خواجه‌نصیرالدین طوسی

2 دانشیار، دانشکده نقشه‌برداری، دانشگاه صنعتی خواجه‌نصیرالدین طوسی

چکیده

اهمیت روزافزون مسکن به لحاظ تأثیرات عمیق و قابل‌توجهی که بر ابعاد مختلف اجتماعی، سیاسی و اقتصادی کشورها می‌گذارد، بر کسی پوشیده نیست؛ بنابراین برآورد دقیق و قابل‌اعتماد قیمت به‌طورقطع امر سیاست‌گذاری در این زمینه را آسان می‌نماید. در شرایط مختلف ممکن است صدها عامل به‌صورت زیرمجموعه‌ای از عوامل ساختاری، مکانی و اجتماعی – اقتصادی بر قیمت املاک تأثیر بگذارد. بنابراین بایستی با در نظر گرفتن این عوامل، قیمت­ گذاری املاک به‌طور کارآمد انجام شود. با توجه به ماهیت پیچیده‌ی بازار املاک در تحقیقات انجام‌شده از الگوریتم‌های متداول یادگیری عمیق مانند DNN ، RNN،  CNNو ... استفاده‌شده است، اما این الگوریتم‌ها در خصوص داده‌های جدولی چندان مناسب نمی‌باشند. از طرفی مدل‌های یادگیری عمیق موجود در قیمت‌گذاری ملک نیز کاملاً قطعی هستند و عدم قطعیت داده‌ها را لحاظ نمی‌کنند. در این مقاله سعی شده است که در به‌کارگیری روش‌های یادگیری عمیق به ساختار جدولی داده‌های املاک توجه شود. برای این منظور معماری عمیق جدید TabNet به کار گرفته شده است. این الگوریتم برخلاف سایر الگوریتم‌های متداول یادگیری عمیق داده‌های جدولی خام را بدون هیچ‌گونه پیش‌پردازشی دریافت می‌کند. در این پژوهش هم‌چنین با استفاده از تکنیک‌های ترکیب موجود، منطق فازی با الگوریتم‌های یادگیری عمیق ترکیب ‌شده است تا ضمن یادگیری سریع و دقیق‌تر مسائل پیچیده، بر کاستی­ های قطعی بودن مدل­ های یادگیری عمیق و در نظر نگرفتن عدم قطعیت ذاتی داده‌ها در این مدل­ ها غلبه شود. همچنین با به‌کارگیری سیستم اطلاعات مکانی (GIS) ارزیابی شفاف‌تری ارائه شد تا بصری سازی کامل الگوی مکانی ویژگی‌های ملک و همچنین ارتباط این ویژگی‌ها و قیمت‌گذاری تضمین  و متغیرهای مکانی نیز در مدل ارزش‌گذاری لحاظ شوند. به‌منظور ارزیابی روش‌های پیشنهادی از داده‌های املاک منطقه‌ی پنج تهران استفاده شده است. ترتیب و اولویت‌بندی تأثیرگذاری ویژگی‌ها در قیمت‌گذاری املاک مسکونی تهران توسط الگوریتم TabNet نشان‌دهنده‌ی تأثیر قابل‌توجه عوامل مکانی می‌باشد. به‌طوری‌که در این رتبه‌بندی  پس از مساحت دو ویژگی مکانی طول و عرض جغرافیایی به ترتیب رتبه‌ی دوم و سوم را دارا می‌باشند. درنهایت برای مجموعه داده‌ی تهران الگوریتم‌های TabNet، DNN،CNN ، RNN، LSTM، خود رمزگذار و همچنین الگوریتم یادگیری ماشین XGBoost به کار گرفته‌شده و معیارهای ارزیابیRMSE ،MAE  و  مقایسه شدند که بر اساس معیار، با به کارگیریTabNet   پنج درصد بهبود دقت حاصل شد. درنهایت RMSE الگوریتم ترکیبی FuzzyTabNet برای داده‌ی تهران نسبت به الگوریتم پایه‌ی TabNet  4.65% کاهش یافت. همچنین شبکه‌ی خود رمزگذار فازی نیز نسبت به شبکه‌ی خود رمزگذار معمولی 6.52 درصد بهبود یافت.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Residential property valuation using a hybrid fuzzy deep learning approach

نویسندگان [English]

  • Zahra Moradi 1
  • Mohammad Sadi Mesgari 2

1 K. N. Toosi University of Technology

2 K. N. Toosi University of Technology

چکیده [English]

Extended Abstract-
Introduction: The growing importance of housing is not hidden from anyone in terms of the profound and significant effects it has on the various social, political, and economic dimensions of countries; Therefore, accurate and reliable price estimation definitely facilitates policy-making in this field. Hundreds of factors may affect property prices in different situations as a subset of structural, spatial, and socio-economic factors. Therefore, considering these factors, property pricing should be done efficiently. Due to the complex nature of the real estate market, research has used common deep learning algorithms such as DNN, RNN, CNN, etc., but these algorithms are not very suitable for tabular data. On the other hand, the deep learning models in property pricing are also completely definite and do not take into account data uncertainty.
Materials & Method: In this article, we have tried to pay attention to the tabular structure of real estate data in applying deep learning methods. The TabNet deep new architecture is used for this purpose. In addition, at the same time as the learning process, it makes feature selection fully interpretable. In this study, also using existing combination techniques, fuzzy logic is combined with deep learning algorithms to learn complex problems faster and more accurately, to overcome the shortcomings of the certainty of deep learning models and not consider the inherent uncertainty of the data in this models. In this study, using the existing combination techniques, also using spatial information system (GIS) to provide a clearer evaluation to ensure full visualization of the spatial pattern of property properties as well as the relationship between these properties and pricing and spatial variables are included in the valuation model. In order to evaluate the proposed methods, real estate data of District 5 of Tehran were used.
Results & Discussion: The order and prioritization of the impact of features on the pricing of Tehran residential properties by the TabNet algorithm indicate the significant impact of spatial factors. So that in this ranking, after the area, the two spatial characteristics of latitude and longitude have the second and third ranks, respectively. Basically, latitude and longitude indicate the criteria of neighborhoods and the type and prestige of different places in the city, and the social class of different streets and neighborhoods in the city, which is clearly a factor in influencing the price. Finally, TabNet, DNN, CNN, RNN, LSTM, Autoencoder algorithms as well as XGBoost machine learning algorithms were used for the  Tehran data set, and RMSE, MA and  evaluation criteria were compared, which according to the  criterion, a 5% improvement in accuracy was achieved by using TabNet. Finally, the RMSE of the FuzzyTabNet hybrid algorithm for Tehran data decreased by 4/65% compared to the basic TabNet algorithm. The fuzzy Autoencoder network also improved by 5/52% compared to the common Autoencoder network.

کلیدواژه‌ها [English]

  • Residential property pricing
  • Deep learning
  • Deep Neural Networks
  • Fuzzy
  • TabNet
1 - عبده کلاهچی, م., رفیعیان نجف آبادی, م., دهقانی, م., & میرزاده, س. (1393). تحلیل عوامل مؤثر بر قیمت مسکن با استفاده از مدل تحلیل رگرسیون گام به گام (مطالعه موردی: محله فاطمی تهران). اقتصاد و مدیریت شهری, 2(7), -. https://www.sid.ir/fa/journal/ViewPaper.aspx?id=233672
2 - Afonso, B., Melo, L., Oliveira, W., Sousa, S., & Berton, L. (2019). Housing prices prediction with a deep learning and random forest ensemble. Anais do XVI Encontro Nacional de Inteligência Artificial e Computacional,
3 - Arık, S. O., & Pfister, T. (2021). Tabnet: Attentive interpretable tabular learning. AAAI,
4 - Ayan, E., & Eken, S. (2021). Detection of price bubbles in Istanbul housing market using LSTM autoencoders: A district-based approach. Soft Computing, 25(12), 7957-7973.
5 - Bae, S., & Yu, J. (2017). Predicting the real estate price index using deep learning. Korea Real Estate Review, 27(3), 71-86.
6 - Benjamin, J., Guttery, R., & Sirmans, C. (2004). Mass appraisal: An introduction to multiple regression analysis for real estate valuation. Journal of Real Estate Practice and Education, 7(1), 65-77.
7 - Borst, R. A. (1991). Artificial neural networks: the next modelling/calibration technology for the assessment community. Property Tax Journal, 10(1), 69-94.
8 - Chen, C. P., Zhang, C.-Y., Chen, L., & Gan, M. (2015). Fuzzy restricted Boltzmann machine for the enhancement of deep learning. IEEE Transactions on Fuzzy Systems, 23(6), 2163-2173.
9 - Chen, W., An, J., Li, R., Fu, L., Xie, G., Bhuiyan, M. Z. A., & Li, K. (2018). A novel fuzzy deep-learning approach to traffic flow prediction with uncertain spatial–temporal data features. Future generation computer systems, 89, 78-88.
10 - Chen, X., Wei, L., & Xu, J. (2017). House price prediction using lstm. arXiv preprint arXiv:1709.08432.
11 - Guan, J., Shi, D., Zurada, J. M., & Levitan, A. S. (2014). Analyzing massive data sets: an adaptive fuzzy neural approach for prediction, with a real estate illustration. Journal of organizational computing and electronic commerce, 24(1), 94-112.
12 - Guan, J., Zurada, J., & Levitan, A. (2008). An adaptive neuro-fuzzy inference system based approach to real estate property assessment. Journal of real estate research, 30(4), 395-422.
13 - Jang, J.-S. (1993). ANFIS: adaptive-network-based fuzzy inference system. IEEE transactions on systems, man, and cybernetics, 23(3), 665-685.
14 - Kang, Y., Zhang, F., Peng, W., Gao, S., Rao, J., Duarte, F., & Ratti, C. (2021). Understanding house price appreciation using multi-source big geo-data and machine learning. Land Use Policy, 111, 104919.
15 - Khalid, S., Khalil, T., & Nasreen, S. (2014). A survey of feature selection and feature extraction techniques in machine learning. 2014 science and information conference,
16 - Kim, H., Kwon, Y., & Choi, Y. (2020). Assessing the impact of public rental housing on the housing prices in proximity: based on the regional and local level of price prediction models using long short-term memory (LSTM). Sustainability, 12(18), 7520.
17 - Li, Z. X. (2007). Using fuzzy neural network in real estate prices prediction. 2007 Chinese control conference,
18 - McCord, M., Davis, P., Haran, M., McGreal, S., & McIlhatton, D. (2012). Spatial variation as a determinant of house price: Incorporating a geographically weighted regression approach within the Belfast housing market. Journal of Financial Management of Property and Construction.
19 - Nghiep, N., & Al, C. (2001). Predicting housing value: A comparison of multiple regression analysis and artificial neural networks. Journal of real estate research, 22(3), 313-336.
20 - Rafiei, M. H., & Adeli, H. (2016). A novel machine learning model for estimation of sale prices of real estate units. Journal of Construction Engineering and Management, 142(2), 04015066.
21- Ribeiro, M. H. D. M., & dos Santos Coelho, L. (2020). Ensemble approach based on bagging, boosting and stacking for short-term prediction in agribusiness time series. Applied Soft Computing, 86, 105837.
22 - Seya, H., & Shiroi, D. (2019). A comparison of apartment rent price prediction using a large dataset: Kriging versus DNN. arXiv preprint arXiv:1906.11099.
23 - Shwartz-Ziv, R., & Armon, A. (2022). Tabular data: Deep learning is not all you need. Information Fusion, 81, 84-90.
24 - Souri, D., & MONIRI, J. S. (2011). Estate pricing model, an application of geographic balanced regression.
25 - Tabales, J. M. N., Caridad, J. M., & Carmona, F. J. R. (2013). Artificial neural networks for predicting real estate price. Revista de Métodos Cuantitativos para la Economía y la Empresa, 15, 29-44.
26 - Talpur, N., Abdulkadir, S. J., & Hasan, M. H. (2020). A deep learning based neuro-fuzzy approach for solving classification problems. 2020 International Conference on Computational Intelligence (ICCI),
27 - Victoria, A. H., & Maragatham, G. (2021). Automatic tuning of hyperparameters using Bayesian optimization. Evolving Systems, 12(1), 217-223.
28 - Xiaolong, H., & Ming, Z. (2010). Applied research on real estate price prediction by the neural network. 2010 The 2nd Conference on Environmental Science and Information Application Technology,
29 - Xu, H., & Gade, A. (2017). Smart real estate assessments using structured deep neural networks. 2017 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computed, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI),
30 - Yazdanbakhsh, O., & Dick, S. (2019). A deep neuro-fuzzy network for image classification. arXiv preprint arXiv:2001.01686.
31 - Yiorkas, C., & Dimopoulos, T. (2017). Implementing GIS in real estate price prediction and mass valuation: the case study of Nicosia District. Fifth International Conference on Remote Sensing and Geoinformation of the Environment (RSCy2017),
32 - Zaremba, W., Sutskever, I., & Vinyals, O. (2014). Recurrent neural network regularization. arXiv preprint arXiv:1409.2329.