تحلیل مصرف آب شهری (خانگی) شهرستان بابل با استفاده از روش های داده کاوی

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری سامانه اطلاعات مکانی، دانشگاه صنعتی خواجه نصیرالدین طوسی

2 استادیار مهندسی کامپیوتر دانشکده کامپیوتر، دانشگاه صنعتی خواجه نصیرالدین طوسی

10.22131/sepehr.2019.37499

چکیده

مسئله کمبود آب در ایران با توجه به قرارگیری آن در منطقه خشک و کم آب خاورمیانه و روند نسبتاً سریع افزایش جمعیت شهری و مصرف بیرویه آب، هر روز ابعاد جدی‌‌تری به خود می‌‌گیرد. این مسئله و همچنین فقدان الگوی مشخص از نحوه و میزان مصرف آب در کشور، استفاده از سیستم‌‌های پردازش اطلاعات را در مدیریت منابع آب ضروری می‌‌نماید. کاوش قوانین وابستگی می‌‌تواند به عنوان یکی از روش‌‌های مطلوب جهت بهینه‌‌سازی و تحلیل عوامل مؤثر در میزان مصرف آب مورد استفاده قرار گیرد. در این مطالعه از کاوش قوانین وابستگی و الگوریتم درخت تصمیم به منظور تحلیل داده‌‌های موجود در زمینه مصرف آب شهری محله‌‌های شهرستان بابل استفاده شده است. پارامترهای مکانی و اجتماعی- اقتصادی  مانند فاصله از رودخانه بابلرود، فاصله از راه‌‌های اصلی، ویلایی یا آپارتمانی بودن، مساحت فضای سبز خانگی،  تعداد واحدهای مسکونی، تراکم جمعیت، درصد پیر یا جوان بودن، متوسط تعداد افراد هر خانواده و مساحت حیاط ساختمان انتخاب شدند. با استفاده از کاوش قوانین وابستگی به کشف ارتباط میان میزان مصرف آب و پارامترهای موردنظر پرداخته شده است. با بهره‌‌گیری از یک درخت تصمیم، عوامل مرتبط با مصرف، طبقه‌‌بندی و میزان مصرف آب بخشی از مشترکین به عنوان داده‌‌های تست پیش‌‌بینی شده است. به کمک تعیین نواحی با بیشترین میزان مصرف آب و الگوی مکانی توزیع مصرف آب خانوار، این قوانین ارزیابی شده‌‌اند. در این پژوهش پارامترهایی که رابطه عکس یا مستقیم با میزان مصرف آب خانوار دارند و همچنین پارامترهایی که اهمیت بیشتری نسبت به سایر عوامل دارند، مشخص شده‌‌اند. با بررسی میزان مصرف آب خانوار، محله‌‌های با بیشترین میزان مصرف که محله‌‌های ساحلی رودخانه بابلرود هستند، به عنوان محله‌‌های پرمصرف شناسایی شده‌‌اند. ساختمان‌‌ها در این محله‌‌ها، ویلایی و دارای تراکم جمعیت پایین‌‌تر و مساحت فضای سبز و حیاط بالاتری نسبت به سایر محله‌‌ها هستند.
 

کلیدواژه‌ها


عنوان مقاله [English]

Analysis of urban water consumption in Babol County using data mining methods

نویسندگان [English]

  • Mehrdad AhangarCani 1
  • Seyyed Hossien Khasteh 2
1 Geospatial Information System Group, Faculty of Geodesy and Geometric Engineering, K.N.Toosi University of Technology, Tehran, Iran
2 Assitant Professor, Faculty of Computer Engineering, K. N. Toosi University of Technology
چکیده [English]

Extended Abstract
Introduction and Objective
Due to the location of Iran in dry regions of the Middle East, and also because of the rapid increase in its urban population and water consumption, every day the issue of water scarcity becomes more severe in Iran. In recent years, Iran has faced serious water scarcity and excessive consumption of water resources. Therefore, patterns of urban water consumption, different geographic, spatial, demographic, social, and economic parameters, and the relation between these parameter and water consumption are considered to be among important issues affecting management of water resources. The present study seeks to investigate and analyze the spatial pattern of domestic water consumption in Babol County, and also to identify parameters affecting the pattern of water use. This is achieved by extracting association rules from some spatial and socio-economic parameters and based on the water use level in this County. The study also aims to determine regions with high/low level of water use, investigate spatial distribution of water consumption and finally, identify and categorize parameters affecting domestic water consumption at neighborhood level in this County using Decision Tree model.
 
Materials and methods
Data: Domestic water consumption data, census data, spatial and socio-economic parameters such as distance from main roads, distance from Babolrood, total area of garden and green space in each building, building site and standing property (total area of house yard), population density, total number of houses vs. apartments, number of housing units, average number of people per household, percentage of young/old people per household were extracted from the Statistical Center of Iran for the time period of 2011 to 2016. Then, these data were used to analyze urban water consumption in Babol County.
Methods: Apriori algorithm - a data mining algorithm used to extract association rules- has been used to discover and extract relationships between different spatial socio-economic parameters and domestic water consumption patterns. Moreover, a decision tree has been developed which takes advantage of these parameters to predict domestic water use.
 
Results and Discussion
 Results indicated that number of houses, number of household members, green space in each house, total area of house yard and distance from main roads are directly related with the household water consumption. On the other hand, population density, percentage of youth population, number of residential units and distance from Babolrood River are inversely related to domestic water consumption. Among all parameters considered in the present study, total area of house yard, distance from Babolrood River, number of residential units and number of household members exhibited a stronger relationship with water consumption. Thus, they were located on higher branches of the final decision tree. Additionally, results of global Moran’s I index indicated that there exists a spatial autocorrelation among household water consumption data. Moreover, this index indicated the clustered nature of residential water consumption distribution in Babol County. Also, spatial distribution of domestic water consumption in this County demonstrated that western and coastal areas with minimum distance from Babolrood River have the highest level of domestic water consumption. Therefore, it can be concluded that with an increase in distance from Babolrood River, domestic water consumption decreases. Only terraced and semi-detached houses exist in these neighborhoods. Thus compared to other neighborhoods, they have a lower population density, larger green space and larger yard.
 
Conclusion and Future Works
  The present study applies Apriori algorithm to extract association rules and discover the relationship between spatial and socio-economic parameters and domestic water consumption. Results indicated that spatial and socio-economic parameters affect the spatial distribution of domestic water consumption in Babol County. Developing a decision tree, parameters associated with domestic water consumption were categorized and amount of water consumption was predicted. Extracted rules predicted domestic water consumption of test data with an accuracy of 75%. In this study, global Moran’s I index indicated the existence of a spatial autocorrelation among water consumption data. It also proves the clustered nature of domestic water consumption distribution in the study area. Additionally, spatial distribution of domestic water consumption in Babol County indicated that western and coastal neighborhoods have the highest level of domestic water consumption, while southern neighborhoods of Babol County have the lowest level of domestic water consumption. Model developed in the present study provides an opportunity for analyzing and predicting the level of water consumption. This will make planning for the reduction of water consumption and management of water resources possible. We suggest that future works evaluate the effect of other spatial and socio-economic parameters such as water cost and educational status of household members in a longer period (more than 5 years) to improve the accuracy of the model.

کلیدواژه‌ها [English]

  • Data Mining
  • Geographical Information System
  • Association rules mining
  • Decision tree
  • water consumption
  • Babol County

1- آقاحسینعلی شیرازی، اکبرپور؛ محسن، ابوالفضل، (1390)، برآورد تقاضای روزانه آب شهری با استفاده از سری فوریه: مطالعه موردی شهر بیرجند در استان خراسان جنوبی، کنفرانس بین المللی آب و فاضلاب، تهران - شرکت مهندسی آب و فاضلاب کشور.

2- ابراهیمی, نادری؛ پرویز، حسن، (1380)، بررسی و ارزیابی مدیریت عرضه و تقاضای آب شرب در شرایط خشکسالی اصفهان، مجله آب و محیط زیست (49-48), 97-89.

3- بوستانی، انصاری؛ آرمین، حسین، (1389)، ارائه رویکردهای مناسب در مدیریت مصرف آب شهری، همایش علمی چالش آب در استان قم گذشته، حال و آینده، دانشگاه قم.

4- جوادیان‌زاده، محمدمهدی، (1388)، تهیه تابع تقاضای آب شهری با استفاده از روش شبکه های عصبی مصنوعی در شهر یزد، سومین همایش ملی آب و فاضلاب ( با رویکرد اصلاح الگوی مصرف) 4 تا 5 اسفند 1388، تهران - پژوهشگاه نیرو

5- شمسایی، م. (1379). برآورد تابع تقاضای آب استان اصفهان، مجموعه 21 مقاله ارائه شده در اولین همایش علمی و تحقیقاتی بهینه سازی مصرف آب، انتشارات روابط عمومی و امور بین الملل شرکت آب و فاضلاب استان تهران.

6- شهرستانی، حسین، (1393)، سازماندهی و مدیریت مصرف بهینه آب در بخش کشاورزی. فصلنامه نظام مهندسی کشاورزی و منابع طبیعی، 45(12)، 41-37.

7- مرکز آمار ایران، (1390)، سالنامه آماری کشور (https://salnameh.sci.org.ir/AllUser/DirectoryTreeComplete.aspx).

8- محمدی، ر. (1393). بررسی تأثیر هدفمندی یارانه‌ها بر الگوی مصرف و میزان مصرف آب شهر اردبیل.پایان نامه دوره کارشناسی ارشد، دانشکده مدیریت، دانشگاه آزاد اسلامی واحد گرمی، اردبیل.

9- ملکی نسب، ا.، ابریشم‌چی, ا.، و تجریشی، م. (1386). ارزیابی صرفه‌جویی در مصرف آب خانگی به واسطه استفاده از قطعات کاهنده مصرف. مجله آب و فاضلاب،18(2), 11-2.

10- ورزیری، وکیل پور، مرتضوی؛ آزیتا، محمدحسن، سید ابوالقاسم، (1395)، بررسی اثر قیمت‌گذاری اقتصادی آب آبیاری بر الگوی کشت در دشت دهگلان. فصلنامه علمی -پژوهشی تحقیقات اقتصاد کشاورزی, 8(31), 81-100

 

11- Agarwal & Srikant, R., R. (1994). Fast algorithms for mining association rules. in Proc. 20th int. conf. very large data bases, VLDB, pp. 487-499.

12- Agrawal, Imieliński & Swami, R., T., A. (1993). Mining association rules between sets of items in large databases. Acm sigmod record (ACM),Vol. 22, No. 2, pp. 207-216.

13- Agrawal, Mannila, Srikant, Toivonen & Verkamo, R., H., R., H., A. I. (1996). Fast discovery of association rules. Advances in knowledge discovery and data mining, 12(1), 307-328.

14- AhangarCani, Farnaghi, & Shirzadi, M., M., M. (2016). Predictive Map of Spatio-Temporal Distribution of Leptospirosis Using Geographical Weighted Regression and Multilayer Perceptron Neural Network Methods. Journal of Geomatics Science and Technology, 6(2), 79-98.

15- Ali, Manganaris & Srikant, K., S., R. (1997). Partial Classification Using Association Rules. In KDD, vol. 97, pp. p115-118.

16- Appice, Ceci, Lanza, Lisi & Malerba, A., M., A., F. A, D. (2003). Discovery of spatial association rules in geo-referenced census data: A relational mining approach. Intelligent Data Analysis, 7(6), 541-566.

17- Breiman, Friedman, Olshen & Stone, L., J., R., C. (1984). Classification and Regression Trees (CART) Wadsworth. Pacific Grove, CA.

18- Chen, Shu, Ning & Chen, J.-C, C.-S, S.-K, H.-W. (2008). Flooding probability of urban area estimated by decision tree and artificial neural networks. Journal of Hydroinformatics, 10(1), 57-67.

19- Chen, Park & Yu, M.-S, J.-S, P. S. (1996). Data mining for path traversal patterns in a web environment. Distributed Computing Systems, Proceedings of the 16th International Conference on 1996 May 27, IEEE, pp. 385-392.

20- Dastourani, Habibipoor, Ekhtesasi, Talebi & Mahjoobi, M., A., M., A., J. (2013). Evaluation of the Decision Tree model in Precipitation Precipitation Prediction (case study: Yazd synoptic station). Iran Water Resources Research, 8(3), 14-27.

21- Entezari, Dadashi & Asadi, A., R.A., M. (2016). Assessing the Autocorrelation of Spatial - Temperature change in heat islands of Khorasan Razavi Province, pp. 39-43.

22- Fallahi, Ansari & Moghaddas, M., H., S. (2012). Evaluating effective factors on household water consumption and forecasting its demand: panel data approach. Water Waste J, 23(4), 78-87.

23- Fayyad, Piatetsky-Shapiro & Smyth, U., G., P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3), 37.

24- Geissen, Kampichler, López-de Llergo-Juárez & Galindo-Acántara, V., C., J., A. (2007). Superficial and subterranean soil erosion in Tabasco, tropical Mexico: development of a decision tree modeling approach. Geoderma, 139(3-4), 277-287.

25- Getis, Anselin, Lea, Ferguson & Miller, A., L., A., M., H. (2004). Spatial analysis and modeling in a GIS environment. A research agenda for geographic information science. CRC, Boca Raton, FL, 157-196.

26- Han, Pei & Kamber, J., J., M. (2011). Data mining: concepts and techniques: Elsevier.

27- Jolliffe & Philipp, I. T., A. (2010). Some recent developments in cluster analysis. Physics and Chemistry of the Earth, Parts A/B/C, 35(9-12), 309-315.

28- Kendall, W. S. (1998). Perfect simulation for the area-interaction point process, Probability towards 2000, Springer, New York, pp. 218-234.

29- Kheir, Chorowicz, Abdallah & Dhont, R. B., J., C., D. (2008). Soil and bedrock distribution estimated from gully form and frequency: a GIS-based decision-tree model for Lebanon. Geomorphology, 93(3-4), 482-492.

30- Kim & Yum, Y. S., B.-J , (2011), Recommender system based on click stream data using association rule mining. Expert Systems with Applications, 38(10), 13320-13327.

31- Mitchell, A. (1999). The ESRI guide to GIS analysis: geographic patterns & relationships, Volume 1, ESRI, Inc.

32- Mitchell, A. (2005). The ESRI guide to GIS analysis, Volume 2, spatial measurements and statistics ESRI Press. Redlands CA: Esri Press.

33- Moran, P. A. (1950). Notes on continuous stochastic phenomena. Biometrika, 37(1/2), 17-23.

34- Narayanan, A. (1993). Probability and Statistics in Engineering and Management Science: Taylor & Francis, pp. 238-239.

35- Ripley, B. D. (2005). Spatial statistics (Vol. 575): John Wiley & Sons.

36- Ruiz, Tedesco, McTighe, Austin & Kitron, M. O., C., T. J., C., U. (2004). Environmental and social determinants of human risk during a West Nile virus outbreak in the greater Chicago area, 2002. International Journal of Health Geographics, 3(1), 8.

37- Sabouhi & NOUBAKHT, M., M. (2009). Estimating the water demand function of Pardis city. Journal of Water and Wastewater, 20, pp. 69-74.

38- Statistical Center of Iran, (2011), Statistical Pocketbook of the Islamic Republic of Iran, Management & Planning Organization, Tehran. 786.

39- Taghi Sattari, Anli, Apaydin & Kodal, M., A., H., S. (2012). Decision trees to determine the possible drought periods in Ankara. Atmósfera, 25(1), 65-83.

40- Tan, P.-N. (2006). Introduction to data mining: Pearson Education India.

41- Tobler, W. R., (1970), A computer movie simulating urban growth in the Detroit region. Economic geography, 46(sup1), 234-240.

42- Versichele, De Groote, Bouuaert, Neutens, Moerman & Van de Weghe, M., L., M. C. T., I., N. (2014). Pattern mining in tourist attraction visits through association rule learning on Bluetooth tracking data: A case study of Ghent, Belgium. Tourism Management, 44, 67-81.

43- Yurekli, Taghi Sattari, Anli & Hinis, K., M., A., M. (2012). Seasonal and annual regional drought prediction by using data-mining approach. Atmósfera, 25(1), 85-105.