سیستم اطلاعات جغرافیایی
مینا کریمی؛ محمدسعدی مسگری
چکیده
امروزه با افزایش روز افزون استفاده کاربران از شبکه های اجتماعی، اطلاعات مکانی مردم گستر رشد چشمگیری داشته است. از میان انواع اطلاعات، محتواهای متنی کاربرتولید غالباً در ساختار مشخصی به اشتراک گذاشته نمی شوند. یکی از ویژگی های عمده این نوع اطلاعات محل مبنا بودن آنها است.محل های مورد گفتگوی بشر معمولاً همراه با ابهام ...
بیشتر
امروزه با افزایش روز افزون استفاده کاربران از شبکه های اجتماعی، اطلاعات مکانی مردم گستر رشد چشمگیری داشته است. از میان انواع اطلاعات، محتواهای متنی کاربرتولید غالباً در ساختار مشخصی به اشتراک گذاشته نمی شوند. یکی از ویژگی های عمده این نوع اطلاعات محل مبنا بودن آنها است.محل های مورد گفتگوی بشر معمولاً همراه با ابهام و وابسته به بافت است. عملکرد محل یا به عبارتی عمده فعالیت هایی که افراد در یک محل انجام می دهند، به عنوان یک بافت در توصیفات محل، ازجمله ویژگی های عمده و متمایزکننده محل است. هدف این تحقیق استخراج عملکرد محل با استفاده از تحلیل محتواهای متنی کاربرتولید به اشتراک گذاشته شده توسط کاربران است. به این منظور ابتدا محل ها و نظرات کاربران در مورد محل ها در وبگاه TripAdvisorبه عنوان محتواهای متنی، جمع آوری شده، سپس از روش های مختلف پردازش زبان طبیعی به منظور آماده سازی و پیش پردازش داده ها استفاده می شود. در ادامه برای هر دیدگاه کاربر یک مجموعه واژگان با استفاده از مقادیر TF-IDFبه عنوان مقادیر بردار ویژگی ساخته می شود. سپس در یک روش نظارت شده این مقادیر به همراه عملکرد محل هابه عنوان ورودی به یک طبقه بندی کننده لجستیک رگرسیون به منظور آموزش مدل داده شده و با استفاده از آن عملکرد محل بر روی داده های آزمایشی پیش بینی شده است. نتایج ارزیابی روش از طریق محاسبه ماتریس درهم ریختگی نشان می دهد، صحت کلی روش پیشنهادی در حدود 96درصد است که رقم قابل توجهی است. همچنین بیشترین دقت و امتیاز F1 برای محل های سرو خوراکی است، درحالی که اقامتگاه ها به دلیل شباهت عملکردی به هتل ها کمترین دقت و امتیاز F1را دارند ولی با این وجود نتایج آنها نیز قابل اطمینان و رضایت بخش است.