تحقیقات بازاریابی در انقلاب صنعتی چهارم، استفاده از تحلیل کلان‌داده‌ها و «یادگیری ماشین» جهت ارائه ارزش به مشتری

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری‎ ‎مدیریت بازرگانی، گروه مدیریت، دانشکده علوم اداری و اقتصاد، دانشگاه اصفهان، ایران

2 دانشیار گروه مدیریت، دانشکده علوم اداری و اقتصاد، دانشگاه اصفهان، اصفهان، ایران

چکیده

از مهمترین پیامدهای چهارمین انقلاب صنعتی، دیجیتالیزه شدن محیط کسب‌وکار و گسترش بازاریابی داده محور می‌باشد که پیامدهای این تحولات تأثیرات عمیقی بر تحقیقات بازاریابی خواهد داشت. هدف این پژوهش شناسایی ویژگی‌ یا مؤلفه‌های ارزش از میان حجم انبوه نظرات مشتریان در شبکه‌های مجازی با استفاده از یادگیری ماشین جهت تحلیل کلان‌داده‌ها، با رویکرد بازاریابی پیشبینانه که متناسب با فضای موجود است می‌باشد. این پژوهش از لحاظ هدف کاربردی، از نظر روش گردآوری داده‌ها توصیفی-پیمایشی و از نظر اجرا کیفی-کمی (آمیخته) است. بدین منظور صنعت گردشگری به عنوان مطالعه موردی انتخاب و تعداد 8290 نظر از مشتریان در این رابطه از بستر اینترنت جمع‌آوری و با استفاده از دو روش مختلف‌ «خوشه‌بندی داده‌ها» و «استخراج قوانین انجمنی»، مؤلفه‌های ارزش، استخراج می‌گردند. نتایج پژوهش در قسمت خوشه‌بندی‌ شامل شناسایی 20 مؤلفه‌ ارزش در رابطه با ارزش‌های مورد نظر گردشگران می‌باشد؛ همچنین با استفاده از روش دوم (قوانین انجمنی)، هفت قانون از میان دانش پنهان، در روابط بین عبارات بکار برده شده در نظرات گردشگران استخراج گردید. بطور کلی نتایج نشان می‌دهد با استفاده از تحلیل کلان‌داده‌ها و یادگیری ماشین، انجام فرآیند «تحقیقات بازاریابی» با سرعت و دقت بالاتر و هزینه نسبی کم‌تر امکان‌پذیر است.

کلیدواژه‌ها


عنوان مقاله [English]

Marketing Research in the Fourth Industrial Revolution, Using “Big Data” Analytics and “Machine Learning” to Provide Value to the Customer

نویسندگان [English]

  • Sayed Mohsen Mousavi 1
  • Seyed Fathollah Amiri Aghdaie 2
1 PhD Candidate of Business Management, Department of Management, Faculty of Administrative Sciences ‎and Economics, University of Isfahan, Isfahan, Iran
2 Associate Professor, Department of Management, Faculty of Administrative Sciences and Economics, ‎University of Isfahan, Isfahan, Iran
چکیده [English]

One of the most important consequences of the fourth industrial revolution is the digitalization of the business environment and the expansion of data-driven marketing. The consequences of these developments will have a profound effect on marketing research. The purpose of this study is to identify the components of value among the large volume of customer feedback in social networks using “Machine Learning” to analyze “Big Data”. This research is descriptive-survey in terms of applied purpose, qualitative in terms of data collection method and qualitative-quantitative (mixed methods) in terms of implementation. For this purpose, the tourism industry is selected as a case study and 8290 customers' opinions are collected from the Internet in this regard and the components of value are extracted using two different methods of "data clustering" and extraction of “association rules". The results of the research in the data clustering section include the identification of 20 value components in relation to the values desired by tourists. Also, using the second method (association rules), seven laws were extracted from the hidden knowledge, in the relationships between the phrases used in the opinions of tourists. In general, the results show that using Big Data analytics and “Machine Learning”, the process of “marketing research” is possible with higher speed and accuracy and lower relative cost.

کلیدواژه‌ها [English]

  • Big Data
  • Marketing Research
  • Fourth Industrial Revolution
  • Machine learning
  • Value Creation

1. مقدمه

درحالِ‌حاضر، فضای کسب‌وکارْ شاهد تحولات عمیق و اساسی است و بسیاری از صاحب‌نظران در حوزۀ تجارت و اقتصاد بر این باورند که این شواهد حاکی از شروع دورۀ جدیدی یعنی انقلاب صنعتی چهارم است (مآر[1]، 2016؛ گوپتا و همکاران[2]، 2017). امروزه در محیط رقابتی کسب‌وکار به‌وجودآمده، شرکت‌ها در مواجهه با مسئلۀ داده‌های بزرگ یا کلان‌داده‌ها با چالش‌هایی مانند تصمیم‌گیری سریع برای بهبود بهره‌وری روبه‌رو هستند؛ زیرا بسیاری از سیستم‌های تولیدْ آمادگی لازم برای مدیریت کلان‌داده‌ها را به‌دلیلِ نبودِ ابزارهای تحلیلی هوشمند ندارند (لی و همکاران[3]، 2014). چهارمین انقلاب صنعتی (اصطلاحی که کلاوس شواب[4]، بنیان‌گذار و رئیس اجرایی اِجلاس جهانی اقتصاد معرفی کرده است) دنیایی را توصیف می‌کند که به افراد این توانایی را می‌دهد که برای زندگی‌کردن و مدیریت آن با استفاده از فناوری ارتباطات بین حوزه‌های دیجیتال و واقعیت آفلاین[5] حرکت کنند (شو و همکاران[6]، 2018).

نخستین انقلاب صنعتیْ زندگی و اقتصاد را به‌طورِ کلی دگرگون کرد و اقتصاد کشاورزی را به اقتصادی تغییر داد که در آن صنعت و ماشین‌آلات تحت‌سلطۀ انسان‌اند. نفت و برق، تولید انبوه را در دومین انقلاب صنعتی تسهیل کرد و در سومین انقلاب صنعتی از فناوری اطلاعات برای خودکارسازی تولید استفاده شد و درنهایت در چهارمین انقلاب صنعتی، به افزایش قدرت شناختی تولیدات انسانی توجه شد و این قدرت تقویت شد (شو و همکاران، 2018). باتوجه‌به تعاریف مختلف و مباحث علمی که برای توصیف سه انقلاب صنعتی نخست استفاده شده‌اند، می‌توان گفت از ابتدای قرن حاضر انقلاب چهارم شروع شده است که آن را با عنوان «انقلاب دیجیتال» نیز معرفی می‌کنند. ویژگی‌های این دوره فراگیربودن، اینترنت موبایل، حسگرهای[7] کوچک‌تر، قوی‌تر و درعینِ‌حالْ ارزان‌تر، هوش مصنوعی و «یادگیری ماشین» است (صنایعی، 1396). نکتۀ مهمی که در این باره باید در نظر داشت، این است که سرعت و اندازۀ تغییرات ناشی از انقلاب صنعتی چهارم را نباید نادیده گرفت؛ زیرا این تغییرات باعث تغییر و انتقال قدرت، ثروت و دانش خواهد شد. فقط با آگاهی از این تغییرات و سرعتی که این اتفاق می‌افتد می‌توان اطمینان حاصل کرد که مزایای پیشرفت‌های دانش و فناوری به دست آمده است (شو و همکاران، 2018).

همچنین، گسترش بی‌سابقه و فزایندۀ اینترنت باعث رشد سریع تولید محتوا توسط کاربران[8]، در شبکه‌های اجتماعی گوناگون شده است و این حجم عظیمِ داده به یکی از مهم‌ترین منابع اطلاعاتی برای هردو طرف مصرف‌کنندگان و کسب‌وکارها تبدیل شده است (دوان و همکاران[9]، 2013). همچنین رسانه‌های اجتماعی[10] در بستر اینترنتْ راه و روش ارتباط، همکاری و تعامل جامعه را تغییر داده‌اند. درحقیقت، رسانه‌های اجتماعی به مجموعه‌ای از ابزارهای آنلاین گفته می‌شود که ارتباطات میان افراد را ایجاد کرده‌اند و باعث تبدیل‌شدن ارتباط یک‌طرفه یا مونولوگ[11] به تعامل دوجانبه یا دیالوگ[12] شده‌اند (حلوانی و همکاران[13]، 2019).

با درنظرگرفتن فضای جدید به‌وجودآمده در انقلاب صنعتی چهارم و اهمیت داده‌ها به‌عنوانِ شالودۀ این انقلاب و تأثیر آن بر محیط کسب‌وکار، هدف این پژوهشْ شناسایی و بررسی مؤلفه‌های ارزش‌ ازنظر مشتریان براساسِ تحلیل کلان‌داده‌های مربوط به نظرات آنهاست؛ بدین منظور، صنعت گردشگری به‌عنوانِ نمونه‌ای است که مطالعه می‌شود. نظرات آنلاین، توصیف‌کنندۀ تجربیات مسافران از اقامت در هتل‌هاست و و ارزیابی گردشگران از هتل‌ها را منعکس می‌کند. این نظرات براساس سبک زندگی، نحوۀ تفکر و میزان لذت مسافران در مقصد هستند و نشان‌دهندۀ میزان رضایت مشتری از تجربۀ ماندن در مقصد یا هتل مربوطه‌اند (سانچز و همکاران[14]، 2019).

برای انجام این پژوهش، در گام اولْ عملیات پیش‌پردازش داده‌ها برای آماده‌سازی آنها انجام می‌شود. سپس در مرحلۀ دوم به‌منظورِ استخراج مؤلفه‌های ارزش‌، نظرات با روش «خوشه‌بندی داده‌ها» تجزیه‌وتحلیل می‌شوند. درنهایت در مرحلۀ سوم با استفاده از روش استخراج «قوانین انجمنی» به کشف دانش پنهان از مجموعۀ عبارات و لغات به‌کاررفته در نظرات گردشگران پرداخته می‌‌شود.

بررسی مطالعات داخلی و خارجی انجام‌شده نشان می‌دهد به‌دلیلِ جدیدبودن موضوع درزمینۀ فرصت‌ها و تهدیدات به‌وجودآمده در حوزۀ تحقیقات بازاریابی که تأثیرگرفته از پیامدهای «انقلاب صنعتی چهارم» است، پژوهش‌های انجام‌شده در ابتدای راه هستند و زمینۀ گسترده‌ای برای پژوهش در این حوزه وجود دارد. از این مسئله به‌خصوص در داخل کشور غفلت بیشتری شده است و پژوهش مستقلی به‌ویژه با رویکرد استفاده از کلان‌داده‌ها در صنعت 4.0 انجام نگرفته است. مواردِ گفته‌شده اهمیت و ضرورت مطالعه را آشکار می‌کند و این پژوهش می‌تواند درراستای این چالش‌ها مسیر را برای انجام پژوهش‌های آتی روشن‌تر کند. به‌‌بیانِ کلی، این پژوهش، بر استفاده از کلان‌داده‌ها با کمک یادگیری ماشین و هوش مصنوعی (AI) و تأثیر آنها بر تحقیقات بازار و بازاریابی تمرکز دارد.

بنابراین، پرسش‌های‌ اصلی این پژوهش عبارت‌اند از:

1)       ارزش‌های موردانتظار از دید گردشگران چه مواردی هستند (چه عواملی باعث رضایت مشتریان است)؟

2)       هر گروه ارزش‌، شامل چه مؤلفه‌هایی هستند؟

 

2. مبانی نظری پژوهش و پیشینۀ پژوهش

2-1- پیشینۀ نظری

2-1-1- ارزش

هر کسب‌وکار باتوجه‌به مدل کسب‌وکار خود به خلق و ارائۀ «ارزش» به مشتری می‌پردازد. درحقیقت، کسب‌وکار برای بقا و رشد باید بتواند مشتری را به پرداخت (پول) دربرابرِ دریافت آن «ارزش» متقاعد کند. در سال‌های اخیر مطالعۀ مفهوم «ارزش» به یکی از زمینه‌های موردعلاقۀ مدیران و پژوهشگران حوزۀ مدیریت تبدیل شده است. ازسوی دیگر، ظهور ابزارهای جدید ارتباط با مشتریان ازجمله شبکه‌های اجتماعی، چالش‌ها و درعین‌حال فرصت‌های جدیدی را درزمینۀ چگونگی معرفی و ارائۀ ارزش به ذی‌نفعان سازمان به وجود آورده است (لابرک[15]، 2014). مفهوم ارزش درزمینه‌های مختلف با تعاریف متفاوتی استفاده شده است. از دیدگاه مشتری، ارزش زمانی ایجاد می‌شود که مزایای به‌دست‌آمده از مصرف یک محصول یا خدمات از هزینه‌هایی که بابت آن متحمل شده است، بیشتر شوند (ژانگ و همکاران[16]، 2019). در این بازار پویا مشتری از سازمان یا کسب‌وکار انتظار دارد بیشترین ارزش‌ها را با مناسب‌ترین قیمت عرضه کند و سازمان‌ها نیز پیوسته به‌دنبالِ روش‌های جدید در خلق و ارائۀ «ارزش» هستند (لا و کاندامپولی[17]، 2004). همچنین کسب‌وکارها برای دست‌یابی به مزیت رقابتی باید رویکرد و تمرکز خود را از فروش کالا یا خدمات، به خلق ارزش برای مشتری تغییر دهند (کانز و اینگوالد[18]، 2016). با بررسی پژوهش‌های انجام‌شده می‌توان گفت مفهوم ارزش پیشنهادی به مشتری[19] (CVP) نقش مهمی در ارتباط با نحوۀ فراهم‌ساختن ارزش برای مشتری دارد؛ ولی این مفهوم همچنان به‌طورِ ضعیفی فهمیده می‌شود (پین و همکاران[20]، 2017).

2-1-2- انقلاب صنعتی چهارم

چهارمین انقلاب صنعتی با استفاده از دیجیتالیزه[21]شدن، فناوری اطلاعات و ارتباطات، یادگیری ماشین، رباتیک و هوش مصنوعی باعث افزابش قدرت تصمیم‌گیری و انتقال بیشتر این فرایند از انسان به ماشین‌ها خواهد شد و این تحولات تأثیر عمیقی بر تحقیقات بازاریابی و مدیریت فروش می‌گذارد (سیام و شارما[22]، 2018). مفهوم کسب‌وکار از چهار جنبه تحتِ‌تأثیر صنعت [23]4.0 قرار می‌گیرد: نخست، مشتری انتظار دریافت خدمات متفاوتی دارد؛ دوم، اضافه‌کردن قابلیت‌های دیجیتال به محصولات (کالاهای فیزیکی و خدمات) «ارزش» دریافت‌شدۀ مشتری را افزایش می‌دهد؛ سوم، نوآوری مشارکتی به بررسی تجربیات مشتری، خدمات مبتنی‌بر داده و امکانات مناسب نیاز دارد و چهارم، با فراهم‌شدن بسترهای جهانی برای مدل‌های تجاری جدیدْ استعداد، فرهنگ و شکل‌های جدید ساختار سازمان باید دوباره بررسی شود و در آن تجدید نظر شود (شواب[24]، 2015).

2-1-3. کلان‌داده‌ها

امروزه سازمان‌ها و کسب‌وکارها مقادیر عظیمی از داده‌ها را جمع‌آوری و ذخیره می‌کنند؛ به امید آنکه در آینده مفید واقع شوند؛ در این حالت، چالش‌هایی ازقبیلِ بارگذاری[25] داده‌ها و استخراج دانش مناسب به‌منظورِ پشتیبانی از فرایند تصمیم‌گیری مدیران به وجود آمده است (آمادو و همکاران[26]، 2018). اصطلاح «کلان‌داده‌ها» به مجموعۀ داده‌هایی اطلاق می‌شود که ازنظرِ سرعت، حجم و تنوع در سطح بالایی هستند و با تکنیک‌ها و ابزارهای سنتی پردازش نمی‌شوند (اِلجندی و الراگال[27]، 2014). درحالِ‌حاضر، کلان‌داده‌ها همه‌جا هستند؛ چه به‌شکلِ داده‌های ساخت‌یافته[28]، مانند پایگاه داده‌های سنتی سازمان (مثلاً سیستم مدیریت ارتباط با مشتری) یا داده‌های بدون ساختار[29] که فناوری‌های جدید ارتباطی و بسترهایی[30] هستند که کاربر می‌تواند آنها را توسعه دهد یا ویرایش کند (مثلاً متون، تصاویر و فیلم‌ها) (لنسلی و لونگلی[31]، 2016). دو منبع مهم داده‌های امروزیْ رسانه‌های اجتماعی و برنامه‌های کاربردی موبایل هستند که مطالعات نشان می‌دهد تأثیر زیادی بر تصمیمات مشتریان می‌گذارند‌ و به‌طورِ مستقیم بر «ساخت بِرند[32]» مؤثر هستند (مورو و همکاران[33]، 2016).

با استفاده از تحلیل کلان‌داده‌ها می‌توان فرایند تصمیم‌گیری را که یکی از مسائل و چالش‌های اصلی بازاریابان است، پشتیبانی و تسهیل کرد. این کار با ارائۀ بینش مناسب از بازار با پاسخ به سؤالات مهمی ازقبیلِ موارد زیر انجام می‌گیرد: مناسب‌ترین محصول برای یک بازار خاص چیست؟ چگونه در یک بازار برای چنین محصولی تبلیغ شود؟ ازطریقِ چه کانال‌های ارتباطی، در چه مقطع زمانی و با چه قیمتی؟ و کمپین بازاریابی با چه نوع اقدامات «پیش‌برد فروش» و تبلیغاتی پشتیبانی شود؟ باتوجه‌به این موارد، جای تعجب ندارد که حوزۀ بازاریابی از نخستین حوزه‌هایی باشد که کلان‌داده‌ها را آزمایش می‌کند و از آنها استفاده می‌کند (بندل و وانگ[34]، 2016).

2-1-4. یادگیری ماشین[35]

یادگیری ماشین در حوزۀ داده‌کاوی و به‌منظورِ ساخت مدل‌های پیش‌بینی و تجزیه‌و‌تحلیل کلان‌داده‌ها استفاده می‌شود. اصطلاح «یادگیری ماشین» را ابتدا آرتور لی ساموئل[36] (1995) یکی از پیشگامان درزمینۀ هوش مصنوعی ابداع کرد و منظور از این اصطلاح، استفاده از رایانه است برای واکنش دربرابرِ شرایط، بدون اینکه به‌طورِ صریح برای آن برنامه‌ریزی شده باشد. پژوهشگران هوش مصنوعی، یادگیری ماشین را بهترین و امیدوارکننده‌ترین رویکرد برای نزدیک‌شدن هوش مصنوعی به سطح هوش انسان عنوان کرده‌اند (سیام و شارما[37]، 2018). به‌بیانِ دیگر، یادگیری ماشینْ به تنظیم و اکتشاف شیوه‌ها و الگوریتم‌هایی می‌پردازد که براساسِ آنها رایانه‌ توانایی یادگیری پیدا می‌کند.

یادگیری ماشین به‌طورِ کلی به دو دستۀ اصلی «یادگیری با نظارت[38]» و« یادگیری بدون نظارت[39]» تقسیم می‌شود. مفهوم یادگیری نظارت‌شده یا «یادگیری آماری نظارت‌شده» به‌معنای ایجاد مدل آماری برای پیش‌بینی یا برآورد یک خروجی براساسِ یک یا چند ورودی است؛ درحالی‌که در «یادگیری بدون نظارت» ورودی وجود دارد؛ اما بر روی خروجی‌ نظارت وجود ندارد و ازپیشْ مشخص و محدودشده نیست (جیمز و همکاران[40]، 2013). در یادگیری با نظارت، برچسب داده‌های آموزشی معلوم است. یعنی می‌دانیم هر داده متعلق به چه کلاسی یا چه طبقه‌ای است. درحقیقت، برچسب داده‌ها نظارت را انجام می‌دهد؛ ولی در یادگیری بدون نظارت، برچسب داده‌ها معلوم نیست و این یعنی نظارتی بر داده‌ها وجود ندارد (راسچکا و میرجلالی[41]، 2019).

در مقایسه با روش‌های آماری سنتی، روش «یادگیری ماشین» در فرایند پیش‌بینی‌‌ْ عمکرد بهتری دارد؛ زیرا توانایی بیشتری برای به‌کارگیری روابط غیرخطی و پیچیده به‌منظورِ استخراج مقادیر متغیرهای خروجی براساسِ متغیرهای ورودی دارد؛ بااین‌حال، نقطه‌ضعف روش یادگیری ماشین، سختی بیشتر تقسیم نتایج به‌دست‌آمده نسبت به مدل‌های سنتی است (هاستی و همکاران[42]، 2017). یکی از زیرشاخه‌های یادگیری ماشین، «متن‌کاوی[43]» است که توسعه‌ای بر داده‌کاوی، با هدف استخراج الگوهای معنادار از اَسناد متنی است. متن‌کاوی صفحات شبکه‌های اجتماعی کمک می‌کند درک بهتری از مشتریان به دست آید. کسب‌وکارها از متن‌کاوی نظرات مشتریان برای پیش‌بینی روند فروش آینده، مدیریت ارتباط با مشتری، به‌دست‌آوردن دانش رقبا، عملکرد بِرند، تحلیل احساسات و نظرات مشتریان و تصمیم‌گیری‌های مهم و دانش‌محور استفاده می‌کنند (یی‌لیاوو و پی‌تان[44]، 2014).

2-2. پیشینۀ تجربی

درحالِ‌حاضر، بسیاری از کشورها بر توسعۀ صنعت گردشگری به‌عنوانِ یکی از مهم‌ترین صنایع مؤثر در رشد اقتصادی کشورها تأکید دارند. صنعت گردشگری، چشم‌اندازهای رشد اقتصادی در ایران را بهبود می‌بخشد و موجب افزایش سرانۀ تولید ناخالص داخلی می‌شود و همچنین توسعۀ صنایع مرتبط با گردشگری موجب شدت‌یافتن تأثیرگذاری مثبت توسعۀ گردشگری بر رشد اقتصادی کشور است (رضاقلی‌زاده، 1399). پژوهش رحیم‌نیا و همکاران (1392) دربارۀ ابعاد ویژۀ برند در صنعت هتل‌داری نشان می‌دهد‌ کیفیـت ادراک‌شـده، بُعد اصلی در ایجاد ارزش ویژة برند است و تأثیر زیادی بر سـایر اَبعـاد ارزش برنـد دارد و تعیین‌کننده‌ای‌‌ قوی در ارزش ویژة برند محسوب می‌شود‌. شفیعی و همکاران (1396) در پژوهش دیگری به بررسی تأثیر فناوری‌ اطلاعات بر توسعة صنعت گردشگری پرداخته‌اند. این پژوهش ضرورت استفاده از مدل‌های داده‌محور کسب‌وکار در این صنعت را که به‌دلیلِ تحولات ایجادشدۀ ناشی از توسعة فناوری اطلاعات است، بیان کرده و با استفاده از رویکرد تفسیرگرانه و روش فراترکیب به تجزیه‌وتحلیل داده‌ها پرداخته است. یافته‌های این پژوهش اَبعاد اقتصادی، اجتماعی و محیطی را برای توسعة گردشگری پایدار تعیین کرده است و شاخص‌های‌‌ هر بُعد، الزامات قانونی و تأثیرات فناوری اطلاعات برای آنها را استخراج کرده و علاوه‌بر این اهداف، توانایی‌ها و مؤلفه‌های موردنیاز برای پیاده‌سازی مقاصد گردشگری هوشمند را شناسایی کرده است. خلیل‌نژاد و همکاران (1398) در پژوهش خود، تأثیر تجربة برند هتل، در ارزش ادراک‌شدة میهمانان و قوّت برند هتل را بررسی کرده‌اند. یافته‌های این پژوهش‌‌ نشان می‌دهد‌‌‌ تجربة‌ برند‌ هتل‌ در‌‌ ارزش ادراک‌‌شدة مالی، ارزش‌ ادراک‌شدة‌ کارکردی و‌ ارزش‌ ادراک‌شدة اجتماعی‌ تأثیر‌ می‌گذارد‌‌؛ اما‌‌ این تجربه‌ بر‌ ارزش‌ ادراک‌شدة فردی‌ تأثیر‌ ندارد‌؛ بلکه‌ ارزش‌های‌‌ ادراک‌شدة مالی‌، کارکردی‌ و‌‌ اجتماعی هستند که‌‌ بر ارزش‌ ادراک‌شدة فردی‌ مؤثر‌ند و درنهایت‌، ارزش ادراک‌شدة فردی‌ در‌ قوّت‌‌ برند‌ هتل تأثیر‌‌ می‌گذارد‌‌. به‌دلیلِ نوظهوربودن نسبی حوزۀ استفاده از کلان‌داده‌ها در صنعت گردشگری، مطالعات محدودی در داخل کشور انجام گرفته است و رو به گسترش است. درزمینۀ تأثیر کاربرد کلان‌داده‌ها و یادگیری ماشین در فرایند بازاریابی، محمدیان و نائلی (1396) در پژوهشی به بررسی تحلیلی مفهوم کلان‌داده درحوزۀ بازاریابی نوین پرداخته‌اند. نتایج این پژوهش نشان می‌دهد شرکت‌ها و سازمان‌هایی که کلان‌داده‌ها را به‌چشمِ دارایی نگاه می‌کنند، در بازار رقابتی موفق‌تر عمل می‌کنند و می‌توانند با محوریت‌قراردادن مشتریان، میزان وفاداری آنها را افزایش دهند. همچنین این پژوهش به کمبود سرمایه‌گذاری و پژوهش‌های داخلی در این حوزه اشاره کرده است و شناخت و بهره‌مندی از این علم را جزء ملزومات نوین مدیریتی معرفی کرده‌ و به مدیران شرکت‌ها و سازمان‌ها پیشنهاد سرمایه‌گذاری در این حوزه به‌منظورِ بهره‌برداری از مزایای آن را داده‌ است. آقایی و اسماعیلی (1396) در پژوهشی دیگر، تأثیر استفاده از کلان‌داده‌ها در مدیریت بازاریابی و تجزیه وتحلیل رفتار مصرف‌کننده را بررسی کرده‌اند و همچنین با اشاره به گسترش نفوذ اینترنت اشیا[45]، به اهمیت و پیشرفت حوزۀ تجزیه‌وتحلیل کلان‌داده‌ها پرداخته‌اند. این پژوهش استفاده از کلان‌داده‌ها را روشی جدید و کارا برای شناخت بهتر مصرف‌کنندگان و تجزیه‌وتحلیل رفتار آنها معرفی کرده است. فقیه و اسدی (1397) در پژوهش خود با اشاره به افزایش روزاَفزون نقش کلان‌داده‌ها در بازاریابی، به بررسی مزایای کلان‌داده درحوزۀ بازاریابی پرداخته‌اند و توانایی‌های بالقوه استفاده از کلان‌داده‌ها برای کسب بینش لازم برای تصمیم‌گیری مدیران بازاریابی را یکی از مزایای راهبردی آن بیان کرده‌اند. نتایج بررسی‌های پژوهش نشان‌دهندۀ آن است که استفاده از کلان‌داده‌ها به شرط جمع‌آوری داده‌های صحیح و مرتبط و تحلیل درست آنها، تأثیر مستقیم و مثبتی در افزایش فروش و سودآوری دارد. مؤذن رضامحله (1397) در پژوهش خود تأثیر استفاده از مدیریت دانش و کلان‌داده‌ها را در مدیریت بازاریابی شرکت‌های بزرگ بررسی کرده است و با اشاره به تغییر شرایط کسب‌وکار و تحولات به‌وجودآمده در فرایند بازاریابی و فروش محصولات و اهمیت مدل بازاریابی یک شرکت برای پیروزی بر رقبا در بازار رقابتی، استفاده از کلان‌داده‌ها را راهکاری مناسب برای این کسب‌وکارها معرفی کرده است. نتایج این پژوهش نشان می‌دهد استفاده از کلان‌داده‌ها در مدیریت دانش باعث افزایش قدرت کسب‌‌وکار برای حفظ بقا و جلوگیری از حذف‌شدن آن توسط رقبای دیگر در شرایط بد اقتصادی می‌شود. امیرخانی و متقی (1397) در پژوهش دیگری به معرفی استفادۀ یادگیری ماشین از کلان‌داده‌ها برای طراحی مدل، جهت پیش‌بینی پرداخته‌اند و با رویکردی جدید در طراحی مدل یادگیری ماشین، میزان محصول تولیدشدۀ یک شرکت دارویی را پیش‌بینی کرده‌اند. نتایج این پژوهش نشان می‌دهد روش پیشنهادی آنها می‌تواند به پیش‌بینی تولید محصول با دقت مطلوب و درصد خطای بسیار پایین بپردازد؛ همچنین نتایج به‌دست‌آمده نشان می‌دهد استفاده از یادگیری ماشین می‌تواند مشکلات تجزیه وتحلیل داده‌های پیچیده و بزرگ را در سیستم‌های مدیریت تولید محصول حل کند. ناصر و همکاران (1397) در پژوهش دیگری به مطالعۀ رفتار مشتریان در رزرواسیون آنلاین با استفاده از تکنیک داده‌کاوی و مدل کانو پرداخته‌اند. در این پژوهش هتل‌های چهار و پنج‌ستارۀ شهر تهران به‌عنوانِ مطالعۀ موردی بررسی شده‌اند و الگویی‌ تلفیقی از مدل کانو و قوانین انجمنی برای طبقه‌بندی نیازهای مشتریان و تجزیه‌وتحلیل رفتار آنها ارائه شده است. نتایج پژوهش، نیازهای مشتریان را در سه دستۀ نیازهای اساسی‌، نیازهای‌ عملکردی و نیازهای مهیّج طبقه‌بندی کرده است. علاوه‌بر این، نتایج نشان‌ می‌دهد‌‌ داشتن‌ امکان رزرو آنلاین‌‌ در‌ وب‌سایت شرکت ارائه‌دهندۀ خدمات رزرو بلیط، برای مردان اهمیت بیشتری نسبت به زنان دارد. سلطانی زنوزی (1398) در پژوهش دیگری نقش کلان‌داده‌ها در بازاریابی و کسب‌وکار را بررسی کرده است و دسترسی به کلان‌داده‌ها را دارای اهمیت زیادی برای شناخت رفتار مشتری، برنامه‌ریزی کمپین‌های تبلیغاتی و تصمیم‌گیری دربارۀ آمیختۀ بازاریابی بیان کرده است. همچنین، به کاربردهای دیگر کلان‌داده‌ها مانند ایجاد تغییر در محصول و انتخاب کانال‌های توزیع، پیاده‌سازی راهبردهای بازاریابی الکترونیکی و تولید محتوا اشاره کرده است. یافته‌های پژوهش نشان‌دهندۀ آن است که استفاده از کلان‌داده‌ها فرایند بازاریابی و فروش را با بهینه‌سازی و شخصی‌سازی راهبردهای بازاریابی بهبود می‌بخشد و باعث افزایش رضایت و وفاداری مشتریان می‌شود و درنتیجه با ایجاد توازن میان محصولات یک سازمان با نیازهای مشتری هم برای کسب‌وکار و هم برای مشتریْ سود و ارزش بیشتری همراه خواهد داشت.

استفاده از قابلیت‌های بالقوۀ سیستم‌های اطلاعاتی، یکی از عوامل مهم موفقیت برای رقابت در صنعت میهمان‌نوازی[46] (گردشگری) است (اسپارک و همکاران[47]، 2016؛ راگیسو و همکاران[48]، 2017). همچنین به‌علتِ آنکه سرمایه‌گذاری در صنعت گردشگری مستلزم هزینه‌های زیادی است، بررسی و تجزیه‌وتحلیل ویژگی‌هایی که مسافران از خدمات دریافت‌شدۀ خود توصیف می‌کنند یا در ذهن خود مجسم و بازسازی می‌کنند و در نظرات آنلاین خود به اشتراک می‌گذارند، امری معقول و ضروری است (سانچز و همکاران، 2019). ظهور رسانه‌های اجتماعی، وب 2.0 و کانال‌های دیجیتال باعث به‌وجودآمدن توصیه‌ها، بررسی‌ها و بیان نظرات مشتریان به‌صورتِ آنلاین شده است و به همین دلیل، نفوذ بازاریابی دهان‌به‌دهان ([49]WoM) به‌طورِ روزاَفزونی گسترش یافته است و درنهایت به پیدایش بازاریابی دهان‌به‌دهان الکترونیکی (eWoM) انجامیده است. «بازاریابی دهان‌به‌دهان الکترونیکی» شکل جدید بازاریابی دهان‌به‌دهان است که ازطریقِ اینترنت، وسایل الکترونیکی و شبکه‌های اجتماعی انجام می‌شود (لئونگ و همکاران[50]، 2019). پژوهش چونگ و همکاران[51] (2018) به اهمیت نظرات و کامنت‌های بحث‌شده در اینترنت اشاره کرده است و نتایج این مطالعه نشان می‌دهد اغلب مسافران، نظرات مسافران قبلی را منبع اطلاعاتی برای تصمیم‌گیری در نظر می‌گیرند. همچنین، یافته‌های این پژوهش تأییدکنندۀ اهمیت و سودمندی تحلیل این داده‌ها در بازاریابی پیش‌بینانه است. گیل‌ستو و همکاران[52] (2019) در مطالعۀ خود با استفاده از بررسی نظرات آنلاین مشتریان‌ به تجزیه‌وتحلیل برداشت مشتریان (میهمانان) از شیوه‌های حفاظتِ هتل‌ها از محیط‌زیست پرداخته‌اند. نتایج پژوهش آنها نشان می‌دهد مشتریان اقداماتی را که هتل انجام داده است، در شش موردِ 1) انرژی، 2) آب، 3) خرید، 4) زباله، 5) سایت و آموزش و 6) نوآوری درک می‌کنند؛ ولی سطح تعهدات زیست‌محیطی هتل‌ها را تشخیص نمی‌دهند. پژوهش سانچز و همکاران (2019) با استفاده از یادگیری ماشین (روش یادگیری ماشین نظارت‌شده) به تحلیل نظرات مشتریان دربارۀ هتل پرداخته و راهکارهایی را برای افزایش سطح کیفیت سرویس‌دهی به میهمانان برای جلب رضایت آنها معرفی کرده است؛ بدین منظور، برای استخراج نظرات مشتریان 33 هتل از سایت یلپ[53] (یکی از شبکه‌های اجتماعی محبوب در ایالات متحده) استفاده شده است و درنهایت مدلی ارائه کرده که این مدل می‌تواند به مدیران هتل در افزایش سطح کیفیت سرویس‌دهی به مشتریان کمک کند.

3. روش‌شناسی پژوهش

پژوهش حاضر ازلحاظِ هدفْ کاربردی، ازنظرِ روش گردآوری داده‌ها توصیفی‌ـ‌پیمایشی و ازنظرِ اجرا کیفی‌ـ‌کمّی (آمیخته) و با رویکرد استقرایی است و برای تحلیل محتوای نظرات مشتریان، از روش‌ها و الگوریتم‌های تحلیل کلان‌داده‌های متنی استفاده شده است. داده‌های استفاده‌شده در این پژوهش، نظرات ثبت‌شدۀ مشتریان در بستر اینترنت (درزمینۀ هتل) است. مجموعۀ داده‌ها (دیتاسِت[54]) حاوی 8290 نظر (کامنت[55]) به زبان فارسی است‌. برای انجام فرایندهای‌ داده‌کاوی، متن‌کاوی و تحلیل کلان‌داده‌ها از نرم‌افزار رپیدماینر[56] و زبان برنامه‌نوسی پایتون[57] استفاده شده است‌. مراحل اجرایی پژوهش شامل سه مرحلۀ اصلی است که در زیر توضیح داده شده است.

3-1- پیش‌پردازش داده‌ها[58]

داده‌های ورودی در متن‌کاوی، اغلب اسناد متنی بدون ساختار است؛ به همین دلیل، ابتدا باید داده‌های ورودیْ پیش‌پردازش شوند. در این فرایند ابتدا متن به کلمات، نمادها و یا دیگر عناصر معنادار‌ که «نشانه[59]» نامیده می‌شوند، تقسیم می‌شوند (ویز و همکاران[60]، 2015). برای استخراج کلمات یک متن، ابتدا با حذف علائم نقطه‌گذاری و دیگر کاراکترهای غیرمتنی، داده‌ها تبدیل به سطری از کلمات می‌شوند. در شکل 1 «توزیع ابری کلمات[61]» نظرات گردشگران دربارۀ هتل بعد از انجام فرایند پیش‌پردازش داده‌ها نمایش داده شده است.

 

شکل 1. نمایش ابری کلمات نظرات در داده‌های متنی

3-2- خوشه‌بندی[62] داده‌ها

در گام بعدی برای استخراج مؤلفه‌های «ارزش» از میان حجم انبوه نظرات مشتریان، از روش «خوشه‌بندی» استفاده می‌شود. خوشه‌بندی، فرایندی است که در آن، داده‌ها به گروه‌هایی که اعضای آن مشابه یکدیگر باشند‌ تقسیم می‌شوند. یک خوشه مجموعه‌ای از اشیای شبیه یکدیگر است که با اشیای موجود در خوشه‌های دیگر غیرمشابه باشند (راسچکا و میرجلالی، 2019). در شکل 2 فرایند خوشه‌بندی داده‌ها نشان داده شده است.

 

شکل2. نمایش شماتیک خوشه‌بندی (جداسازی) موضوعات اسناد متنی

در متن‌کاوی هم، خوشه‌بندی تکنیکی است که برای گروه‌بندی اسناد مشابه (در یک موضوع) استفاده می‌شود. خوشه‌بندی متون زمانی نیاز می‌شود که حجم اسناد متنی بسیار زیاد باشد و امکان جداسازی آنها براساسِ موضوعی که هر گروه از اسناد به آن اشاره می‌کند برای انسان غیرممکن یا بسیار مشکل و زمان‌بر باشد. یکی از مقبول‌ترین روش‌ها، خوشه‌بندی داده‌ها به‌روشِ «k میانگین[63]» است که تشابه اسناد متنی و رابطۀ بین کلمات کلیدی را در نظر می‌گیرد (ویز و همکاران، 2015). در شکل 3 نحوۀ انجام خوشه‌بندی داده‌ها توسط رپیدماینر در این پژوهش نشان داده شده است.

 

شکل 3. خوشه‌بندی نظرات توسط رپیدماینر

 

 در این پژوهش برای تعیین تعداد خوشه‌ها و اعتبارسنجی خوشه‌بندی[64] از روش «شاخص دآن[65]» به‌دلیلِ کارایی بهتر نسبت به روش‌های دیگر در کلان‌داده‌ها استفاده شده است (کاسامبارا[66]، 2017). شاخص «دآن» با هدف تعیین مقدار فشردگی[67] (فاصلۀ اعضای درون خوشه با یکدیگر) و تفکیک‌پذیری[68] (فاصلۀ خوشه‌ها از همدیگر) ارائه شده است و با دو معیار «فاصله[69]» و «قطر[70]»، میزان فشردگی و تفکیک‌پذیری را محاسبه می‌کند. این معیار را رابطة 1 تعریف می‌کند‌ که در آن d(Ci , Cj) مقدار فاصله بین خوشۀ iو j است و diam(Cl) نمایندۀ قطر خوشۀ lاست (فائضی راد و پویا، 1395).

رابطۀ 1.

 

3-3- قوانین انجمنی[71]

قوانیــن انجمنــی، رویکـردی در داده‌کاوی است که برای کشف الگوهـای مکـرر، همبسـتگی‌ها، ارتباطـات و سـاختارهای علّـی در انـواع پایگاه‌هـای داده و برای تحلیـل و پیش‌بینـی رفتـار کاربـران بـه کار می‌رود (شالینی و لال[72]، 2016). ایـن قوانیـن بـا کشـف ارتباطـات بیـن مجموعـة داده‌هـا شـرایطی را نشـان می‌دهـد کـه در یـک مجموعـة داده به‌طــورِ مکــرر با هــم اتفــاق می‌افتنــد و حضــور برخــی اقلام (موجودیت‌ها) را بــراســاسِ ســایر اقلام (موجودیت‌ها) شــرح می‌دهنــد (انصاری و همکاران، 1398). هدف قوانین انجمنی در متن‌کاوی، کشف روابط میان کلمات و شناسایی قوانینی است که در متن، حضور یک مجموعه از کلمات وجود کلمات دیگر را ایجاب می‌کند.

در یـک پایـگاه داده اگر I = {I1, I2,…, Im} مجموعــه‌ای از اقــلام باشد و D مجموعــه‌ای از پایگاه داده‌های تراکنش‌هاست که هر تراکنش دارای یک شناسه و همچنین مجموعۀ اقلامی نظیر T I است. اگر A مجموعه‌ای از اقلام باشد، تراکنشی مانند T حاوی A است، اگر داشته باشیم: A T . یک قانون انجمنی به‌شکلِ AB بیان می‌شود که در آن  IA  ،  IB  ،  φA ،  φB  ، AB = φ (هان[73] و همکاران، 2011). یک قانون انجمنی‌ در‌ شکل‌‌ کلی خود‌‌ بیان‌‌ می‌کند‌‌ که اگر‌‌ رویداد‌ A واقع‌ شود‌، آن‌گاه رویداد‌ B نیز رخ‌‌ خواهد داد‌. از‌ نماد‌ AB برای نمایش‌ یک‌ قانون‌ انجمنی‌ استفاده‌‌ می‌شود‌‌؛ A را‌ مقدمۀ قانون و B را‌ نتیجۀ‌ قانون می‌نامند. مصدر تولید‌‌ قوانین انجمنی‌ هم‌زمانی‌هایی‌‌ هستند‌‌ که به‌اندازۀ‌ کافی‌ تکرار‌ شده‌ باشند که آنها را «مجموعۀ‌ اقلام‌ مکرر»‌ می‌نامند (ناصر و همکاران، 1397). هر قانون‌‌ AB شاخصی با‌‌ نام «پشتیبان» دارد‌‌ که‌ مشخص‌‌ می‌کند این‌‌ هم‌زمانی به چه‌‌ نسبتی تکرار‌ شده‌ است‌. ‌مقدار‌ پشتیبان‌ قانون‌ AB به‌کمکِ‌ رابطۀ‌ 2 محاسبه می‌شود. صورت‌ کسر برابر‌ با‌ تعداد‌ هم‌زمانی‌های‌‌ A و‌ B است و‌‌ مخرج‌ کسر‌ به تعداد‌ کل رخدادها‌‌ اشاره دارد‌.

رابطۀ 2.

Support (AB) = N(A&B) / N

پس‌ از‌ آنکه‌ قوانینی با‌ حداقلی‌ از‌ مقدار‌ پشتیبان‌ تولید‌ شدند‌، می‌توان احتمال‌ درست‌بودن‌ قوانین‌ را‌ نیز‌‌ محاسبه کرد‌. این‌‌ شاخص‌ که «مقدار اطمینان» نام‌ دارد،‌ مشخص‌‌ می‌کند در‌ چند‌‌ درصد‌ از‌ زمان‌هایی که‌ رویداد‌ A واقع شده‌ است،‌‌ رویداد B نیز رخ‌ داده‌ است‌. مقدار‌ اطمینان‌ قانون‌ AB به‌کمکِ‌ رابطۀ 3 محاسبه‌ ‌می‌شود‌‌ (لی[74] و همکاران، 2017).

رابطۀ 3.

Confidence (AB) = N(A&B) / N(A)

از مهم‌ترین و کاربردی‌ترین روش‌ها یا الگوریتم‌های استخراج قوانین انجمنی دو روش Apriori و [75]FP-Growth هستند. در این پژوهش پس از بررسی این دو روش و مقایسۀ کارایی و سرعت آنها، از روش FP-Growth برای استخراج قوانین انجمنی استفاده شد (اسماعیلی‌پور، 1395). در شکل شمارۀ 4 نحوۀ انجام فرایند استخراج قوانین انجمنی در این پژوهش توسط رپیدماینر نشان داده شده است.

 

شکل 4. استخراج قوانین انجمنی توسط رپیدماینر

 

4. یافته‌های پژوهش

یافته‌های حاصل از متن‌کاوی نظراتِ مشتریان دربارۀ صنعت گردشگری، درقالبِ دو بخشِ «خوشه‌بندی نظرات» و «استخراج قوانین انجمنی» ارائه می‌شود.

4-1. یافته‌های فرایند «خوشه‌بندی»

در این قسمت برای استخراج مؤلفه‌های ارزشِ موردانتظار مشتریان، نظرات جمع‌آوری‌شده با استفاده از الگوریتم “k-means” خوشه‌بندی می‌شوند و برای شناسایی موضوع یا ویژگی اشاره‌شده در هر خوشه، پرتکرارترین لغات در آن خوشه مشخص می‌شوند. نام‌گذاری هر خوشه باتوجه‌به رابطۀ منطقی بین کلمات موجود در هر دسته از موضوعات انجام می‌گیرد که بیشترین تکرار (ااحتمال) را داشته‌اند (گوو و همکاران[76]، 2017).

نتایج حاصل از خوشه‌بندی نظرات گردشگران به‌همراهِ هشت «کلمه» با بیشترین تکرار (احتمال) در هر خوشه برای شناخت موضوع یا ویژگی مدنظر مشتری در هر خوشه در جدول 1 آمده است. با اِعمال الگوریتم خوشه‌بندی بر روی نظرات گردشگران، 20 خوشۀ مهم شناسایی شد. با بررسی هر خوشه و کلماتی که تکرار زیاد در آن خوشه داشته‌اند، موضوع بحث در آن خوشه مشخص می‌شود. از 20 موضوع یا ویژگی شناسایی‌شده در این مجموعه پس از مرتب‌کردن، 11 موضوع اول به مؤلفه‌های مثبت ارزش و در ادامه 9 موضوع بعدی به مؤلفه‌های منفی ارزش از نگاه گردشگران اشاره دارد.

 

جدول 1. موضوعات استخراج‌شده از خوشه‌بندی نظرات و هشت کلمه با احتمال بالاتر در هر خوشه

موضوعات حاصل از خوشه‌بندی نظرات

«کلمات» با بیشترین تکرار (احتمال) در هر خوشه

خوشۀ 1:

نظرات دیگران دربارۀ هتل

نظرات

دوستان

سایت

هتل

وقتی

انتخاب

خوندم

ستاره

خوشۀ 2:

تمیزی و بهداشت کلی هتل

اتاق

هتل

سرویس

ولی

صبحانه

تمیز

بهداشتی

رستوران

خوشۀ 3:

برخورد پرسنل

هتل

تشکر

آقای

خانم

پرسنل

برخورد

مدیریت

خوب

خوشۀ 4:

نزدیکی به مراکز خرید و تفریح

هتل

پیاده

بازار

ساحل

مرکز

دقیقه

نزدیک

خرید

خوشۀ 5:

سرویس بهداشتی و حمام مناسب

حمام

سرویس

حوله

تمیز

صدای

بهداشتی

دستشویی

خوب

خوشۀ 6:

تمیزی اتاق (ملافه، رومیزی و...)

اتاق

خوب

تمیز

برای

تخت

سفید

ملافه

میز

خوشۀ 7:

زیبایی فضا و چیدمان داخلی

هتل

عالی

زیبا

اتاق

رستوران

فضای

بسیار

شیک

خوشۀ 8:

امکانات منطقه‌ای برای تفریح

پارک

رفتیم

تومان

رستوران

کشتی

برید

داره

کیش

خوشۀ 9:

کیفیت و تنوع صبحانه

پنیر

خوب

تخم

مربا

کره

صبحانه

عدسی

سوسیس

خوشۀ 10:

خدمات ترانسفر و تحویل اتاق

اتاق

ساعت

هتل

برای

تحویل

ترانسفر

شدیم

فرودگاه

خوشۀ 11:

امکانات جانبی

اتاق

تلفن

یخچال

چای

کافی

اینترنت

سرعت

قهوه

خوشۀ 12:

هزینۀ زیادِ تفریحات بیرون از هتل

تومان

پارک

قیمت

کشتی

رستوران

بلیط

کیش

گران

خوشۀ 13:

قطعی برق

اتاق

برق

اتاق‌ها

تاریکی

قطع

باسلام

منطقه

برق‌ها

خوشۀ 14:

تناسب‌نداشتن ستارۀ هتل با کیفیت آن

هتل

اتاق

ستاره

برخورد

کیفیت

سرویس

کثیف

اقامت

خوشۀ 15:

تأخیر در پرواز

ساعت

دیر

تومان

تأخیر

شدیم

فرودگاه

تحویل

موقع

خوشۀ 16:

وجود حشرات مزاحم در اتاق

ساس

آرامش

صبح

حشره

مزاحم

مهم‌تر

ازهمه

جوش

خوشۀ 17:

کیفیت پایین لوازم بهداشتی

حوله

کیفیت

صابون

مسواک

شامپو

بد

زنگ

نفر

خوشۀ 18:

ورود سروصدای مزاحم از بیرون

اتاق

صدای

طبقه

بیرون

بلند

پنجره

صدا

مزاحم

خوشۀ 19:

نظافت‌نشدن اتاق و...

اتاق

کثیف

سرویس

حمام

دستشویی

خراب

توالت

حوله

خوشۀ 20:

قیمت بالا

تومان

هزینه

آژانس

اتاق

پرواز

تور

پول

گران


4-2- یافته‌های فرایند «قوانین انجمنی»

هدف از شناسایی قوانین انجمنی، کشف روابط میان کلمات در مجموعۀ بزرگی از متون (نظرات مشتریان) است. در این روش، دانش پنهان از تحلیل کلمات یا عباراتی که مشتریان با یکدیگر و به‌وفور در نظرات خود به کار برده‌اند، استخراج می‌شود. در جدول 2 قوانین استخراج‌شده و دو شاخص سطح پشتیبان و سطح اطمینان آورده شده‌ است.

 

جدول 2. نتایج استخراج قوانین انجمنی و میزان دو شاخص سطح پشتیبان و سطح اطمینان

شماره

مقدمه (قانون)

نتیجه (قانون)

سطح اطمینان

مقدار پشتیبان

قانون

1

برخورد

اقامت، هتل

0.9650

0.3901

[برخورد] ® [هتلاقامت]

2

سرویس

اقامت، هتل

0.9679

0.2221

[سرویس] ® [هتلاقامت]

3

اتاق

اقامت، هتل

0.9686

0.5174

[اتاق] ® [هتلاقامت]

4

رستوران

اقامت، هتل

0.9689

0.3008

[رستوران] ® [هتلاقامت]

5

صبحانه

اقامت، هتل

0.9734

0.4023

[صبحانه] ® [هتلاقامت]

6

تمیز

اقامت، هتل

0.9746

0.2317

[تمیز] ® [هتلاقامت]

7

ستاره

اقامت، هتل

0.9847

0.2726

[ستاره] ® [هتلاقامت]

 


قوانین انجمنی به‌شکلِ «اگر ‌ آن‌گاه» تعریف می‌شوند. به‌عبارتِ دیگر، با استفاده از این روشْ روابط و وابستگی‌های پنهان در کلان‌داده‌ها آشکار می شود و کشف قوانین مهم و سودمند با ارائۀ اطلاعات مناسب، فرایند تصمیم‌گیری مدیران را تسهیل می‌کند.

 

5. بحث، نتیجه‌گیری و پیشنهادها‌

هر کسب‌وکاری براساسِ یک «مدل کسب‌وکار» به فعالیت می‌پردازد. درحقیقت، مدل کسب‌وکارْ بیان‌کنندۀ نحوۀ ایجاد «ارزش» و ارائۀ آن به مشتری است (مبینی‌دهکردی‌ و همکاران، 1393). یکی از مهم‌ترین مؤلفه‌های مدل کسب‌وکار، «ارزش پیشنهادی به مشتری» است که بیان‌گر کالا یا خدماتی است که شرکت تعهد می‌دهد به مشتریان تحویل دهد (غلامی و همکاران، 1398). هنگامی که کسب‌وکار، بخش جذابی از بازار را به‌عنوانِ بازار هدف انتخاب می‌کند، باید با انتخاب مؤلفه‌ها یا ویژگی‌های مناسب برای ارزش پیشنهادی خود به مشتری، محصولی ارائه کند که به بهترین وجه، نیاز مشتریان آن بخش را پوشش دهد (شیهان و برونی‌بوسیو[77]، 2015). به‌طورِ کلی می‌توان گفت شناخت و ارائۀ «ارزش» مناسب به مشتری یکی از چالش‌های مهم برای موفقیت و سودآوری هر کسب‌وکار است.

این پژوهش باتوجه‌به فرصت‌های به‌وجودآمده از پیامدهای انقلاب صنعتی چهارم که یکی از آنها دیجیتالیزه‌شدن محیط کسب‌وکار است، با استفاده از تحلیل کلان‌داده‌های شبکه‌های اجتماعی، چهارچوبی برای استخراج ویژگی‌ها یا مؤلفه‌های ارزش‌ برای ارائه به مشتری معرفی می‌کند تا براساسِ آن، کسب‌وکارها بتوانند در فضای رقابتی بازارْ ارزش پیشنهادی مناسب‌تری به مشتریان خود عرضه کنند. نتایج این پژوهش با استفاده از دو روش متفاوت از یادگیری ماشین (خوشه‌بندی نظرات و استخراج قوانین انجمنی) به اکتشاف ویژگی‌ها یا مؤلفه‌های ارزش متناسب با انتظار مشتریان (گردشگران)، با تحلیل نظرات آنها در این زمینه پرداخته است.

نتایج حاصل‌شده با استفاده از روش اول (خوشه‌بندی داده‌ها) نشان‌دهندۀ 20 مؤلفۀ (موضوع یا ویژگی) مهم در ارزش‌های درک‌شدۀ گردشگران است که شامل 11 مؤلفۀ مثبت ارزش و 9 مؤلفۀ منفی ارزش است. ویژگی‌ها یا مؤلفه‌های مثبت ارزش ادراک‌شدۀ گردشگران عبارت‌اند از: 1) نظرات دیگران دربارۀ هتل، 2) تمیزی و بهداشت کلی هتل، 3) برخورد خوب پرسنل هتل، 4) نزدیکی هتل به مراکز خرید و تفریح، 5) سرویس بهداشتی و حمام مناسب و تمیز، 6) تمیزی اتاق‌های‌‌ هتل (ملافه، حوله، رومیزی)، 7) زیبایی فضای هتل و چیدمان داخلی، 8) امکانات منطقه‌ای هتل برای تفریح، 9) کیفیت و تنوع صبحانه، 10) خدمات ترانسفر (جابه‌جایی) و تحویل اتاق و 11) امکانات جانبی مانند تلفن، یخچال، اینترنت پرسرعت و... .

ویژگی‌ها یا مؤلفه‌های منفی ارزش ادراک‌شدۀ گردشگران عبارت‌اند از: 1) هزینۀ بالای تفریحات بیرون از هتل، 2) قطعی برق اتاق‌ها، 3) تناسب‌نداشتن ستارۀ هتل با کیفیت آن، 4) تأخیر در پرواز، 5) وجود حشرات مزاحم در اتاق، 6) کیفیت پایین وسایل و لوازم بهداشت شخصی مانند حوله، شامپو و...، 7) ورود سروصداهای مزاحم از بیرون به داخل اتاق، 8) نظافت‌نشدن اتاق و... و 9) قیمت بالا و نامتناسب.

نتایج به‌دست‌آمده با استفاده از روش دوم (قوانین انجمنی) شامل 7 قانون مهم است که با استخراج دانش پنهان از روابط بین عبارات به‌کاربرده‌شده در نظرات گردشگران به دست آمده‌اند. یافته‌های این قسمت نشان می‌دهد 7 موضوع ازنظرِ مشتریان دربارۀ اقامت در یک هتل اهمیت بیشتری دارد که عبارت‌اند از: 1) برخورد پرسنل هتل، 2) نحوه و کیفیت سرویس‌دهی هتل به گردشگران، 3) کیفیت و شرایط اتاق‌های هتل، 4) کیفیت و شرایط رستوران هتل، 5) کیفیت و تنوع صبحانه، 6) تمیزی و بهداشت کلی هتل و 7) تعداد ستاره‌های هتل. نتایج استخراج قوانین انجمنی از میان نظرات گردشگران، برای ارائه‌دهندگان خدمات گردشگری و هتل‌داران این موقعیت را فراهم می‌کند که بتوانند از نظرات مشتریان خود استفاده کنند و رضایت گردشگران را بیشتر جلب کنند. ازسوی دیگر، مدیران با درک این قوانین، شناختی کلی از فضای کسب‌وکار‌‌ و شرایط موجود هتل‌ها از دید گردشگران به دست می‌آورند و می‌توانند از این دانش درراستای ایجاد مزیت رقابتی استفاده کنند. همچنین، با استفاده از این قوانینْ ویژگی و مزیت‌های مدنظر گردشگران شناسایی می‌شود و مدیران می‌توانند از آنها برای تدوین برنامه‌های راهبردی به‌منظورِ ارائۀ ارزش به مشتری استفاده کنند.

نتایج پژوهش دربارۀ «اهمیت کیفیت سرویس‌دهی به مشتریان» با پژوهش سانچز و همکاران (2019) تطابق دارد. نتایج پژوهش چونگ و همکاران (2018) نشان‌دهندۀ اهمیت نظرات بحث‌شده در اینترنت دربارۀ هتل است و بیان‌گر این مطلب است که اغلب مسافران، نظرات مسافران قبلی را به‌عنوانِ منبع اطلاعاتی برای تصمیم‌گیری در نظر می‌گیرند. نتایج پژوهش حاضر نیز این مطلب را تأیید می‌کند و یکی از عناصر مثبت به‌دست‌آمده در بخش خوشه‌بندی، بررسی نظرات مسافران قبلی دربارۀ هتل است. دربابِ اهمیت استفاده از نظرات گردشگران قبلی در فضای مجازی و استفاده از توانایی‌های بالقوۀ تحلیل داده‌ها در این زمینه باید گفت پژوهش‌های اسپارک و همکاران (2016) و راگسیو و همکاران (2017) و سانچز و همکاران (2019) با رویکرد پژوهش حاضر در یک راستا قرار دارند. پژوهش گیل‌ستو و همکاران (2019) نشان می‌دهد مشتریان درک کاملی از سطح تعهدات زیست‌محیطی هتل ندارند که این مورد در نتایج این پژوهش و تحلیل نظرات گردشگران ایرانی مشاهده نشد.

باتوجه‌به نتایج پژوهش، کارآفرینان حوزۀ گردشگری می‌توانند با استفاده از کلان‌داده‌ها اهمیت و میزان اعتبار ایده‌های جدید خود را بررسی کنند و در شناسایی و پیش‌بینی بازخورد احتمالی مشتریان از آن بهره گیرند. همچنین به کارآفرینان در حوزۀ گردشگری پیشنهاد می‌شود برای شناسایی نقاط ضعف موجود و ارائۀ خدمات جدید، از داده‌های شبکه‌های اجتماعی برای تأیید ایده‌ها، نگرش و تحلیل‌های خود استفاده کنند.

به مدیران کسب‌وکار در حوزۀ گردشگری پیشنهاد می‌شود درصورتی که توان و سرمایۀ لازم برای محقق‌کردن همۀ ارزش‌های موردانتظار گردشگران را ندارند، با بررسی نقاط قوت و ضعف خود، بر مهم‌ترین اَبعاد ارزشی‌ای که توانایی توسعۀ آن وجود دارد، تمرکز کنند و برای خود در آن زمینه مزیت رقابتی ایجاد کنند. به‌عبارتِ دیگر، گوشه‌ای از بازار گردشگری را با تمرکز بر آن به دست آورند. باتوجه‌به اینکه در این پژوهشْ صنعت گردشگری تجزیه‌وتحلیل شد، به پژوهشگران آینده پیشنهاد می‌شود در شاخه‌های دیگر کسب‌وکار، مفهوم «ارزش» را مطالعه کنند. همچنین، باتوجه‌به پیشرفت سریع فناوری اطلاعات درحوزۀ هوش مصنوعی، پیشنهاد می‌شود با تلفیق روش‌های کلاسیک تحلیل و پیش‌بینی رفتار مصرف‌کننده با روش‌های جدید علوم داده‌ها[78] مانند یادگیری ماشین و یادگیری عمیق[79]، از توانایی‌های بالقوۀ تحلیل کلان‌داده‌ها درزمینۀ تحقیقات بازار و دیگر شاخه‌های مرتبط با مدیریت کسب‌وکار بهره ببرند. دربارۀ محدودیت‌های پژوهش می‌توان به استفاده از روش غیرنظارتی برای خوشه‌بندی نظرات در روش‌ پژوهش اشاره کرد. روش خوشه‌بندی دارای مزایایی ازقبیل سرعت بالا و بی‌نیازی به مداخلۀ انسانی است؛ ولی همین مزیت ممکن است به کم‌شدن کیفیت نتایج منجر شود. برای حل این موضوع، به پژوهشگران پیشنهاد می‌شود ازطریقِ تلفیق دو روشِ بانظارت و بی‌نظارت به پردازش متن بپردازند و نتایج را مقایسه کنند. همچنین، محدودیت جامعۀ آماری به‌دلیلِ کمبود نسبی نظرات فارسی در اینترنتْ احتمال خطا در نمونه‌گیری را به وجود می‌آورد. برای حل این مشکل پیشنهاد می‌شود از نظرات خارجی هم‌زمان با نظرات داخلی به‌عنوانِ نمونۀ آماری استفاده شود و با مقایسۀ نتایج از سوگیری احتمالی نمونه پیش‌گیری شود. علاوه‌بر موارد ذکرشده، نبودِ منابع کافی و پژوهش‌های داخلی دربارۀ روش و پیشینۀ پژوهش، از عوامل محدودکنندۀ این پژوهش بوده‌اند.



[1]. Maar

[2]. Gupta et al.

[3]. Lee et al.

[4]. Klaus Schwab

[5]. Offline

[6]. Xu et al.

[7]. Sensor

[8]. User Generated Content (UGC)

[9]. Duan et al.

[10]. Social Media

[11]. Monologue

[12]. Dialogue

[13]. Halawani et al.

[14]. Sánchez et al.

[15]. Labrecque

[16]. Zhang et al.

[17]. La & Kandampully

[18]. Kans & Ingwald

[19]. Customer Value Proposition (CVP)

[20]. Payne et al.

[21]. Digitization

[22]. Syam & Sharma

[23]. Industry 4.0

[24]. Schwab

[25]. Upload

[26]. Amado et al.

[27]. Elgendy & Elragal

[28]. Structured Data

[29]. Unstructured Data

[30]. Platform

[31]. Lansley & Longley

[32]. Brand Building

[33]. Moro et al.

[34]. Bendle & Wang

[35]. Machine Learning

[36]. Arthur Lee Samuel

[37]. Syam & Sharma

[38]. Supervised Learning

[39]. Unsupervised Learning

[40]. James et al.

[41]. Raschka & Mirjalili

[42]. Hastie et al.

[43]. Text Mining

[44]. Yee Liau & Pei Tan

[45]. Internet of Things (IoT)

[46]. Hospitality

[47]. Sparks et al.

[48]. Raguseo et al.

[49]. Word of Mouth (WoM)

[50]. Leong et al.

[51]. Chong et al.

[52]. Gil-Soto et al.

[53]. Yelp

[54]. Dataset

[55]. Comment

[56]. RapidMiner

[57]. Python

[58]. Data Pre-Processing

[59]. Token

[60]. Weiss et al.

[61]. Word Cloud

[62]. Clustering

[63].k-means Clustering

[64]. Clustering Validation

[65]. Dunn Index

[66]. Kassambara

[67]. Compactness

[68]. Separation

[69]. Cluster Distance

[70]. Diameter

[71]. Association Rule

[72]. Shalini & Lal

[73]. Han

[74]. Lee

[75]. Frequent Pattern Growth Algorithm (FP-Growth)

[76]. Guo et al.

[77]. Sheehan & Bruni-Bossio

[78]. Data Science

[79]. Deep learning

  1. اسماعیلی‌پور، مهدی (1395)، آموزش گام‌به‌گام داده‌کاوی با رپیدماینر، تهران: آتی‌نگر.
  2. آقایی، سپیده و اسماعیلی، سبحان (1396)، تأثیر فناوری کلان‌داده در سیستم‌های بازاریابی و تجزیه وتحلیل رفتار مصرف‌کننده، سومین کنفرانس بین‌المللی مدیریت و مهندسی صنایع، تهران، ایران.
  3. امیرخانی، امیرحسین و متقی، وحید (1397). ارائۀ سیستم پیش‌بینی تولید محصول بر روی کلان‌داده با استفاده از یادگیری ماشین، کنفرانس ملی تحقیقات نوین در مهندسی کامپیوتر برق فناوری اطلاعات، مبارکه، اصفهان، ایران.
  4. انصاری، نسیم؛ وکیلی مفرد، حسین؛ منصوری‌زاده، محرم و امیری، محمدرضا (1398)، کشف الگوی دسترسی کاربران و تحلیل تراکنش‌های امانت منابع اطلاعاتی با استفاده از تکنیک قوانین انجمنی در داده‌کاوی (مطالعۀ موردی: کتابخانه‌ها و مراکز اطلاع‌رسانی دانشگاه علوم پزشکی همدان). پژوهشنامۀ پردازش و مدیریت اطلاعات، ۳۴(۳)، 1155-1186.
  5. خلیل‌نژاد، شهرام؛ سلیمان‌زاده، امید و کراقلی، مرضیه (1398)، تأثیر تجربۀ برند هتل بر ارزش ادراک‌شدۀ گردشگران و قوّت برند هتل، گردشگری و توسعه، 8(1)، 102-119.
  6. رحیم‌نیا، فریبرز؛ فاطمی، زهرا و هرندی، عطااله (1392)، بررسی آثار متقابل ابعاد ارزش ویژة برند مبتنی‌بر مشتری (مورد مطالعه: هتل‌های پنج‌ستارة کلان‌شهر مشهد)، مدیریت بازرگانی، 5(4)، 1-20.
  7. رضاقلی زاده، مهدیه (1399)، نقش حمل ونقل هوایی، هتل‌ها و رستوران‌ها در رابطۀ بین گردشگری و رشد اقتصادی، برنامه‌ریزی و توسعۀ گردشگری، 9(32)، 89-106.
  8. سلطانی زنوزی، سیدمحمد (1398)، بررسی نقش کلان‌داده‌ها در بازاریابی و کسب‌وکار، دومین کنفرانس ملی اندیشههای نوین در مدیریت کسب‌وکار، تهران، ایران.
  9. شفیعی، ساناز؛ رجب‌زاده قطرمی، علی؛ حسن‌زاده، علیرضا و جهانیان، سعید (1396)، بررسی تأثیر فناوری‌ اطلاعات بر توسعة پایدار مقاصد گردشگری به‌منظورِ‌ توسعة مقاصد گردشگری هوشمند (با استفاده از رویکرد فراترکیب)، تحقیقات بازاریابی نوین، 7(4)، 95-116.
  10. صنایعی، علی (1396)، انقلاب صنعتی چهارم، اصفهان: جهاد دانشگاهی دانشگاه اصفهان.
  11. غلامی، ناصر؛ آقایی، نجف؛ محمدکاظمی، رضا و صفاری، مرجان (1398)، ارزش پیشنهادی به مشتری در مدل کسب‌وکارهای‌‌ ورزشی، مطالعات مدیریت ورزشی، 11(53)، 83-98.
  12. فائضی راد، محمدعلی و پویا، علیرضا (1395)، خوشه‌بندی فروشگاه‌های آنلاین از نگاه تأمین‌کننده با کمک بهینه‌یابی تعداد خوشه‌ها در الگوریتم دومرحله‌ای SOM، مطالعات مدیریت صنعتی، 14(43)، 109-134.
  13. فقیه، شقایق و اسدی، سعید (1397)، بررسی مزایای کلانداده درحوزۀ بازاریابی، سومین کنفرانس ملی فناوری در مهندسی برق و کامپیوتر، سمنان، ایران.
  14. مبینی‌دهکردی‌، علی؛ رضوانی، مهران؛ داوری، علی؛ فروزان، فاطمه. (1393)، مدل کسب‌وکار نوآورانة B2C برای شرکت‌های‌ پخش، فصلنامۀ توسعۀ کارآفرینی، 7(3)، 569-588.
  15. محمدیان، محمود و نائلی، مریم (1396)، بررسی تحلیلی مفهوم کلانداده درحوزۀ بازاریابی نوین، کنفرانس بینالمللی پژوهشهای نوین در مدیریت، اقتصاد و توانمندی صنعت جهانگردی در توسعه، مشهد، ایران.
  16. موذن رضامحله، محمدحسین (1397)، بازاریابی مؤثر شرکتهای تجاری بزرگ با استفاده از مدیریت دانش و کلاندادهها از شبکههای اجتماعی، دومین کنفرانس ملی نقش مدیریت در چشمانداز 1404، رشت، ایران.
  17. ناصر صدرآبادی، علیرضا؛ الماسی سروستانی، راضیه و قبادی، الهام (1397)، مطالعۀ رفتار مشتریان در رزرواسیون آنلاین با استفاده از تکنیک داده‌کاوی و مدل کانو (مورد مطالعه: هتل‌های چهار و پنج‌ستارۀ شهر تهران)، مطالعات مدیریت گردشگری، 13(44)، 192-217.
    1. Amado, A., Cortez, P., Rita, P., & Moro, S. (2018), Research trends on Big Data in marketing: A text mining and topic modeling based literature analysis, European Research on Management and Business Economics24(1), 1-7.
    2. Bendle, N. T., & Wang, X. S. (2016), Uncovering the message from the mess of big data. Business Horizons59(1), 115-124.
    3. Chong, A. Y. L., Khong, K. W., Ma, T., McCabe, S., & Wang, Y. (2018), Analyzing key influences of tourists’ acceptance of online reviews in travel decisions. Internet Research, 28(3), 564-585
    4. Duan, W., Cao, Q., Yu, Y., & Levy, S. (2013), Mining online user-generated content: using sentiment analysis technique to study hotel service quality. In 2013 46th Hawaii International Conference on System Sciences (pp. 3119-3128). IEEE.
    5. Elgendy N., Elragal A. (2014), Big data analytics: A literature review paper. In: Perner P. (eds) Advances in Data Mining. Applications and Theoretical Aspects. ICDM 2014, Lecture Notes in Computer Science, vol 8557. Springer, Cham.
    6. Gil-Soto, E., Armas-Cruz, Y., Morini-Marrero, S., & Ramos-Henríquez, J. M. (2019), Hotel guests’ perceptions of environmental friendly practices in social media, International Journal of Hospitality Management78, 59-67.
    7. Guo, Y., Barnes, S. J., & Jia, Q. (2017), Mining meaning from online ratings and reviews: Tourist satisfaction analysis using latent dirichlet allocation, Tourism Management59, 467-483.
    8. Gupta, S., Keen, M., Shah, A., Verdier, G., & Walutowy, M. F. (Eds.). (2017), Digital revolutions in public finance, Washington, DC: International Monetary Fund.
    9. Halawani, F. M., Soh, P. C., & Muthaiyah, S. (2019), The effect of social media on hotels' business performance in the Lebanese hotel sector: Effect of social media on hotels' business performance, Journal of Electronic Commerce in Organizations (JECO)17(3), 54-70.
    10. Han, J., Pei, J., & Kamber, M. (2011), Data mining: concepts and techniques, Elsevier.
    11. Hastie, T., Tibshirani, R., & Friedman, J. (2017), The elements of statistical learning: data mining, inference, and prediction, Springer Science & Business Media.
    12. James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017), An introduction to statistical learning, New York: springer.
    13. Kans, M., & Ingwald, A. (2016), Business model development towards service management 4.0, Procedia CIRP47, 489-494.
    14. Kassambara, A. (2017), Practical guide to cluster analysis in R: Unsupervised machine learning (Vol. 1), STHDA.
    15. La, K. V., & Kandampully, J. (2004), Market oriented learning and customer value enhancement through service recovery management, Managing Service Quality: An International Journal14(5), 390-401.
    16. Labrecque, L. I. (2014), Fostering consumer–brand relationships in social media environments: The role of parasocial interaction, Journal of Interactive Marketing28(2), 134-148.
    17. Lansley, G., & Longley, P. (2016), Deriving age and gender from forenames for consumer analytics, Journal of Retailing and Consumer Services30, 271-278.
    18. Lee, E. B., Kim, J., & Lee, S. G. (2017), Predicting customer churn in mobile industry using data mining technology, Industrial Management & Data Systems.117(1), 90-109.
    19. Lee, J., Kao, H. A., & Yang, S. (2014), Service innovation and smart analytics for industry 4.0 and big data environment, Procedia Cirp16(1), 3-8.
    20. Leong, L. Y., Hew, T. S., Ooi, K. B., & Lin, B. (2019), Do electronic word-of-mouth and elaboration likelihood model influence hotel booking? Journal of Computer Information Systems59(2), 146-160.
    21. Marr, B. (2016), Why everyone must get ready for the 4th industrial revolution, https:// www.forbes.com/sites/bernardmarr/2016/04/05/why-everyone-must-get-readyfor-4th-industrial-revolution/#26be9e2f3f90.
    22. Moro, S., Rita, P., & Vala, B. (2016), Predicting social media performance metrics and evaluation of the impact on brand building: A data mining approach, Journal of Business Research69(9), 3341-3351.
    23. Payne, A., Frow, P., & Eggert, A. (2017), The customer value proposition: Evolution, development, and application in marketing, Journal of the Academy of Marketing Science, 45(4), 467-489.
    24. Raguseo, E., Neirotti, P., & Paolucci, E. (2017), How small hotels can drive value their way in infomediation, The case of ‘Italian hotels vs. OTAs and Trip Advisor’, Information & Management54(6), 745-756.
    25. Raschka, S., & Mirjalili, V. (2019), Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow 2. Packt Publishing Ltd.
    26. Sánchez-Franco, M. J., Navarro-García, A., & Rondán-Cataluña, F. J. (2019), A naive Bayes strategy for classifying customer satisfaction: A study based on online reviews of hospitality services, Journal of Business Research101, 499-506.
    27. Schwab, K. (2015), The Fourth Industrial Revolution, What It Means and How to Respond?  SNAPSHOT, December 12.
    28. Shalini, S., & Lal, K. (2016, April), Improved pseudo-association rules technique, In 2016 International Conference on Computing, Communication and Automation (ICCCA) (pp. 890-895), IEEE.
    29. Sheehan, N. T., & Bruni-Bossio, V. (2015), Strategic value curve analysis: Diagnosing and improving customer value propositions, Business Horizons, 58(3), 317-24.
    30. Sparks, B. A., So, K. K. F., & Bradley, G. L. (2016), Responding to negative online reviews: The effects of hotel responses on customer inferences of trust and concern, Tourism Management53, 74-85.
    31. Syam, N., & Sharma, A. (2018), Waiting for a sales renaissance in the fourth industrial revolution: Machine learning and artificial intelligence in sales research and practice, Industrial Marketing Management69, 135-146.
    32. Weiss, S. M., Indurkhya, N., & Zhang, T. (2015), Fundamentals of predictive text mining, Springer.
    33. Xu, M., David, J. M., & Kim, S. H. (2018), The fourth industrial revolution: opportunities and challenges, International Journal of Financial Research9(2), 90-95.
    34. Yee Liau, B., & Pei Tan, P. (2014), Gaining customer knowledge in low cost airlines through text mining, Industrial Management & Data Systems114(9), 1344-1359.
    35. Zhang, T. C., Gu, H., & Jahromi, M. F. (2019), What makes the sharing economy successful? An empirical examination of competitive customer value propositions, Computers in Human Behavior95, 275-283.