慧科-香港科技大學旅遊指數.pdf

本白皮書介紹了由慧科訊業輿香港科技大學商學院合作研究的香港旅遊業項目,即基於社交媒體大數據及線下旅遊業統計數據而計算得出的實時預測性指數,慧科-香港科技大學旅游指數(簡稱:慧科-港科大旅游指數)。

香港旅遊業是香港四大支柱產業之一。然而,受到2019年社會運動和2020年新冠疫情的影響,香港的旅遊業遭受了前所未有的考驗,2023年2月香港輿内地通關,旅客往來香港内地無需入境隔離,香港政府也推出一系列鼓勵游客到訪香港的措施,香港旅游業迎來新的轉機,在此之際,分析能夠影響未来香港旅遊業的因素,不管是對香港政府還是旅遊商業,都十分重要。做為香港旅遊業的主要市場,在2019年,中國内地的旅客佔全部訪港旅客的78.29%。此次項目也以中國内地旅客為研究對象。

本項目旨在通過構建一系列慧科-港科大旅游指數來對未来香港旅遊業進行預測。不同於以往旅遊業學術論文使用旅客問卷或專家小組的方式進行研究,我們首次使用了大數據建模的方式,利用来自慧科社交媒體大數據及線下旅遊業統計數據來構建預測模型。

通過對大量以往旅遊業相關學術論文的研究,业結合香港旅遊業的本地特點,我們定位了6大旅遊因素,分別為到訪方法,設施,景點,娱樂活動,當地社群和附带因素。在慧科全景智能大數據平台上,我們可以獲取内地旅客經常使用的社交媒體數據,包括新浪微博數據,線上旅行機構數據,旅行相關論壇數據和其他熱門社交媒體的數據,如百度貼吧,馬蜂窩,小紅書,抖音等。這些媒體的數據總量超過1000萬條/天。為囊括不同的時期和各類重要事件,我們選擇了2018年1月至2023年3月做為此次研究的時間範圍。通過對這五年多的數據進行分析研究和比較,我們對香港旅遊業經歷的變化獲得了一個系統的認知,也計算出了全面且穩定的一系列預測性慧科-港科大旅游指數。

經過初步的數據清洗和分析後,我們將上述6大因素進一步細分為11個模型自變量,分别為到訪方法-交通,到訪方法-簽證,設施,景點,當地社群-正面,當地社群-負面,娱樂活動-購物,娱樂活動-運動,娱樂活動-文娱,娱樂活動-展覧,以及附带因素。同時,我們選擇了9個可能影響香港旅遊業的外因變量分别為公眾假期,學生寒暑假期,港幣人民幣匯率,香港社會運動-實際發生,香港社會運動-内地媒體大量報導,香港内地通關政策,月份,氣温,以及環境-空氣質量。我們将對香港酒店入住率、香港訪港旅客人數和香港酒店平均價格分別進行分析預測。

本項目利用慧科自主研發的自然語言處理技術和机器学习模型,将以上數據進行處理和量化,最終採用随機森林回歸預測模型。同時,我們研究了對不同時間點的未來數據進行預測的效果,得到兼顧預測性和實時更新性的一系列慧科-港科大旅游指數,最終預測結果的誤差率可低至4%。

通過本項目的成果,香港政府及旅遊業界將獲得對未来香港旅遊業相關數字和趨势的精準預測,調整落實緊跟時事的旅遊業相關政策,及時更新商業決策及計劃。

旅遊業是香港的核心産業之一,其中来自中國内地的遊客更是佔全部訪港旅客的絕大多數;2019年,從中國内地入境香港的旅客人數達到了總旅客人數的

78.29%。

受到疫情封關的影響,相比於2019年,2020年的訪港旅客人數驟减99.8%,香港旅遊業遭受嚴重打撃,許多服務於旅遊業的香港人失業。2023年2月香港與内地通關,游客往来相關和内地無需隔離,政府亦推出一系列吸引游客的措施,在此情况下,能準確的定位和分析影響香港旅遊業的因素顯得尤為重要。

分析和預測離不開數據的支持,社交媒體平台是内地訪港旅客最常用的分享和交流旅行信息的平台,而慧科擁有豐富的社交媒體數據源和成熟的自然語言處理及數據分析技術。在此項目中,我們意在根據社交媒體大數據来構建一個具備預測能力業能實時更新的旅行熱度指標,為香港政府和旅遊商業洞悉重要信息幫助決策。

1.2研究目標:慧科-港科大旅游指數

慧科-港科大旅游指數是一個直觀便捷,業具備實時月度更新性質的預測性指標。慧科-港科大旅游指數擁有完整的理論框架支持,囊括超過20種旅行相關的影響因素(如交通,景點等),依靠用户原創内容作為大數據支持,能夠為我們的客户提供凖確的預測,幫助客户獲得及分析未来的旅行相關數字和趨势(如下個月的旅客到訪人數等)。

慧科-港科大旅游指數的主要受眾為政府和酒店等旅遊相關商業。對於政府,慧科-港科大旅游指數的預測能力能夠協助其調整未来的旅遊業相關政策業落實到相關部門(如入境處等)。對於旅遊相關商業,慧科-港科大旅游指數的實時更新性能夠緊跟時事,季節,及假期的變化,為客户提供第一手的預測性商業信息,讓其能夠根據預測更新或提前安排商業計劃。

1.3研究團隊

本項目由慧科Al部门(Wisers Al)與香港科技大學商業及社會資訊分析研究中心合作完成。

Wisers Al,前身為Wisers Al Lab(慧科Al實驗室)2014年7月成立於香港,專注於以人工智能技術解決中文全媒體資訊自動化分析輿大數據情報挖掘。目前擁有20餘位畢業於歐美及中港臺知名院校的Al及計算語言學專家。所有成員均擁有碩士以上學位,其中35%的成員擁有博士學位。Wisers Al依托慧科20多年积累的全球数一数二且不断增长的中文全媒体信息数据库及语义资源,以人工智能与大数据技术为驱动,专注研发面向实际应用的开放领域多元化数据Al

分析技术,实现从跨媒体的海量数据流中及时发掘与识别对客户最重要、最有价值、及最相关的资讯情报。自主研發的全面涵蓋自動化媒體情報處理輿挖掘的自然語言處理及人工智能技術包括:命名實體識别、情感分析、話题分類、文章聚類、圖像識別等,擁有10多項國際發明專利及奬項。

香港科技大學商業及社會資訊分析研究中心(CBSA)應用最先進的統計、計量經濟學、機器學習和人工智能工具於分析新興的大數據趨势以産生商業和社會洞察力,业作為協作大學學者、商業組織、非政府組織和智庫的研究人員之間的平台,為專業和普通受眾分析商業和社會歷史,案例及問題。具體來説中心將收集和分析来自傳統媒體、文獻、及社交網絡的用户生成數據,適時進行行業調查和民意調查及分析以提供創新的商業和社會見解。這些見解和建議將有助於香港和大中華地區的經濟和社會發展。

2.項目方法論

2.1數據理解和採集

在預測旅遊業數據的研究视,最基本也是最重要的步驟之一為定位和分析能夠影響未来旅遊業數據的關键因素。在此次項目中,慧科團隊對大量過往相關文献進行了研究,业註意到,在過去的旅遊産業相關學術報告中,儘管不同研究所提出的能夠影響旅遊業的因素不盡相同,但最為關鍵的幾個因素基本一致。2017年Reitsamer等人以旅客問卷方式進行研究,將到訪方法,設施,景點,娱樂舆當地社群作為關鍵因素進行分析。在Lee等人於2010年的研究中,以專家小組分析的方式,將到訪方法,設施,景點和輔助服務作為關鍵旅遊因素。同様以專家小組分析進行研究的,Deng等人在2002年的研究中,將交通,便利設施,景點,當地社群和周邊景點定位為能夠影響旅遊業的關鍵因素。值得注意的是,在1998年Kim以旅客調查採訪的方式進行的研究中,除去上述因素外,還將環境潔淨程度,季節性景觀等因素加入研究;同時將設施,娱樂等因素進一步細化為休聞設施品質,家庭型旅行設施及其安全性等细分因素。而在最早的1974年Gearing等人的專家小組研究中,則是以較為概括的概念,分析了食物,自然,社會,歷史,及購物五大因素。

綜上我們可以看到,儘管在過往的學術研究中,時間和空間的跨度很大,但這些研究提出的能夠影響旅遊業的因素大體類似。在此次項目研究中,我們總結了各文獻中通用的旅遊業因素,業結合了香港本地特點,定位了六個能夠對香港旅遊業起到重大影響的關鍵因素,分別為到訪方法,設施,景點,娱樂活動,當地社群,和附带因素。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)