本文摘要:[摘要]基于手機信令數(shù)據(jù)識別景區(qū)游客,精準(zhǔn)分析游客的出行行為特性,是景區(qū)實施客流預(yù)警和管控方案,提升客流體驗的前提條件。基于手機信令數(shù)據(jù)的特性分析,考慮景區(qū)邊界與基站服務(wù)范圍的空間重疊關(guān)系以及景區(qū)出入口的特殊性,將基站分為三類,提出景區(qū)研究
[摘要]基于手機信令數(shù)據(jù)識別景區(qū)游客,精準(zhǔn)分析游客的出行行為特性,是景區(qū)實施客流預(yù)警和管控方案,提升客流體驗的前提條件;谑謾C信令數(shù)據(jù)的特性分析,考慮景區(qū)邊界與基站服務(wù)范圍的空間重疊關(guān)系以及景區(qū)出入口的特殊性,將基站分為三類,提出景區(qū)研究范圍確定方法;將用戶分為居民、工作人員、路人及游客四類,構(gòu)建基于出行鏈的游客識別模型,分析不同類型用戶的出行特征,并以頤和園景區(qū)為例開展實證。研究結(jié)果顯示,采用基于出行鏈的游客識別方法識別頤和園景區(qū)游客103966人次,識別精度為97.56%,高于基于停留時間的客流識別方法。研究可為精準(zhǔn)識別景區(qū)游客,實時預(yù)測游客流量,制定并實施客流調(diào)控方案提供重要的理論基礎(chǔ)。
[關(guān)鍵詞]交通工程;游客識別模型;手機信令數(shù)據(jù);出行鏈;停留時間
前言在節(jié)假日等旅游高峰期,部分熱門景區(qū)(點)大量游客聚集而形成區(qū)域擁堵,對游客體驗、安全和景區(qū)管理產(chǎn)生較大影響,急需精準(zhǔn)識別景區(qū)內(nèi)不同區(qū)域或景點的游客,實時預(yù)測預(yù)警游客流量,實施分流和限流[1-3]等客流調(diào)控方案。游客客流采集數(shù)據(jù)有視頻數(shù)據(jù)、閘機刷卡數(shù)據(jù)、RIDF數(shù)據(jù)、人工統(tǒng)計數(shù)據(jù)等,多為景區(qū)整體客流數(shù)據(jù),無法準(zhǔn)確獲取景區(qū)某些局部區(qū)域或者某熱門景點的客流量,數(shù)據(jù)實時性較差,無法滿足實時客流預(yù)測預(yù)警的要求[4]。
手機信令數(shù)據(jù)具有覆蓋面全、實時性高等優(yōu)勢[5-6],被廣泛用于游客的識別與出行特性分析。手機信令數(shù)據(jù)是由手機終端和手機基站間聯(lián)系時生成的數(shù)據(jù),景區(qū)的邊界與基站服務(wù)邊界通常不完全重合,服務(wù)于景區(qū)及其周邊的基站用戶包含游客和非游客,不少學(xué)者開展了基于手機信令數(shù)據(jù)的游客識別方法研究,提出用停留時間等指標(biāo)差異進行用戶分類。
楊東[7]和LI[8]將景區(qū)基站服務(wù)用戶分為游客與非游客兩類,前者以8小時為長白山景區(qū)內(nèi)游客平均停留時間閾值,后者以8-18點內(nèi)的停留時間在0.5至5小時內(nèi)為閾值,區(qū)分游客與非游客。龍奮杰[9]將用戶分為園區(qū)工作者、路人及游客3類,假設(shè)在景區(qū)基站停留時間不超過0.5小時的用戶為路人;一周內(nèi)出現(xiàn)5天以上且每天停留時間超過5小時的用戶為園區(qū)工作者,其余為游客,校驗結(jié)果顯示精度達到80%左右。
Zhai[10]先將至少2次經(jīng)過出入口基站的用戶篩選為潛在游客,再根據(jù)用戶停留時間(1至6小時)和連接景區(qū)基站的時間占比(超過90%)兩個指標(biāo)識別游客。方家[11]和陳圣威[12]將用戶分為路人、居民、工作人員以及游客4類,方家假定0至5點手機為關(guān)機狀態(tài)的用戶為居民。陳圣威根據(jù)用戶多日凌晨、工作時間內(nèi)在研究區(qū)域的停留時長,識別用戶的工作地與居住地,篩選并剔除在景區(qū)周邊居住或工作的用戶,根據(jù)景區(qū)面積設(shè)置停留時間的閾值為1至3小時,識別游客,精度達到75%左右。
已有研究多用單一指標(biāo)景點停留時間進行用戶分類,問題在于不同類型用戶在不同景點的停留時間的閾值不同,且當(dāng)用戶分為路人、居民、工作人員以及游客4類時,短時游覽的游客與路人特性、長時間游覽的游客與工作人員的停留時間接近,導(dǎo)致游客的識別精度為60%-80%[9,12]。為解決上述問題,論文提出基于手機信令數(shù)據(jù)提取出行者的出行鏈,分析游客與非游客(工作人員、路人)一日、多日或者更長時間內(nèi)(工作日、假日)的出行鏈時空特性差異,修正現(xiàn)有游客識別方法,以提高識別精度,為不同景區(qū)游客停留時間閾值和后續(xù)景區(qū)局部客流預(yù)測預(yù)警提供數(shù)據(jù)支持。
1手機信令數(shù)據(jù)特點及應(yīng)用
手機信令數(shù)據(jù)是由手機終端和手機基站間聯(lián)系時生成的數(shù)據(jù)。當(dāng)用戶在某個基站內(nèi)進行通話、短信、開關(guān)機等事件時,事件會被該基站記錄,并生成一條數(shù)據(jù)。當(dāng)用戶進行基站間移動時,會自動切換連接的基站,同時生成一條數(shù)據(jù)。因此用戶接打電話、開關(guān)機或進行較大范圍移動時,均會生成信令數(shù)據(jù)[13]。手機信令數(shù)據(jù)主要包含國際移動用戶識別碼(IMSI,InternationalMobileSubscriberIdentity)、時間(TIME)、基站編號(CELLID)、基站經(jīng)度(LONGITUDE)及基站緯度(LATITUDE)5類信息。
對于不同應(yīng)用場景,不同的數(shù)據(jù)適用程度不同。以景區(qū)為例,對于景區(qū)的整體客流量數(shù)據(jù)獲取來說,通過門禁的統(tǒng)計數(shù)據(jù)可以準(zhǔn)確的得到景區(qū)內(nèi)不同時段的入園人數(shù)、在園人數(shù)等整體數(shù)據(jù),但對于景區(qū)內(nèi)不同區(qū)域、不同景點的客流分布情況卻無法準(zhǔn)確及時的獲取;對景區(qū)內(nèi)較小的室內(nèi)景點來說,視頻識別數(shù)據(jù)可以簡單的獲取到室內(nèi)的客流量、密度及分布情況,對于室內(nèi)區(qū)域的客流情況可以快速做出識別與分析,但該技術(shù)在室外的效果會受到天氣、建筑遮擋等多種因素的影響,造成精度不足的問題;傳統(tǒng)的人工計數(shù)方式可以解決前面兩類技術(shù)存在的問題,可以通過增加調(diào)查人員獲取景區(qū)不同區(qū)域、不同景點的客流量、密度、分布等數(shù)據(jù),但數(shù)據(jù)采集成本高、實時性低,對于景區(qū)短時預(yù)測預(yù)警及景區(qū)管控等參考價值有限。
手機信令數(shù)據(jù)具有覆蓋范圍廣、定位速度快、實時性強、連續(xù)性強等特點。結(jié)合數(shù)據(jù)的連續(xù)性,對客流進行連續(xù)的追蹤與分析,因此多用于城市內(nèi)多個景區(qū)間的客流特征分析及挖掘[14-18]。并且根據(jù)景區(qū)類型的不同,可以通過手機信令數(shù)據(jù),實時獲取景區(qū)內(nèi)不同區(qū)域的客流分布數(shù)據(jù),針對景區(qū)內(nèi)不同區(qū)域的客流量、分布情況、客流特征及出行特點進行提取與分析。
2基于出行鏈的游客識別方法
2.1景區(qū)游客識別考慮的因素
景區(qū)游客識別中需要考慮游客的停留時間、出行軌跡等出行的因素,以及景區(qū)的類型、景區(qū)大小、景區(qū)位置、景區(qū)周邊用地性質(zhì)及道路情況等景區(qū)的因素,兩部分。出行因素中,主要考慮游客在景區(qū)研究范圍內(nèi)的停留時間,以及出行軌跡是否經(jīng)過景區(qū)范圍。景區(qū)因素中,首先旅游景區(qū)分為開放型與封閉型兩種,開放型是沒有面積和空間限制、免費、且游客流動性更大不易管控的一類景區(qū)[19],封閉型是指有空間限制,通過一定的物理設(shè)施隔離景區(qū)與外圍的空間的一類景區(qū)。
研究中提出的識別方法適用于設(shè)有出入口的封閉式景區(qū)。不同景區(qū)的覆蓋面積大小不同、所處位置有所差異、且不同的地理地貌均會對游客識別造成影響,因此選擇手機基站為最小單位,進行游客數(shù)據(jù)的識別。大型景區(qū)內(nèi)包含的基站數(shù)會較多,單個基站面積較大;小型景區(qū)基站數(shù)較少,單個基站面積較小。基站較多的景區(qū)中,基站在游客識別中的作用也會有所差異,需要根據(jù)功能和位置進行分類以保證識別精度。同時,景區(qū)周邊的用地性質(zhì)、路網(wǎng)特征也會對景區(qū)游客識別產(chǎn)生干擾。
當(dāng)景區(qū)周邊存在居住用地、商業(yè)用地和工作用地等,用戶類型就會出現(xiàn)居民、路人和周邊工作人員等;當(dāng)景區(qū)周邊路網(wǎng)較為密集時,周邊路人的比例也會提升。因此景區(qū)的游客識別中,需要將基站進行分類,根據(jù)特定的基站選定研究區(qū)域,以保證識別方法適用于不同面積和位置的景區(qū);需要將用戶進行分類,保證識別方法可以將游客與居民、路人和周邊工作人員進行區(qū)分,保證識別精度。
2.2基站分類與研究區(qū)域選取
景區(qū)內(nèi)部及周邊設(shè)置了一定數(shù)量的基站為景區(qū)用戶服務(wù),手機基站受到周邊環(huán)境干擾、基站空間分布以及基站信號強度等影響,服務(wù)范圍不規(guī)則,通常采用泰森多邊形的方法表示基站的實際服務(wù)范圍[20]。
可以發(fā)現(xiàn)基站服務(wù)范圍通常略大于景區(qū)的物理邊界。根據(jù)景區(qū)邊界與基站服務(wù)范圍的空間重疊關(guān)系,并考慮到游客均通過景區(qū)出入口進出,景區(qū)出入口基站具有特殊性,將景區(qū)基站分為三類,第一類為覆蓋景區(qū)出入口的基站;第二類為完全處于景區(qū)邊界內(nèi)的基站;第三類為與景區(qū)有部分重疊的基站。為獲取全部游客數(shù)據(jù),選取第一、二和三類基站覆蓋的范圍作為景區(qū)研究區(qū)域。
2.3用戶分類及特征
景區(qū)研究區(qū)域內(nèi)的手機用戶有游客和非游客,非游客包括景區(qū)周邊的居民、工作人員和經(jīng)過景區(qū)周邊道路的路人。研究將景區(qū)研究范圍內(nèi)的用戶分為4類:路人、居民、工作人員以及游客。
(1)居民:具有固定的居住地,即凌晨至早上、或晚間時段內(nèi),具有固定停留點,停留時間超過一定的時間閾值。居民數(shù)據(jù)一定出現(xiàn)在第三類基站,可能出現(xiàn)在第二類基站,F(xiàn)有研究多將凌晨0:00-5:00停留時間大于4小時的景區(qū)研究區(qū)域內(nèi)用戶認(rèn)定為居民[11]。
(2)周邊工作人員:具有固定的工作地點,即連續(xù)幾天出現(xiàn)在同一地點,在工作地累計停留時間超過一定的時間閾值。工作人員一定不會出現(xiàn)在第二類基站,可能出現(xiàn)在第一類和第三類基站。我國工作時間多為:8:00-17:00,根據(jù)《2016-2017年中國休閑發(fā)展報告》(休閑綠皮書)中數(shù)據(jù),2016年北京市居民工作時長約為6小時2分鐘/天,現(xiàn)有研究將9:00-16:00時段內(nèi)累計停留時間超過5小時的用戶識別為工作人員。
(3)游客:在研究區(qū)域停留時間超過一定的時間閾值,不會連續(xù)幾天出現(xiàn)在研究區(qū)域,出行目的地較多。游客經(jīng)景區(qū)出入口進出景區(qū),因此一定出現(xiàn)在第一類基站,可能出現(xiàn)在第二類和第三類基站。(4)路人:在景區(qū)覆蓋范圍內(nèi)沒有固定的駐留地點,在研究區(qū)域內(nèi)的總停留時間短于其他類型用戶。路人一定不會出現(xiàn)在第二類基站,可能出現(xiàn)在第一類和第三類基站。
2.4基于出行鏈的游客識別方法
路人、居民、工作人員和游客在空間分布特性上存在一定重疊。如何應(yīng)用手機信令數(shù)據(jù)進行游客的識別,成為景區(qū)客流預(yù)測的重要環(huán)節(jié)。
2.4.1不同用戶的出行特征
手機信令數(shù)據(jù)中包含了表示手機用戶所在位置的經(jīng)緯度坐標(biāo),以及用戶出現(xiàn)在該坐標(biāo)下的時刻;谶@兩類數(shù)據(jù),將用戶出行的時間與空間數(shù)據(jù)進行整合,得到按時間順序排列的用戶全天的出行軌跡,即出行鏈。游客出行鏈?zhǔn)怯慰鸵月糜螢槟康,從出發(fā)至到達景區(qū)目的地,以及從當(dāng)前景區(qū)目的地至下一目的地的出行全過程;谟慰统鲂墟湹臅r空分布特性,研究基于4類用戶的出行鏈特性分析,提出基于出行鏈的游客識別和特征分析方法;谑謾C信令數(shù)據(jù),進行數(shù)據(jù)預(yù)處理后,提取用戶的出行鏈[21-24],繪制用戶的出行鏈。
(1)居民用戶出行鏈特征:居民的多日出行鏈起訖點具有較強的規(guī)律性,出行起訖點均在研究區(qū)域內(nèi),凌晨至早上在區(qū)域內(nèi)沒有移動。當(dāng)出行鏈包含多個活動點時,通常離開研究區(qū)域,并在中午或晚上返回研究區(qū)域內(nèi)的居住地,凌晨停留時間較長。(2)工作人員出行鏈特征:出行起點在研究區(qū)域外,進入研究區(qū)域后,在工作時間內(nèi)、景區(qū)外圍基站有固定的停留地點,最后離開研究區(qū)域,工作時間段內(nèi)停留時間較長。
(3)路人出行特征:出行起點在研究區(qū)域外,進入研究區(qū)域后,沿研究區(qū)域外圍邊界移動,沒有長時間停留點,最后離開研究區(qū)域,總停留時間較短。(4)游客出行特征:出行起點在研究區(qū)域外,在開園時間段內(nèi),由景區(qū)出入口基站進入研究區(qū)域,且在研究區(qū)域內(nèi)有多處停留時間較長的地點,最后經(jīng)過景區(qū)出入口基站離開研究區(qū)域,總停留時間較長。
3案例分析
3.1研究區(qū)域
3.1.1景區(qū)及手機信令數(shù)據(jù)簡介頤和園位于北京市西郊,是國家5A級旅游景區(qū),中國清朝時期皇家園林,自然風(fēng)光優(yōu)美秀麗,節(jié)假日期間會吸引國內(nèi)外眾多游客前往游覽,是我國最熱門的景區(qū)之一。頤和園占地面積大,不同區(qū)域的熱門程度不同,在節(jié)假日期間會形成明顯的客流分布不均的現(xiàn)象。同時,頤和園周邊基站布置較為密集,因此,選取頤和園為研究對象,開展基于手機信令數(shù)據(jù)的游客識別案例分析具有典型意義。手機信令數(shù)據(jù)來自北京移動公司某年5月1日0時至5月3日24時的全部數(shù)據(jù),劃分研究區(qū)域,基于手機信令數(shù)據(jù)提取出行鏈,開展基于出行鏈的游客識別和出行特性研究。
3.1.2研究區(qū)域選取使用ARCGIS軟件,繪制每個基站的泰森多邊形,使用泰森多邊形表示該基站的服務(wù)范圍,并將多邊形范圍與頤和園景區(qū)范圍進行比較,選取相交以及包含關(guān)系的基站,即選擇可以覆蓋頤和園景區(qū)的多邊形所在的基站作為頤和園景區(qū)的研究區(qū)域。頤和園景區(qū)研究區(qū)域共設(shè)有13個基站。為方便后續(xù)研究,將基站重新編號。
地理教育論文投稿刊物:地理學(xué)報于1934年創(chuàng)刊,由中國科學(xué)院主管,刊登的主要內(nèi)容包括能反映地理學(xué)科最高學(xué)術(shù)水平的最新研究成果,地理學(xué)與相關(guān)學(xué)科的綜合研究進展,地理學(xué)各分支學(xué)科研究前沿理論,與國民經(jīng)濟密切相關(guān)并有較大應(yīng)用價值的地理科學(xué)論文。希望地理學(xué)相關(guān)人員積極向雜志投稿。
4結(jié)論
研究基于手機信令數(shù)據(jù),對景區(qū)的客流識別方法進行研究,根據(jù)景區(qū)邊界與基站服務(wù)范圍的空間重疊關(guān)系,考慮游客通過景區(qū)出入口進出景區(qū)而產(chǎn)生的出入口基站的特殊性,將景區(qū)基站分為三類,第一類為覆蓋景區(qū)出入口的基站;第二類為完全處于景區(qū)邊界內(nèi)的基站;第三類為與景區(qū)有部分重疊的基站,選定了景區(qū)的研究區(qū)域。將用戶分為居民、工作人員、路人以及游客4類,分析不同用戶的出行特征,提取用戶出行鏈,提出基于出行鏈的游客識別方法,最后以北京市頤和園景區(qū)為例進行案例分析,得到五一期間共識別游客103966人次,游客識別準(zhǔn)確率達到97.56%,識別精度較高。結(jié)果顯示,識別方法對于如頤和園占地面積較大的自然類景區(qū)有較好的識別精度。研究提出的游客識別方法可以用于大型自然類景區(qū)的客流統(tǒng)計,為景區(qū)的客流分布及移動等研究提供數(shù)據(jù)支持,給景區(qū)管理員進行大客流預(yù)警調(diào)控提供參考。
[參考文獻]
[1]韓艷,楊光,武鑫森,等.考慮游客擁擠感知的旅游線路優(yōu)化設(shè)計[J].北京工業(yè)大學(xué)學(xué)報,2018,44(12):1537-1546.
[2]HANYan,YANGGuang,ZHANGTinatina.Spatial-temporalresponsepatternsoftouristflowunderentrancetouristflowcontrolscheme[J].TourismManagement,2021,83,10.1016/j.tourman.2020.104246.
[3]MOShumin,ZENGKefeng,LIUChao.Earlywarningmechanismofhuangshanworldgeoparktodivertpassengertraffic[J].AdvancedMaterialsResearch,2014,1030-1032:2014-2018.
[4]靳誠,徐菁,黃震方,等.南京城市內(nèi)部景點間游客流動特征分析[J].地理學(xué)報,2014,69(12):1858-1870.
作者:韓艷1,龔浩1
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/27642.html