本周(8.9-8.15)全国主要景区
游客网络评价报告来啦!
首先是景点热度指数分布图
???
(注:热度指数按省份汇总,说明图中汇总的热度指数是根据该省份中每个景点的热度指数累加的结果,每个景点的热度指数是考该景点在过去一周里的评论数、旅游参与人数加权所得)
这周直接看差评景区
此次差评率最高的景区是
安顺黄果树大瀑布景区
除了它
还有哪些景区大家旅行体验较差?
???
(差评指数与差评率由基于民生大数据中心评论数据库的情感分析算法获得)
▼为啥大家旅行体验差?
(根据对评论情感分析,统计差评词频)
1.安顺黄果树大瀑布景区
上榜理由:景区管理差、人满为患、性价比低、达不到5A水准
2.黔东南西江千户苗寨
上榜理由:商业化严重、乱收费、服务态度差
3.金华东阳横店影视城景区
上榜理由:门票贵、性价比低、节目一般、安排混款、服务态度差
4.乐山大佛景区
上榜理由:黑司机、导游诱导消费、体验差、服务不到位、性价比低
5.铜仁梵净山景区
上榜理由:排队时间长、景区管理差、停车场乱收费
6.黄山市黄山风景区
上榜理由:景色一般、景点分散、设施陈旧、索道收费贵
7.西安大雁塔·大唐芙蓉园景区
上榜理由:服务态度差、门票贵、性价比低、景区没特色
8.西安秦始皇兵马俑博物馆
上榜理由:门票贵、服务态度差、空调不足、停车难
9.恩施大峡谷景区
上榜理由:人满为患、景色一般、门票贵、性价比低
10.乐山市峨眉山景区
上榜理由:购票不便捷、服务态度差、交通不方便
11.成都市青城山-都江堰旅游景区
上榜理由:停车难、乱收费、景区规划差、性价比低
12.西宁塔尔寺景区
上榜理由:门票贵、管理差、人满为患、环境卫生差
13.泰安市泰山景区
上榜理由:商业化严重、乱收费现象多
14.嘉兴桐乡乌镇古镇旅游区
上榜理由:门票贵、景区分散、性价比低
15.拉萨布达拉宫景区
上榜理由:景点管理差、黄牛多、导游不专业、态度差、门票贵
16.厦门鼓浪屿风景名胜区
上榜理由:票价贵、乱收费、景区管理差、商业气息重
17.桂林漓江景区
上榜理由:黑导游、乱收费、船上位置安排不合理、船票贵
18.张家界大峡谷景区
上榜理由:购票不便捷、景色一般、人满为患
19.陕西渭南华山景区
上榜理由:景区管理差、排队久、景色一般、服务态度差
20.北京圆明园遗址公园
上榜理由:景色一般、人满为患、有单收费项目
不要灰心
本周最受欢迎的景点在这里
???
▼为啥大家都喜欢去这些地方?
(根据对评论情感分析,统计好评词频)
1、自然风光景区颇受游客欢迎
典型景区:黔南州荔波樟江景区、北京松山森林旅游景区、济南天下第一泉景区、贵州织金洞世界地质公园、郴州东江湖旅游区、桂林两江四湖·象山景区、安顺龙宫景区
2、亲子出游备受游客倾心
典型景区:宁夏银川镇北堡西部影视城、秦皇岛野生动物园、上海野生动物园、大连老虎滩海洋公园.老虎滩极地馆、天津方特欢乐世界
3、水边游玩成为夏天出游必选
典型景区:三亚亚龙湾国家旅游度假区、三亚天涯海角游览区、海南呀诺达雨林文化旅游区、无锡市滨湖区鼋头渚旅游风景区
4、游客偏爱历史文化浓厚的景区
典型景区:大理崇圣寺三塔文化旅游区、无锡灵山景区、南京总统府景区
5、现代感吸引旅客流连忘返
典型景区:上海环球金融中心观光厅
出门在外,
心情最重要!
看了本周的游客评价
你有什么想说的话?
欢迎留言
注:
①《一周全国主要景区游客网络评价》报告不代表景区客流量与旅游收入,而是反映一周内最受关注与热议的景区,反映游客口碑最好或最差的景区,期望借此推进国内景区更好发展
②数据采集渠道
对新浪微博涉及景区的所有评论进行全站爬取;
对五个重点旅游网站涉及景区所有评论进行全站数据爬取(马蜂窝、携程网、途牛网、去哪儿网、同程旅游)
③数据范围
受众范围:对1077个需求景区进行数据统计;
微博采集范围:全量采集1077景区一周评论数据;
网站采集范围: 需求景区评论覆盖范围分别为马蜂窝(1020)、携程网(897)、途牛网(452)、去哪儿网(1043)、同程旅游(614)
④样本数量
本周所抓取的评论样本:新浪微博相关景点评论251220条(微博各景点取样2000条,不足2000条的按实际数据量统计);重点旅游网站相关景点评论量9361条。
?分析模式
情感分析算法:基于机器学习的情感分析是通过特征抽取,文本向量化及特征选择进行文本预处理,然后利用深度学习(CNN,RNN)和支持向量机(SVM)算法进行分类,从而实现情感判断。
热度指数算法:热度指数算法是由原始数据参照基数通过计算公式推导出来的标量数值,用以衡量原始数据在期所属维度的相对表现。如某景点评论数为379,我们会将这一数据与热度均值进行比较,以确定其评论数的相对位置,进而转换为其热度指数。
?差评率计算方式:通过统计每个景区的微博讨论量(m1)、微博负面帖文量(n1)、多家旅游网站一周新增评价数(m2)、一周新增负面评价数(n2),计算出每个景区的加权热度(m)和加权差评(n),再看差评所占总热度的比例,最终得到差评率
好评率计算方式:按照差评率计算得出,差评率最低20为好评top20
?差评指数和好评指数:是差评率、好评率各自乘以分类权重相加得到的