旅游业需要变得可持续:数据科学如何帮助

随着大流行引起的旅行限制的下降,旅游业的恢复速度比预期的快,因此相关排放也是如此。为了满足该行业的气候目标,尽管需求不断增长,决策者需要设计有效的干预措施。这些措施反过来依赖于及时,准确的数据。最近发表的作品EPJ数据科学探索利用旅行平台数据和监督学习来采购此数据的可能性。

旅游业的回归及其环境后果

随着共同19-9相关的旅行限制正在下降,旅游业正在全力以赴。

在2022年的第一季度,国际旅游业同比增长近200%。与上一年相比,欧洲市场以近四倍的国际抵达数量领先。

尽管全球旅游业仍低于其流行前的规模,但这种迅速的增长使行业专家感到惊讶,并提高了恢复期望。截至2022年6月,大约有两名专家预计到2023年将重返大流行前水平。

对于Airbnb房东和旅行博客作者来说,这不仅是个好消息,而且旅游业也是经济增长的主要驱动力,尤其是在不太发达的经济体中。在联合国可持续发展目标中,旅游业的重要性得到了认可,该行业在十七个目标中有三个中直接提及。

但是,在许多情况下,这种经济进步以严重的环境后果为代价。

在大流行之前,旅游业和相关活动估计占全球温室气体排放的8%。即使该部门本身将受到全球气候变化的严重影响,预计这些排放将在未来十年内增长。

正是经济利益与环境成本之间的这种权衡,经过深思熟虑的政策和准则将需要平衡。特别是发展中国家应旨在利用旅游业的经济潜力,同时减轻不利的环境影响。

此类政策需要准确,及时的数据来为政策设计提供信息,并评估实施措施的影响。

非常规数据源如何为发展统计信息提供信息

采购此准确,及时的数据对所有领域的政策制定者构成了挑战 - 旅游也不例外。

采用欧洲委员会创建的管理和监视工具欧洲旅游指标系统(ETIS),旨在允许目的地衡量其可持续性绩效。系统中使用的一些数据很容易从国家统计局获得,其他数据是通过调查收集的。

欧洲委员会建议,由于这些调查的时间和成本强度,依靠三年的周期来收集一些指标。因此,节省成本的需求降低了可持续性指标的时间准确性和可用性。

甚至根据这些准则,研究人员发现在某些地区首次实施系统后,将缺少超过一半的指标数据。

利用替代形式的数据可能有助于改善指标框架。在经济和社会发展统计的其他领域,他们的收集信息的潜力得到了令人鼓舞的结果。

示例包括来自社交网络和交易平台的数据以及手机记录和卫星图像。

这些研究中的发现尤其重要,因为估计模型可以以高频和地理精度使用,同时总成本较低。

诚然,这些非常规的数据来源将不会长时间替代大规模,统计学家领导的大规模调查的黄金标准,也许永远不会。但是他们能够提供其他信息,增加覆盖范围并通过良好的估计来填补空白。

寻找旅游统计的平台数据

那么这些想法如何适用于可持续旅游业的衡量?

在我们最近发表的工作中,我们解决了这个问题,并发现旅游平台数据是了解不同国家可持续旅游程度的宝贵信息来源。

在这项研究中,我们专注于世界上最大的市场欧洲旅游业。使用来自65,000多个列表的网络网络数据集tripadvisor.com并应用了一系列统计学习技术,我们在旅行平台上找到了住宿的代表,可以很好地预测其可持续性实践。

例如,数据表明,该平台上获得可持续性徽章的住宿显示出更高的用户参与度和质量功能(见图1)。

图1.在线平台数据中,可持续发展(蓝色的绿色领导者)和其他住宿(红色)之间的差异。
©F。J. Hoffmann等。al。(2022)

基于这些功能,我们培训了一系列机器学习模型,这些模型可以成功预测旅游住宿的可持续性水平。

由于数据源和模型的高度可用性,因此我们能够以其他任何成本预测可持续住宿的比例(见图2)。

图2.预测欧洲可持续旅游住宿的股票。
©F。J. Hoffmann等。al。(2022)

换句话说,在线平台数据与机器学习模型相结合,使我们能够估计所有在全球范围内拥有TripAdvisor存在的国家可持续旅游住宿所占的比例。

外卖

无论是2023年,无论是2023年,旅游业都将完全恢复到大流行前的水平,并随之而来的是它所造成的排放。

非常规信息来源,例如来自在线平台TripAdvisor和机器学习方法的数据,可以帮助填补数据空白,以跟踪和管理全球可持续的旅游业。

这样的信息可以帮助设计更好的政策,以使旅游业保持在行星界限内。

研究结果以及复制这些结果的数据和代码可免费获得这里

查看有关物理科学主页上的最新帖子

注释