< 返回
基于数据挖掘的航空公司客户关系管理

民航行业中的客户数据、业务数据量十分巨大,而且更新速度频繁,使用传统crm统计方法所能取得的效果并不理想,存在很多因为数据滞留带来的分析误差。不过随着计算机技术、数据库技术、信息传送技术的日益发展,客户关系管理也进一步得到发展,数据挖掘(data mining)就是crm新的发展趋势。

一、航空公司客户关系管理的核心内容

(一)客户保留

客户可分为三类:第一类是无价值或低价值的客户;第二类是不会轻易走掉的有价值的客户;第三类是不断寻找更优惠的价格和更好服务的有价值的客户。传统的市场活动是针对前两类客户的,而现代客户关系管理认为,特别需要用市场手段维护的客户是第三类客户,这样做会降低企业运营成本。数据挖掘可以对数据库中的大量数据进行分析和处理,以识别、分析和评价客户流失风险,并分析出客户流失的原因,导致客户流失的因素,客户流失风险的来源,留住赢利能力高的客户,将赢利能力低的客户提升为赢利能力高的客户。

(二)客户忠诚度分析

忠诚客户为公司所带来的利润是巨大的,数据挖掘技术可以通过对数据库中的大量数据进行分析,以确定消费者的购买习惯、购买数量和购买频率,分析客户对某个产品的忠诚程度、持久性、变动情况等,以确定忠诚客户,并为他们提供“一对一”的个性化服务,增强客户的忠诚度,最大限度地挖掘客户对企业的终生价值,为企业创造更大的利润。

(三)客户贡献分析

客户对企业赢利贡献的大小直接关系到企业利润的高低,利用数据挖掘可以进行客户分析,发现真正创造利润的客户,低利甚至是无利的客户,通过交叉销售或其他方法将赢利能力低的客户提升为赢利高的客户。数据挖掘可以从客户信息和客户的历史交易记录中分析客户赢利能力的高低,预测客户未来的购买模式和购买行为,这样就可以在市场营销过程中保留住那些有价值的客户。避免花费过多精力和财力无目标地开发新客户,并为这些最有可能创利的客户及时提供个性化服务,使企业有效地降低成本,提高收益。

对于数据挖掘的合理使用的基础支持除了准确的、及时的数据来源外,还需要一个合适的数据库和一个为实现效率管理的客户关系管理系统。

二、数据挖掘在航空公司客户关系管理中的应用

数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。

(一)数据挖掘的流程

数据挖掘的流程包括以下四个步骤:

1.定义商业问题

每一个crm应用程序都应有一个或多个商业目标,否则数据挖掘可能漫无目的。根据特定的目标,如“提高市场响应率”,选择和准备数据,建立完全不同的模型,同时可以评价数据挖掘的效果。

2.数据处理

(1)数据过滤。这一步可以确保收集的数据符合分析的需要。数据挖掘的前提是高质量的数据,如果数据有缺陷的话,即使最先进的数据挖掘工具也不会有效果。

(2)数据预处理。这一步骤应确保原始数据和输入标准一致。数据挖掘所需要的数据可能在不同的数据库中,如客户数据库、产品数据库以及事务数据库,因而需要集成和合并数据到单一的营销数据库,并协调来自多个数据源的数据在数值上的差异,使数据属性标准化。同时,还要去除重复数据,例如,同样的客户只是由于地址的变化而形成新的数据,必须识别并去除这些重复性数据。

(3)数据分析。在建立良好的预测模型之前,必须对预处理后的数据进行初步分析,形成对数据的初步认识,找出最大值、最小值,了解数据分布状况等。

(4)数据准备。这是建模前数据处理的最后一步。主要有四步:

a.为建立模型选择变量;

b.从原始数据中构建新的预示值;

c.从数据中选择一个子集或样本来建立模型;

d.转换变量,使之和选定用来建立模型的算法一致。

3.建立模型

在多个可供选择的模型中找出最佳模型,初始模型可能无法达到数据挖掘的目的,需要多次反复。在寻找最优模型过程中,可能要修改正在使用的数据,甚至修改问题的陈述。数据挖掘的模型构建阶段采用的技术包括神经网络、逻辑回归等。

4.评价模型

这个阶段是对数据挖掘阶段构建的模型质量进行评定。模型验证的标准方法是从预处理数据中随机抽取两个样本,一个校准样本用于构建模型,一个样本用于验证校准样本产生的模型。通常一个好的模型运用到验证样本中能得到较好的效果,如效果很差,就需要重新构建模型。

在目前日益激烈的竞争环境下,客户关系已不再是简单的电话关怀或嘘寒问暖,一条信息或一个决策都会影响到航空公司原有客户和潜在客户的去留,甚至可以决定企业的成败。因此,从大量的数据分析中获取有利于商业运作、有助于商业决策的有价值的信息是十分重要的。数据挖掘作为一种新的商业信息处理技术可以在企业管理客户生命周期的各阶段发挥作用,包括争取新的客户,保持原有的客户,让已有的客户创造更多的利润等。它能够帮助企业确定客户的特点,为客户提供有针对性的服务。

(二)模型建立

1.建立模型的数据来源

数据主要的来源可以是经常发生的记录飞行计划的数据库,可以称为一级数据库。在该数据库集中了可选择所有的航空公司客户的数据。对于每个成员的详细信息,在这个数据库中都通过统计学原理完整、准确地收集。那么一个二级数据库就包含一连串所有过去单一发生的起降航班,包括离开和抵达机场时间,乘客预约或遗留(未登机)的数据。客户的活动像信用卡使用在一个附加的数据库中也被聚集。这里没有有关客户具体收入的数据,只包含供管理使用的日常发生的飞行航班数据。

2.数据准备

数据的质量是可靠的,有关飞行计划的数据活动也是相当完整的。我们从一级数据库里进行随机地抽取(n=70 000),且对客户的数据限制在一定时期内一定飞行航班的客户(约60%样品的所有成员),最后的样品设定为约40 000个客户。以此进行分割,目标客户中的1/4作为子样品使用;另外的1/4作为确认子样品使用;剩余的数据用来验证前面所做工作的精确度,从而可以从历史航班活动里得出最有价值的数据(有关于在客户团体之间的所观察到的细微变化,以及客户价值之间的相互关系)。

3.工作处理

航空公司的客户可能因为他们飞行旅行目的(也就是商务飞行或空闲旅行)和机票的类型进行有规则地购买。依照这样的规则,能获得新的元素属性,即通过客户旅行目的和方式描述客户等级来聚集数据,并给予这个数据群体一个完整的备注。分割的目的是要识别典型的客户团体,每个客户团体的数据都有其相似之处,但是在团体之间存在根本性的区别。聚类方法是最合适来解决这一个数据挖掘问题的方法。对六个客户区域以基于旅行行为引领进行分割,见下表。

图1为每个区域飞行活动的平均数,其中左图表示旅行和回返旅行的数据,右图按子类型决定回返旅行,子类型包括:retls——长期停留,retwe——旅程包含一个周末,retww——周一至周五的旅程。

基于商务问题引领区域进行分割。在“c”区域和其他区域之间有清晰的分隔,有可比较的往返旅行的价格费用。有三个频率等级:低点(a,d),中等和高度(b,e)和顶端(f)。相似行为归为相应的区域。区域“a”的客户主要是空闲假日旅客,然而区域“d”的客户是专门在周末进行旅行,区域“e”属于纯粹的生意客户。区域“b”和区域“f”使用所有种类的往返旅行,但是他们两者之间区别在于飞行活动的次数频率。b等级是具有高度价值的核心客户区域,而f等级是较低价值的核心客户区域。

为了进一步评估结果,应用分割规则,即在同一性质的子群中以时间段进行分割,得出图2,即各区域里面的每单位收入和总收入的箱形图。

由于没有一个真正定量的、精确的、最好的分割方法,因而通过调查团体客户的收入分配(客户价值)来核定资本是值得运用的,它能确定连贯性和合适的结果。而从收入观点来看,主要团体是区域“f”的客户。不过区域“b”和“e”的客户也是有效益的。如果采取单位距离标准收入,那么区域“e”和“f”的客户是最高的,而且周中旅行(e和f)有着不同的费用用法水准。归类到区域“c”的客户相对于其他区域的客户支付较贵的费用,这些客户可能是偶然乘坐一次航班飞机。这一个区域可以清晰发现其具有一定消费客户数量,并且他们的费用水平比平均更高。

如果重视费用的类型上的区分,可以获取进一步的证实:高费用中较高的部分(商务等级:fch,fcm和完全经济费用的fyh)属于区域“e”和区域“f”之中。

图3表示的是按舱位等级进行分割的往返活动(ffh:头等舱位;fch:高级商务舱位;fcm:中等商务舱位;fcl:普通商务舱位;fyh:高级经济舱位;fym:中等经济舱位;fyl:普通经济舱位;fOA:其他费用)。

三、结论

数据挖掘在航空公司日常业务运营中,尤其是旅客运输管理中,具有很重要的作用。通过对客户消费行为的区分来定位客户等级,建立相适应的消费体系,以精确营销的方式实现效率化的客户关系管理。通过数据挖掘,准确地了解每个客户的消费特点,提供合适的业务服务,提高客户满意度并有可能促使客户提高消费水平,保留客户并有效防止客户流失或价值下降。