工作城市选择的层次分析模型（模型搭建与数据准备）

只看楼主收藏回复

楼主

昨天，很久没有更新文章的我，向大家推送了一篇文章《工作城市选择的层次分析模型》并且承诺，会连续三天更新，今天兑现承诺。

这里提醒一下，没看过昨天那篇文章的同学，请先看昨天那篇文章，否则你可能不清楚我在说什么。

顺着昨天的思路，我今天去各种渠道搜集齐了数据，找数据的过程是非常艰辛的，说起来都是泪。爬虫程序都调试了好几次，才抓到我想要的数据。本文用到的数据，我会打包放到百度云盘，如果你想使用数据，点击阅读原文下载。

注：各指标依据以下公式进行打分，打分时，先计算该指标下的最小值和最大值，然后再人为分别确定一个比最小值还小一点，最大值还大一点的数。利用这两个人为确定的数，把得分转换成0~1之间的数。

（如工资等指标）

（如房租等指标）

这里给出各数据指标截图

（房租换算为每月每平米价格，并转换成0到1之间的得分）

（数据分析岗平均起薪）

（数据分析岗未来可能拿到的最高月薪）

（各城市提供数据分析岗的公司数量）

（各城市平均通勤时间：以分钟计算）

（各城市高校数量，用来衡量人文环境）

（回家高铁费用）

（分别统计晴天数和雾霾天数，计算两个得分加和得到一个分数，因此得分超过1）

整理得到下面的表格，按照昨天文章中提到的各指标的权重（对于我自己而言，关心的因素的重要性排序为：工资>通勤时间>发展空间>与亲人距离>房租>工作机会>自然环境>人文环境>消费水平。依次赋予权重为：0.2、 0.2 、0.2 、0.1 、0.08 、0.08、 0.08 、0.05 、 0.01（权重相同的几个指标，请自觉认为前面一个稍微大于后面一个且sum=1）。）

计算后，发现北京排在第一位，广州排在第二位。

数据的准备阶段就花了如此长的时间，其实本问题的求解主要是数据的准备，数据都不是现成的，需要自己去抓取，所以比较耗时。

然而，直到这里还没有引入层次分析法，看来这一次需要写四篇文章了。

为什么要引入层次分析模型呢？原因就在于权重的确定。昨天已经有小伙伴看出这个问题了。

上面我对各个因素权重的确定不是很精确，各要素的重要性并不是我真正想要的，为什么呢？因为要考虑的要素太多，我也不好一一比较。所以需要引入层次分析法。请看下面的模型。

在最终目标与具体指标中间插入准侧层。分别权衡各指标对于中间准则层的重要性。最后计算出一个权重，这样计算出的权重就比较接近真实想法了。本文先写到这儿，关于层次模型的具体解法将在下一篇中详细介绍。

获取数据请点击阅读原文。

送TA礼物

举报 | 1楼回复

发表回复

发帖请遵守贴吧协议及“七条底线”

推荐热门榜

友情链接