广州围巾价格联盟

工作城市选择的层次分析模型(模型搭建与数据准备)

只看楼主 收藏 回复
  • - -
楼主

昨天,很久没有更新文章的我,向大家推送了一篇文章《工作城市选择的层次分析模型》并且承诺,会连续三天更新,今天兑现承诺。


这里提醒一下,没看过昨天那篇文章的同学,请先看昨天那篇文章,否则你可能不清楚我在说什么。


顺着昨天的思路,我今天去各种渠道搜集齐了数据,找数据的过程是非常艰辛的,说起来都是泪。爬虫程序都调试了好几次,才抓到我想要的数据。本文用到的数据,我会打包放到百度云盘,如果你想使用数据,点击阅读原文下载。



注:各指标依据以下公式进行打分,打分时,先计算该指标下的最小值和最大值,然后再人为分别确定一个比最小值还小一点,最大值还大一点的数。利用这两个人为确定的数,把得分转换成0~1之间的数。


(如工资等指标)


(如房租等指标)




这里给出各数据指标截图



(房租换算为每月每平米价格,并转换成0到1之间的得分)


(数据分析岗平均起薪)


(数据分析岗未来可能拿到的最高月薪)


(各城市提供数据分析岗的公司数量)


(各城市平均通勤时间:以分钟计算)


(各城市高校数量,用来衡量人文环境)


(回家高铁费用)


(分别统计晴天数和雾霾天数,计算两个得分加和得到一个分数,因此得分超过1)


整理得到下面的表格,按照昨天文章中提到的各指标的权重(对于我自己而言,关心的因素的重要性排序为:工资>通勤时间>发展空间>与亲人距离>房租>工作机会>自然环境>人文环境>消费水平。依次赋予权重为:0.2、 0.2 、0.2 、0.1 、0.08 、0.08、 0.08 、0.05 、 0.01(权重相同的几个指标,请自觉认为前面一个稍微大于后面一个且sum=1)


计算后,发现北京排在第一位,广州排在第二位。




数据的准备阶段就花了如此长的时间,其实本问题的求解主要是数据的准备,数据都不是现成的,需要自己去抓取,所以比较耗时。


然而,直到这里还没有引入层次分析法,看来这一次需要写四篇文章了。


为什么要引入层次分析模型呢?原因就在于权重的确定。昨天已经有小伙伴看出这个问题了。



上面我对各个因素权重的确定不是很精确,各要素的重要性并不是我真正想要的,为什么呢?因为要考虑的要素太多,我也不好一一比较。所以需要引入层次分析法。请看下面的模型。



在最终目标与具体指标中间插入准侧层。分别权衡各指标对于中间准则层的重要性。最后计算出一个权重,这样计算出的权重就比较接近真实想法了。本文先写到这儿,关于层次模型的具体解法将在下一篇中详细介绍。


获取数据请点击阅读原文


举报 | 1楼 回复

友情链接