原标题:链家:12月起采用“新均价”统计口径不存在人
新京报快讯(记者 张晓兰)这两天,链家网市场均价数据的变化引发业内广泛关注。对此,新京报记者向链家方面求证。链家方面表示,不同时间段用户先后看到的参考均价存在差异,是因为从底层数据汇总、计算再到前端展示过程中,会存在系统缓存期,属于正常情况。
外界质疑链家网市场均价数据发生变化
昨天,易居房地产研究院副院长杨红旭发文指出,一般月初几天,链家会公布他们在部分城市的二手房成交均价,相比12月3日,12月4日链家网上几个城市11月均价没有变化,但跌幅,全都调整过了。调整幅度最大的是廊坊,由一天之前的11月环比10月下跌7.93%,调整为上涨0.57%;其次是成都,由一天之前的11月环比10月下跌4.24%,调整为上涨1.01%;其他6个城市,除了武汉跌幅略有调大之后,其他5个跌幅皆调小了。
“11月均价不变,而跌幅有变,那也就意味着10月均价被调整过了,估计之前多月的均价也被依次调整过了。”
此外,也有网友跟踪北京二手房交易数据发现,北京的二手房价格也发生了明显变化。
链家称 12月起采用新的市场参考均价计算方式
针对链家网市场均价数据的变化,昨天晚间,链家在其官方公众号上发布关于“链家网市场均价采用新计算方式”的相关说明。文章指出,为更客观准确地呈现城市存量房价格水平,链家网从12月起采用新的市场参考均价计算方式。在导入新计算模型后,链家网首页所显示的城市均价数据将会对应发生改变。
链家网参考均价是如何计算的?对此,链家指出,参考均价是一种模型价格,并非简单的统计价格。新计算方式采用小区历史所有有效成交、有效挂牌进行加权平均,只要小区有过成交或挂牌,即可计算出参考均价,进而得出商圈、城区和城市的参考均价。
据悉,此次是链家对参考均价计算方法进行的第三次迭代。参考均价作为模型价格,需要不断迭代优化计算方法,以更接近城市实际的价格水平。此次迭代纳入了更多的数据源,覆盖了更多的城市、城区、商圈和小区。基于这些数据源,链家更新了参考均价的算法,以更接近城市的实际价格水平。此外,在成交和挂牌数据上,新增了贝壳平台联网的其他经纪品牌的数据,覆盖面更广。
为什么要采用模型价格,而不使用简单的统计均价?对此,链家方面指出,房地产市场是大宗低频交易,数据时变性很强,时间越久远的数据,参考价值越低;数据极度稀疏且存在头尾分布,以北京十一月的数据为例,头部20%的小区占掉了80%成交量;如成交集中在个别小区,则无法反映城市真实均价水平;数据极易遇到政策影响而发生突变,比如:当政策倾向于刚需型住房时,则短期内成交均价相对较低;当改善型住房成为成交主体时,均价水平则相对较高。基于此,链家方面认为,采用模型价格,可以有效考量以上因素,得出客观均价水平。
而针对12月3日链家APP上的“北京11月环比均价”数据,为何会先涨后跌的问题,链家方面指出,由于更改了参考均价的计算方法,需要对所有历史数据进行重刷,数据的重刷需要较长时间。整体数据更新的时间窗口内(大概是半小时),城市的参考均价会存在“新旧并存”的短暂局面。拿北京来说,采用新计算方式的1个小时后,所有月份的新参考均价才全部更新到线上。因此,用户会感知到参考均价的前后变化,以及由此带来的环比幅度的前后变化。
对于链家的回应,杨红旭表示,以前每个月都在看数据,没有发生房价调整的现象,链家昨天和前天的数据,发生了重大变化,有可能是链家内部调整了模型,这一情况目前还无法判断,因为计算模型比较复杂,迭代和优化也是有可能性的。
链家称从底层数据汇总、计算再到前端展示存在系统缓存期
不过,这一事件还在进一步发酵。今天,自媒体“大伟看楼市”发文指出,因为有个15天的数据延迟,今天能看到11月20日的数据,又有极端案例出现。阳光上东单价3.1万,背后的理由可能解释为家人过户,但解释不了,为什么要挂牌7天后再签约。此外,要警惕中介捏造或者无意中创造一些个案,放大市场恐慌情绪。
对此,新京报记者向链家方面求证。链家方面表示,关于阳光上东的个案,经过内部核实,此房源属于家人之间内部转让,链家协助代办,按正常网签价格过户,成交单价非该小区正常市场均价。
与此同时,根据日前部分媒体反馈的链家官方公布的市场行情中,存在“北京及其他城市11月均价环比数据发生前后变化”情况,链家方面也做出相关说明。
链家方面表示,链家自12月起开始采用“新均价”统计口径,新的数据统计口径将采用“历史上所有成交、当前挂牌、历史挂牌的加权平均值”,包含了其他贝壳平台联网的经纪品牌数据,覆盖率更广,同时在样本量上也将更精细化到单个小区层面;另外,相比之前的统计均价算法,“新均价”将最大化剔除成交结构因素对市场数据干扰。在“新均价”统计口径导入后,11月之前的链家各城市环比均价数据也会对应发生改变。
链家同时强调,11月份“环比参考均价”的底层绝对数值不存在人为修改情况。不同时间段用户先后看到的参考均价存在差异,是因为从底层数据汇总、计算再到前端展示过程中,会存在系统缓存期,属于正常情况。
新京报记者 张晓兰 编辑 袁秀丽 校对 吴兴发