“古建筑”
	一个自带网红属性的词
	时不时窜上热搜榜
	动不动刷爆朋友圈
	在刚过去的2019年,关于“古建筑”发生了什么呢?今天我们通过大数据来了解一下。
	选取2019年1月1日至2019年12月31日的全年指数,进行了一些相关分析,仅供交流和参考。
	01古建筑:低调的网红大佬
	我们先来看看“古建筑”关键词的年度成绩单。
	高处不胜寒,“古建筑”是否那么的高不可攀、是否只是少数人的冷门喜好?
	常见的古建筑有宫殿、衙署、王府、民居、寺庙,也包括牌坊、桥梁、城墙等构筑物,比如故宫、长城等,那么这些关键词的搜索指数如何呢?
	古建筑跟日常生活可能没有直接联系,但是却正在走入公众视野。看“故宫”、“长城”、“乌镇”、“圆明园”等关键字,不出所料都是网红中的网红。“古建筑”才是低调的大佬。
	2019年2月18日,“故宫”的关键字搜索指数达到全年峰值80730,这一天凌晨,故宫官网门票预约系统宕机。“紫禁城上元之夜”,作为故宫近百年来的第一次灯会,紫禁城古
 
建筑群在两天里迎来了劳动模范、北京榜样、快递小哥等各界代表,梦回大清,仿佛在炫酷的射灯中穿越回前前朝。
	2019年4月16日,“圆明园”的关键字指数也达到了全年峰值——133139!
	这一天,圆明园本该静静的等候游人踏青,却在睡梦中等来一个老友的噩耗。
	北京时间0点,法国著名建筑巴黎圣母院突发大火,火势熊熊。
	159年前的10月6日,英法联军抢劫并火烧圆明园,那个时候有个叫维克多·雨果的法国作家,是谴责最深的:
	“有一天有两个强盗闯进了圆明园,一个打劫,一个放火……他们一个叫英吉利,一个叫法兰西……”
	造化弄人,西洋楼的大水法,卡西莫多的钟楼,都在熊熊大火中泯灭。 
	02谁在关注古建筑?
 	对搜索“古建筑”关键词的人群属性进行聚类分析,根据用户所属的省份、城市,可以看到有趣的排名:
	1.广东 
	2.浙江 
	3.江苏 
	4.北京 
	5.河南 
	6.山东 
	7.四川 
	8.河北 
	9.福建 
	10.上海
	珠三角和长三角联合体打败了“北上广”联盟,广东同胞不仅爱好吃,也更爱“古建筑”。整体分布上,呈现由东向西、由南向北递减的态势。东南沿海地区的用户,在“古建筑”关键词的检索评率上,普遍高于其他地区。
	“古建筑”关键字的搜索用户年龄大致呈正态分布,集中在20-29岁的青年为主,这或许很大程度受百度全网用户整体年龄分布影响。
	但是,对“古建筑”的关注TGI指数(TGI:即Target Group Index(目标群体指数),可反映目标群体在特定研究范围内的强势或弱势,数额越大,目标群体吻合度越高。其中TGI指数等于100表示平均水平,高于100,代表该类用户对某类问题的关注程度高于整体水平),随着年龄的变大呈现先降后升高的趋势,在30~39岁和40~49岁两个年龄段,年龄分布比例存在了显著的转折变化,在这两个年龄段里的中年用户,对“古建筑”的关注度相对于其他年龄较低。
	另外,小于19岁和40~49岁人群,“古建筑”搜索指数与全网分布的比值差异较大。比如,小于19岁的全网用户虽然比例只有15.09%,但是“古建筑”搜索指数比例达到23.68%,我们是不是可以认为,现在有更多的青少年正在关注和学习“古建筑”!
	使用百度的全网用户,性别比例基本持平,男性略高于女性。不过,“古建筑”检索指数,男性远高于女性,约为1.5倍。性别分布TGI反映了性别差异造成的用户对“古建筑”的关注差异,男性用户“古建筑”搜索指数的TGI为116.99。
	搜索“古建筑”的人,休闲爱好集中在美术、摄影、手册、DIY手工、书法等,书籍阅读集中在文学、人文社科和科技。
	03大家在检索哪些古建筑?
	那么,人们在关注“古建筑”的哪些内容呢?我们从“古建筑”需求图谱中延展找出相关词,得到一个2019年全年的古建筑相关词词云。
	百度指数通过用户在搜索“古建筑”的前后的搜索行为变化中表现出来的相关检索词,得到一系列拓展图谱,每一周,都有不同的关键字上榜。

 
	根据关键字的不同,我们再将关键词分成三类:
	A类:涉及古建筑名、地名的关键词;
	B类:涉及古建筑类型;
	C类:古建筑构件。
	如此,全年关键词的分布便清晰了很多。比如网红城市成都、西安、重庆等,让“四川古建筑”、“成都古建筑”频频上榜。
	对于古建筑的知识,大家在构件上搜索最多的是“屋顶”、“彩绘”、“斗拱”。而在建筑类型上,用户普遍喜欢搜索民居、牌坊、寺庙等类型,值得一提的是民居上,用户对
 
名人故居的搜索频率极高,2019年诸如梁思成林徽因故居、齐白石故居等多次上榜。
	04十大最受关注的古建筑
	百度指数提供了关键词的搜索指数、资讯指数和媒体指数,我们选取了30个相关“古建筑”,整理了全年的日均指数情况。
	搜索指数:以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权;
	资讯指数:以百度智能分发和推荐内容数据为基础,将网民的阅读、评论、转发、点赞、不喜欢等行为的数量加权求和得出;
	媒体指数:以各大互联网媒体报道的新闻中,与关键词相关的,被百度新闻频道收录的数量,采用新闻标题包含关键词的统计标准。
	为了比便于比较和排序,我们按照加权公式进行计算得到一个值K,其中由于“搜索指数”是网民主动搜索相关关键字,我们在计算加权的时候着重给予加权。 
	1长城 
	2巴黎圣母院 
	3故宫 
	4 乌镇 
	5 圆明园 
	6 丽江古城 
	7 颐和园 
	8 敦煌 
	9 秦始皇陵 
	10 大理古城