用20亿Facebook用户数据,测量全球文化多样性
“文化”这个词,我们每天都在用,却很难说清楚它究竟是什么。是餐桌上的礼仪?是节日里的仪式?还是深植于心的价值观?对于社会科学家而言,文化是理解人类社会的核心钥匙,但如何准确地测量文化,却是一个困扰了学界百年的难题。
长期以来,我们测量文化主要依靠一种古老而笨拙的方法:问卷调查。研究人员需要设计成百上千个问题,挨家挨户地询问人们的信念、价值观和行为偏好。世界价值观调查(WVS)就是其中的集大成者,但它耗时耗力、成本高昂,每五年才能进行一次,覆盖的国家和人群也相对有限。更关键的是,在全球化飞速发展的今天,文化变迁的速度远超调查问卷的更新速度。我们就像是拿着一张五年前绘制的旧地图,试图在瞬息万变的城市里导航。
然而,一场静悄悄的革命正在发生。当我们每天在社交媒体上点赞、分享、关注自己感兴趣的话题时,我们其实正在以数字的方式书写着自己的文化偏好。这些海量的、实时生成的数字足迹,为科学家们提供了一个前所未有的机会:用大数据的方法,重新测量人类文化。
2022年,一项发表于《Journal of the Royal Society Interface》的研究,利用Facebook平台的数据,对全球225个国家和地区近20亿用户的文化偏好进行了分析(Obradovich et al.,2022)。该研究不仅规模空前,更在方法论和发现上彻底刷新了我们对文化认知的边界。
一、从“问卷调查”到“数字足迹”:文化测量的范式革新
文化研究的传统路径深受数据可用性的制约。历史上,学者们往往从“自上而下”的视角提炼文化维度,例如霍夫斯泰德的文化维度理论,将文化简化为权力距离、个人主义等少数可测量的特征。这些维度通过问卷调查(如世界价值观调查,WVS)收集数据,优势在于简洁且易于跨国比较,已支撑了无数关于经济增长和社会行为的研究。
然而,这种方法有明显短板:首先,选择哪些维度测量本身带有主观偏见,受研究者自身文化影响;其次,问卷数据容易受社会期望偏差干扰,受访者可能报告理想而非真实观点;最后,调查成本高昂,难以覆盖全球人口或实时更新,尤其在发展中国家。
早在2014年,Bail就曾指出,大数据时代允许我们从“自下而上”重构文化测量。Obradovich等(2022)正是以此为灵感,利用Facebook作为全球最大社交平台,收集用户兴趣数据。这些兴趣不是随意推断,而是基于用户自报、点赞、点击和离线行为(如GPS定位)生成的,涵盖近6万个维度,从传统主题如宗教到非传统如电子游戏。这项研究的创新在于,它将文化视为群体兴趣的向量分布,无需预设维度,让数据“说话”。
二、研究方法:用兴趣向量绘制全球文化地图
Obradovich等(2022)从2017年至2018年间,通过Facebook营销API采集数据,覆盖225个国家和地区,涉及约20亿用户。他们的研究方法清晰且严谨,主要分为三个核心步骤:
首先,构建全面的兴趣列表。研究团队使用维基百科英文标题和英文词典作为查询输入,生成约40万个兴趣ID,然后筛选出全球覆盖至少50万用户的近6万个兴趣。这些兴趣被组织成14个宏观类别,如“生活方式与文化”“体育与户外”等,确保兴趣维度的多样性和代表性。
其次,定义“Facebook文化距离”。两个地区之间的文化距离,被定义为其兴趣比例向量之间的余弦距离。选择余弦距离而非欧氏距离,是因为不同国家的向量模长存在非系统性差异——例如西班牙和意大利尽管在人口、经济发展和Facebook渗透率上相似,向量长度却差异显著。余弦距离只依赖向量间的夹角而不受模长影响,有效规避了这一问题。研究还报告了使用归一化欧氏距离和曼哈顿距离的结果,三种度量之间的相关系数均超过0.73,证实了方法选择对结论的影响很小。
三、核心研究结果:刷新对全球文化的认知
1. 与传统文化测量方法高度契合,且更具优势
研究者以69个同时被WVS和Facebook覆盖的国家为共同样本,计算了Facebook文化距离与五类传统距离代理指标(基于价值观的文化距离、语言距离、地理距离、宗教距离和遗传距离)之间的Pearson相关系数。结果显示,Facebook距离与基于WVS的价值观文化距离之间的相关系数达到0.54(p<0.0001),显著高于与其他距离指标的相关性。
更重要的是,偏相关分析表明,在控制了地理、语言、宗教和遗传距离之后,Facebook距离与WVS文化距离的偏相关系数仍然最强(约0.35),而与地理距离的偏相关系数则低于0.1且不显著。这说明Facebook捕捉到的确实是文化本身,而非仅仅反映了地理邻近或语言相似。
2. 文化维度远超传统问卷,细节更丰富
WVS跨国共用问题仅有约100个,而Facebook兴趣维度近60,000个——两者相差三个数量级。主成分分析(PCA)显示,要解释80%的国家间变异,WVS需要11个主成分,而Facebook则需要29个。这一结果提供了有力的暗示性证据:Facebook数据所覆盖的文化解释维度,远比传统问卷调查丰富,能够捕捉到更多细微的文化差异。
3. 对具体文化属性的预测能力突出
研究团队利用监督学习算法,以Facebook兴趣数据预测近50个具体文化属性——从慷慨程度到亲属关系紧密度,从不确定性规避到重男轻女倾向,从猪肉消费量到避孕率。预测值与观测值之间的平均相关系数达到0.59,当使用前20个主成分替代原始兴趣时,相关系数升至0.64。
其中一些预测表现尤为惊人:个人主义-集体主义的相关系数达到0.82,猪肉消费量达0.84,生育率达0.85,健康预期寿命达0.83,充分证明了Facebook用户兴趣数据对文化属性的强大预测能力。
4. 国家聚类与常识高度一致,贴合文化认知
利用Ward方差最小化层次聚类法对各国的Facebook文化向量进行无监督聚类,所得树状图与常识高度吻合:美国和加拿大紧密相邻,印度和孟加拉国聚在一处,德国和奥地利自然归为一类。值得注意的是,波多黎各尽管是美国领地,却更接近拉丁美洲国家簇;巴西和葡萄牙尽管地理距离遥远,却因语言纽带而聚为一体,这与现实中的文化关联高度契合。
四、关键发现:国界、社会裂痕与文化独特性
1. 国界线依然是塑造文化的最强力量
许多人直觉地认为,在全球化和社交媒体时代,文化差异应当主要沿着语言、经济发展水平或城市化程度分布,国界的作用已经式微。但这项研究的发现恰恰相反:在西班牙、法国、德国和意大利四国的亚国家区域分析中,任何一国内部各区域之间的文化距离,都远小于该区域与邻国之间的距离。
例如,加泰罗尼亚与西班牙其他任何区域的距离,都显著小于它与意大利或法国的距离——尽管巴塞罗那在地理上离法国南部比离西班牙南部更近。在所分析的全部欧洲亚国家区域中,几乎所有区域最近的文化邻居都在本国境内。
更具深意的是,在德国的13个联邦州中,社区检测算法识别出两个文化群落,其分界线几乎完美地映射了冷战时期的东西德分界线——这表明,统一三十年后,东西德之间的文化鸿沟仍然深刻地铭刻在德国人的日常兴趣偏好之中。在印度的34个邦和联邦属地中,算法检测出三个文化群落,大致对应印度三大语系的地理分布。
仅有两个例外:比利时的佛兰德斯和爱尔兰的多尼戈尔县,它们分别更接近荷兰和英国的某些区域。但这两个例外恰恰可以追溯到相对近期的国界变更——1830年代林堡省在比利时和荷兰之间的分割,以及1920年代爱尔兰的分治,进一步印证了国界对文化的塑造作用。
2. 性别、年龄与区域:社会裂痕的多维图谱
研究发现,不同发展水平的国家,社会裂痕的表现存在显著差异:在多数发达国家,性别之间的文化距离大于区域之间的文化距离;而在许多发展中国家,区域裂痕则远大于性别裂痕。
具体而言,在法国和德国,男女之间的文化距离大于国内任意两个区域之间的距离。但在印度和肯尼亚,区域差异的均值则远远超过性别差异——只不过也存在例外,比如印度北部相邻的北方邦和中央邦之间的区域距离就小于全国的性别距离。更耐人寻味的是,区域分裂度较高的国家往往性别分裂度较低(r=-0.702,p=0.001),暗示着这两种社会裂痕之间可能存在某种“替代效应”。
3. 文化独特性的细粒度呈现
在美国50个州的分析中,研究者定义了“文化异常值”——某个州中某一兴趣的渗透率至少是其他任何州的两倍。夏威夷拥有最多的文化异常值(147个),是第二名阿拉斯加(62个)的2.5倍。夏威夷的异常值清晰地反映了冲浪文化和太平洋-亚洲文化影响;路易斯安那州的异常值集中反映了卡津美食和新奥尔良的狂欢节传统;犹他州的异常值则鲜明地指向摩门教文化。这些发现展示了一种传统问卷几乎不可能捕捉的文化细粒度。
五、研究意义:重新打开文化研究的新空间
这项研究的价值不仅在于描绘了一幅前所未有的全球文化图谱,更在于它打开了一系列此前无法在大规模上进行定量研究的问题空间。国界如何塑造文化?社会更容易沿着性别、种族还是区域的断层线分裂?哪些地区更可能发生内部冲突?不同移民文化融入目的地社会的能力是否存在差异?某些群体对政治进程的疏离感是否与文化异质性有关?这些问题的回答,无一不需要此前不可得的高分辨率、大规模文化测量数据。
当然,任何试图将人类文化化约为数值的努力,都不可避免地面对简化甚至扭曲的风险。但正如一张地图永远无法等同于它所描绘的领土,一种测量工具的价值也不在于它是否完美,而在于它是否能帮助我们看到此前看不到的东西。从这个意义上说,当20亿人每天在社交平台上点赞、浏览、下载和分享时,他们无意中留下的数字足迹,已经构成了一面映照人类文化的镜子——虽然这面镜子并不完美,但它的广度、深度和分辨率,是任何问卷调查和田野考察都无法企及的。
参考文献:
Bail,C.A.(2014).The cultural environment:Measuring culture with big data.Theory and Society,43(3-4),465-482.
Obradovich,N.,et al.(2022).Expanding the measurement of culture with a sample of two billion humans.Journal of the Royal Society Interface,19(190),20220085.




![[足球新闻]场面震撼!越南队夺冠,球迷上街庆祝,韩国主帅被抛起摔到腰部](https://pic3.zhimg.com/80/v2-a016790609f52b7304bb2fb7814b59c2_720w.webp)
