课程作业：关于「Twitter 上的政治同质性」的两篇论文之评述

2020-04-02

以 Echo Chamber 为关键词在 Google Scholar 中进行搜索，筛选了其中的 Echo Chamber or Public Sphere? Predicting Political Orientation and Measuring Political Homophily in Twitter Using Big Data 和 Tweeting From Left to Right: Is Online Political Communication More Than an Echo Chamber? 两篇论文阅读，它们分别于2014 年和 2015 年被发表在 Journal of communication 及 Psychological science 上，两篇论文研究的对象都围绕着 Twitter 上的政治同质性，在研究内容和研究方法上有相似性。

Echo Chamber or Public Sphere? Predicting Political Orientation and Measuring Political Homophily in Twitter Using Big Data

作者首先指出了研究网络传播中的政治同质性的重要性，因为这决定了数字媒体是作为「公共场所」（public sphere）提供了多元观点和信息的交互，还是作为「回音壁」增强了公民的固有成见。

造成政治讨论中观点分裂的原因在于同质性（Homophily）：相似的个体更有可能形成联系，这里理论所体现的思想可追溯到 Festinger 著名的「认知失调理论」（cognitive dissonance and selective exposure theories）[^cognitive dissonance] 。正是因为同质性的存在，人际关系之间容易形成相似的世界观政治观，从而可能造成政治观点的极化（political polarization）。

随着 SNS 的流行，这些平台提供了实时的、跨越地理限制的讨论的可能性，这些新媒介上的信息传播可能形成两种截然不同的模式，即有助于信息和观点的广泛传播从而起到「公共领域」（Public Sphere）的作用，另一方面则可能因为用户对于信息的筛选而导致他们不断接触到同质化的内容，形成「回音壁」（Echo Chamber）。Twitter作为其中一个典型的平台，有着「公共领域」和「回音壁」的双重特性：一方面，因为用户发布的内容是公开的，所有人可见可转发，另外 hashtags and mentions (#, @) 使得对于某一话题的讨论无需用户之间双向关注或者建立群聊，所以有着新闻媒体（newsy medium）的特性，即作为公共领域提供讨论的空间；另一方面， Twitter 也和 Facebook 一样拥有社交媒介（social medium）的特性，即允许一种双向的、对称的关注关系，从而可能形成回音壁效应，固化个人的观点或政治倾向。

那么，Twitter 在政治领域是更像公共领域还是回音壁呢？这是作者关注的焦点，即 Twitter 对于政治同质性起到了怎样的影响。另外，此前的研究对于民主派和共和派在政治同质性上是否存在差异有所纷争，部分学者认为共和派在某些心理因素的影响下有着更高的同质性，而另外一些研究则认为两者没有差异或者恰好相反，作者希望通过对于 2009 年所有的 Twitter 用户的研究，对于上述问题进行回应。总之，本文探究的主要问题有二：

Twitter 作为新的媒介是遏制还是促进了政治同质性（political homophily）；
民主派和共和派在政治同质性上有何差异。

Method: textual+SNS

该文在方法上结合了基于机器学习的文本分析（machine learning-based analysis of textual content）和社交网络分析（social network analysis），对于分析 Twitter 作为一种政治传播的媒介提供了一套系统性的方法。

具体来说，作者分别基于不同的预先标注好的数据集训练出两个分类模型，其中使用 TF-IDF 对于语料进行编码；第一个分类器从测试数据集中找到政治文本，第二个分类器对于此政治文本是属于共和派还是民主派的观点进行区分；对于训练的结果用十折交叉验证（10-fold Cross-Validation）进行评估以验证其有效性。最后，根据用户所发 tweet 的性质对于其政治立场进行区分。

基于上述的机器学习算法，可以得到每个用户的标签（Republicans, Democrats, or nonpolitical），再根据用户之间的关注关系（网络，节点为用户，有向边为用户之间的关注关系），定义政治同质性为所有边中关注者和被关注者具有相同的政治倾向的那些边的比例。

Results: 不同角度

由于上述分类算法所得的共和派和民主派的人数不同，因此其政治同质性的基准是不同的；为此，根据每个的用户的关注数量、被关注数量等信息，可以计算出在没有政治偏好的情况下生成的网络的政治同质性，作为比较的基准（在下表中真实数据后的括号中标出）。

因为 Twitter 同时具有新闻媒体和社交媒介的双重属性，即是否是双向关注关系，作者将完整网络（general）中的双向关注的那部分和单向关注的部分抽取出来形成两个子网络（symmetric, nonsymmetric）。总的来看，双向网络中的政治同质性比单向网络中高出 16.1%，这说明，如果我们把 Twitter 看成是一个社交媒体而非新闻媒介，那么它更像是一个回音壁。

对于第二个问题，作者分别计算了那些被划分为民主派/共和派的 Twitter 用户的政治同质性（表 5），结果显示民主派似乎有着较高的政治同质性而共和派则更为开放。

注意到，上面的分类结果是基于用户所发表的 tweet 的，然而在美国社会中自由主义的思潮在社会文化上更占主流，因此单单从用户所发表的言论来看可能会产生偏差；或者说，我们仅仅能说该用户具有民主派的思想（“thinkers”）。为了得出更全面的结论，作者进行了第二组实验，筛选出所有用户中关注了民主党和共和党官方 Twitter 账户的那部分，重新计算其政治同质性。相较于之前的全部用户，这部分人清晰地表明了自己的党派归属，有理由相信这部分用户在政治活动和政治观点表达中更为积极，因此称其为活动者（“activists”）。结果如表 6 所示，有趣的是，这里的结果和上一次完全相反。

总结讨论如下：

对于 Twitter 更像是一个公共领域还是一个回音壁，这取决于我们如何分析这个媒体：如果我们把 Twitter 看做是一种新的社交媒体那么它更像是一个回音壁（高政治同质性），而如果我们将其认作是新的新闻媒体，则 Twitter 在一定程度上起到了公共领域的作用；
若我们从政治讨论的内容来看，民主派的思想者似乎比共和派的思想者有着更高的政治同质性；若我们仅关注那些有着明显的隶属关系（关注了党派的官方 Twitter 号）的用户，则可发现民主派的活动者比共和派的活动者有着更高的政治同质性；
作者对于上述现象给出了一定的解释：由于自由主义思想在美国文化中占据了更为主流的地位，因此这样的观点/用户更容易被浏览到/关注，所以在第一组结果中表现了更高的同质性；事实上共和派较之于民主派更多地关注了官方政党的 Twitter 号（分类为民主派的人数是共和派的 10 倍，而关注共和党官方 Twitter 号的人数却是民主党的 5 倍），在政治活动中表现得更为积极，所以在第二组结果中共和派显得更为同质化（在第一组结果中被低估了）。

Tweeting From Left to Right: Is Online Political Communication More Than an Echo Chamber?

这篇文章关注的领域同样是网络环境下的信息传播方式。作者指出，此前部分研究认为网络媒介可以带来信息的更广泛传播，从而促进公共讨论（public debate），而另外的一些研究则认为更简便更丰富的信息源反而会因为「选择性接受」（selective exposure）而造成「回音壁效应」，这种选择性的接受、观点的极化在政治领域中尤为显著。另外，对于自由主义者和保守主义者在信息的筛选上是否存在差异这一问题，不同的学者也有分歧，部分心理学家认为两者不存在差异而另一些则指出保守主义者出于心理上更排斥不确定性、威胁和社会冲突（uncertainty, threat, and social discord）而倾向于回音壁环境。总而言之，文章讨论了以下两个问题：

网络上的传播模式是更像回音壁（echo chamber）还是全国性讨论（national conversation），讨论的话题包括意识形态的隔离和极化（Ideological Segregation and Polarization）；
对于这种信息的选择性吸收和传播（selective exposure），意识形态的隔离和极化，在自由主义和保守主义者之间有着怎样的差异？

Method

在方法部分，该文综合了之前的几篇论文的思想，主要的逻辑是隐空间模型（latent space model）：该模型的目标是要学习到个人在一个隐式的社会空间中的位置，其认为这个位置可以根据该个体在社会网络中的连接关系来学习得到；背后的思想是「同质性」，即相似社会经济文化背景的人更有有关系（如朋友、社团等），这符合社会学中的理论，也与我们的日常经验相一致。形式上看，两个节点发生连接的概率为 \[ p(Y_{ij}=1|\alpha_i, \beta_j, d_{ij}) = Logistic(\alpha_i +\beta_j-d_{ij}) \] 即认为 \(i\) 和 \(j\) 之间发生联系的概率与两者之间的距离 \(d_{ij}\) 负相关，距离越远，说明两者之间的相似性越小，发生联系的可能也越小；其中的 \(\alpha_i\) 和 \(\beta_j\) 则是个体的信息，如在单向的关注网络中，前者表征个体 \(i\) 关注的账号数，后者表征个体 \(j\) 的粉丝数。在参数估计的方法，传统上有极大似然（MLE）和马尔可夫链蒙特卡洛方法（MCMC）等，考虑到本数据集较大，这里采用了对应分析法（Correspondence Analysis, CA）[^ca]，以减少待估计的隐性参数和计算复杂度。

具体来说，作者希望得到每个用户在自由主义-保守主义（liberal-conservative ）两级上的倾向，也即目标是一个一维数值；根据上面模型中各用户之间的相对位置可选定一个原点，然后再对数据进行标准化（使得均值为 0，方差为 1），即可得到所需的「liberal-conservative 系数」—— 0 代表中立而负值和正值分别代表自由主义和保守主义，绝对值表示政治立场的偏激程度。

注意到，不同于第一篇论文仅仅给出了用户政治倾向的分类，这里对于用户的倾向给出了一个更为细致的数值。在对用户打上标签之后，前一篇文章直接通过网络结构的信息对于政治同质化进行了研究；而在本文中，作者关注的则是不同类型的新闻话题的传播模式。为此，作者筛选了 2012-2014 年之间被广泛讨论的 12 个话题，包括 6 个政治话题和 6 个非政治话题（参见 图 2 ，不另行列出）；通过相应的关键词识别出讨论这些话题的 tweet，再利用这些 tweet 的转发关系对于意识形态的隔离和极化水平进行了分析。

Validation

本文对于上述模型所得的「liberal-conservative 系数」之效度进行了较为细致的探讨，从三个层次用可视化的方法进行了验证：

图 1a 横轴是美国各个州的平均 liberal-conservative 系数，纵轴是传统的基于调查和社会人口统计学的结果，可见两者有很高的相关性（\(r=.87\)），从平均的角度说明了该模型所得结果的有效性；
图 1b 展示了政府高层的系数和他们的 Roll-Call Vote 之间的关系，并根据不同的党派进行了标记，也可以看到两者之间高度相关（\(r=.95\)），说明至少对于这一部分人来说，该模型给出了较为理想的结果；
图 1c 以箱线图的形式展示了注册为共和党或民主党的那部分用户的 liberal-conservative 系数分布，箱子中包括了分位数在 \([.25,.75]\) 之间的样本，可以看到注册为共和党的那部分用户的系数大多大于零，而公民党的那部分则为负数，说明模型对于两类人起到了较好的区分作用。

Results

根据上述模型所得的结果，作者首先对于第一个问题进行了讨论：

Twitter 上的转发模式

对于每一个热点话题（包括 6 个政治性话题和 6 个非政治性话题），根据转发者和被转发者的 liberal-conservative 系数，对每一条被转发的 Twitter 进行分类，以热力图的形式进行展示（图 2 ），横轴表示被转发者的系数，而纵轴表示转发者的系数。在对角线上的颜色越深，说明对于这一话题的讨论意识形态隔离越为显著。

可以看到，对于政治类的话题， Twitter 用户倾向于转发与自己的政治观点相一致的内容，体现为图 2a 中较为明显的深色对角线。另外，保守主义者相较于自由主义者在意识形态的隔离上更为显著，例如，对于 2012 年大选和政府停摆这一话题，系数为较大正值的那部分用户（强烈保守主义倾向）集中地转发保守程度同样较高的用户的 tweet，体现为右上角集中的深色区域。然而，对于非政治话题来说（图 a2），这种意识形态的区隔相对来说就没有那么显著，例如对于 2014 年超级碗、冬奥会， Twitter 转发在意识形态上没有呈现出明显的区隔现象。

3a, 3b 两图从另一个角度对于上述现象进行了展示：这里用了 Force-directed Layout 算法进行可视化分析，将用户表示点，而转发关系则表示为边，该算法将各个用户映射到一个线性空间上，距离表示用户之间的相似度，相似的用户聚在一起形成「簇」（cluster, or clique）。图中的颜色深浅表示了 liberal-conservative 系数大小。这里选了2012 年大选和 2014 年超级碗的 Twitter 转发关系进行可视化，可以看到，对于前者，可视化结果出现了明显的两个「簇」，其中的成员分别代表了两种政治倾向；而对于后者来说，用户并没有显示出明显的大的类别，用户的转发模式更为分散，这与上面的「意识形态隔离与话题的类型有关」的结论是一致的。

意识形态同质化程度

作者又对于每个话题下的被转发者的平均 liberal-conservative 系数进行了计算并取绝对值，这一数值越高，说明对于这一话题的讨论，用户更倾向于传播那些政治观点更为强烈的 Twitter 账户的言论，也就表明对于这些话题的讨论更两极化（polarization），所得结果如图 3c 所示。

另外，在 Twitter 讨论中表现出来的观点极端化现象可能会因为某些原因而发生改变。以对于纽敦镇小学校园枪击事件[^shooting]的讨论为例，观察图 3d 中的紫色回归线，可见对于该事件的转发随着时间的推移呈现出极化程度增加的趋势。作者指出，这其中可能的原因是讨论的焦点从这场悲剧本身转为对于枪支控制这一政治性更强的话题中，讨论的方向的改变也引起了用户转发模式的变化，在这一案例中，Twitter 平台承担的身份从一个全国性的讨论空间（national conversation）转变为更接近于回音壁的空间。

其次，作者讨论了自由主义者和保守主义者在意识形态隔离和极化上的不同表现，即意识形态的不对称（ideological asymmetry）。图 4 展示了自由主义者和保守主义者在这 12 个话题上参与跨意识形态的讨论的程度，该数值越大，说明这些用户更有可能转发不同派别的用户的 tweet，从一定程度上表征了用户是否愿意接受更多元的观点。由下图可见：

对于所有的政治性话题，自由主义者相较于保守主义者更有可能参与到跨意识形态的传播中（cross-ideological）（蓝色点普遍在红色点的右侧）；
对于非政治性的话题，跨意识形态的传播更为频繁，即表现为下面的六个话题跨意识形态的传播程度更高；
自由主义者和保守主义者的这种不对称性在政治性话题中体现得更为显著，即蓝色和红色两点的距离在上面六个话题中更大。

Comparison

所选的两篇文章研究的对象都是 Twitter 网络上的关注关系或是转发关系，实质都是信息在这样的新的传播媒介中发生了怎样的传播，最终造成了怎样的结果，是促进还是阻碍了观点的交流，是否形成了不同政治立场的用户之间的隔离，或是政治观点或立场的极化。

在方法层面上，两篇文章都使用了大数据集和创新的数据处理方式，但又存在者很多的差异。第一篇文章从用户的 tweet 出发，采用了文本分类的机器学习算法，从而希望对于用户的政治倾向进行区分，在此之后才使用社会网络分析的方式对于政治同质化水平进行研究。而第二篇文章则没有使用文本信息，直接从一组初始化的账户开始，利用网络中的关注关系对于用户进行划分，并在此基础上进行后续的分析。我认为两种方法各有利弊，前者可以综合利用用户的文本信息从而对于用户的倾向有更为清晰的把握，而后者则完全从关注关系出发，对于信息的挖掘相对较少，但也避免了文本处理的计算复杂度和其中的偏差。另一方面，不同的分析方法可能是出于实现的可能性：Twitter 用户数量在 2013 年从 2009 年底的 0.18 亿增长到了 2.41 亿，而所发 tweet 的数量增长则更大，若要在 2015 年采用第一篇文章中所使用的基于文本分析的方法来对如此巨大的数据进行分析，所需要的算力更大，在操作上很难实现。

在内容方面，两者都关注到了政治同质性的问题，以及不同政治倾向的公众在同质性上的差异，分析的侧重点却不同。第一篇文章聚焦的点更为集中，强调的是用户在关注关系中所体现出来的政治同质性，分析了 Twitter 作为新的传播媒介在实质上是作为公共领域促进了政治讨论还是更像一个回音壁固化了用户的政治观点，并使用了两种测量维度对于共和派和民主派在政治同质化上表现进行了细致辩证的比较。不同于第一篇通过关注关系来对同质化进行分析，第二篇文章考虑的是用户的转发行为，是更为直接的传播方式。另外，第二篇文章比较了政治内容和非政治内容在传播模式上的区别，主要筛选了 12 个有代表性的公众话题并且对于传播过程中的隔离和极化现象分别进行了研究，并在其中引入了时间的维度。

在分析的方法上，第一篇文章更重视数值性的比较，偏重定量结果；而第二篇则使用了不同的方式对于问题的多个方面展开了讨论，尤其是其中使用了多种可视化的方法，结论更为直观。

我认为第一篇论文可以改进的地方包括：所选用的数据集偏旧，那时 Twitter 还处在发展过程中，其用户不能代表普遍的美国公众，从而产生偏差；此外，文中对于「思想者」和「活动者」的判断标准似过于简单，削弱了其结果的可信度。而对于第二篇论文，其用户分类方法完全基于网络结构，利用的信息偏少，除此之外可以利用更新的文本处理技术，并结合用户的账号信息对于用户的政治倾向进行更为细致的处理；另外，该分类算法需要一个初始化的账号集合，所选的代表性话题及其关键词也需要人工的筛选，这可能带来一定的偏差，为此可以考虑另外的手段来减少这种偏差，例如分析更多的话题，从而使结果更具有普遍性。

[^cognitive dissonance]: https://en.wikipedia.org/wiki/Cognitive_dissonance [^ca]: https://en.wikipedia.org/wiki/Correspondence_analysis [^shooting]: https://en.wikipedia.org/wiki/Sandy_Hook_Elementary_School_shooting