概要

整合计算机语言和社交网络分析,在在线社区中捕捉成瘾恢复资本

Published: May 31, 2019
doi:

概要

本文描述了一种分析动态在线社交互动(在线环境中)的新方法,其例证是研究从酒精和毒瘾中恢复的在线社区。

Abstract

本文介绍了一种新方法,旨在找到一种全面、不显眼和准确的方法,以捕捉在线社区从酒精和毒品成瘾中恢复的社会恢复资本发展。恢复资本的概念是参与在线恢复社区和与社区的认同。为了衡量恢复资本的发展,自然发生的数据从特定恢复计划的社交媒体页面提取,该页面被设置为面对面恢复计划的资源。为了映射与在线社区的参与度,进行了社交网络分析 (SNA) 捕获在线社交互动。社会互动是通过由项目客户、工作人员和更广泛的社区的支持者代表的在线社区的在线贡献者/成员之间的联系来衡量的。为了捕捉与在线社区的社会认同标记,对文本数据(帖子和评论的内容)进行了计算机化的语言分析。以这种方式捕获的回收资本根据保留数据(代理结果指标)作为(面对面)恢复计划中花费的天数进行分析。提取的在线数据与参与者数据链接有关程序保留,以测试关键恢复结果的预测。这种办法允许审查在线支助社区的作用,并评估恢复资本(通过恢复在线社区开发)与恢复结果之间的联系。

Introduction

所展示的方法旨在捕获酒精和其他药物 (AOD) 成瘾恢复资本在在线环境中。在成瘾领域,回收资本被定义为”可以承担的药物滥用停止启动和维持的资源总额”1 。恢复资本主要通过自我报告2,3在面对面的情况下衡量。这种方法提供了一种替代方法,通过捕获在线恢复社区中在线交互的质量和数量来测量在线环境中的恢复资本。

鉴于在一系列与健康有关的问题上,以对口支援的形式使用在线资源的能力稳步增加,因此有必要开发新的方法来获取这些资源的质量。在线同侪支持以在线论坛和社区的社会互动形式出现。这些在线环境中的支持性社会互动有助于建立恢复资本,这反过来又对恢复过程产生了积极影响。与替代方法不同,该方法具有许多优点。首先,它克服了在成瘾研究中使用自我报告措施的一些限制,特别是在回忆和自我表现偏见方面。虽然自我报告措施被认为具有合理的可靠性和有效性,但它们容易受到偏见和不准确的影响。为提高准确性和尽量减少偏见,人们认识到,有必要增加使用旨在避免或尽量减少这些问题的新措施和数据收集情况。通过访问自然发生的数据,在不同恢复阶段的人自发地互动,并使用分析方法,可以从这些数据中提取有意义的信息(能够捕获心理状态的指标),社会可取性(自我表达)的偏见和召回限制的不准确之处可以减少甚至消除。第二,这种方法效率高,成本效益高,因为它依赖于提取现有的在线数据(即,在公开可公开获取的在线论坛中)。

接下来介绍的方法,应用于研究建立恢复资本的在线社区建立,以补充传统的,面对面的成瘾恢复计划,为成瘾者在早期恢复阶段。在这种情况下,联机(社交媒体)数据链接到程序保留数据,但该方法也可以在链接数据不可用或无法访问的情况下使用。

Protocol

这里描述的研究得到了谢菲尔德哈勒姆大学研究伦理学界的批准。 1. 设置 注:请参阅作为补充文件1提供的附加R脚本。 在 R. 包中加载所需的包(Rfacebook 9、dplyr 10、igraph11和 openxlsx12)是指允许用户分析、转换或提取数据的函数、数据集或编译代码。 从 CSV 文件将保留(外部)保留和用户数据作为数据帧加载到 R 中。注: 保留数据是指客户端参与脱机(传统)成瘾恢复计划的天数。它由(脱机)恢复程序的管理员提供,记录在 CSV 文件中,其中包含参与者姓名和参与该计划的天数。在导入到 R 之前,参与者名称被匿名 ID 号替换。 2. 从在线社区提取数据(成瘾恢复社区的社会页面) 注:此协议适用于社交媒体页面,但可以适用于不同类型的在线社区。在 Rfacebook 包中,它允许用户将数据从社交媒体页面提取到 R。 通过按照参考网站13上的指南创建社交媒体 (Facebook) 访问令牌。 在 R 中创建访问令牌。 使用 Rfacebook 的”getGroup”功能,从感兴趣的社区的社交媒体页面中提取数据(例如,帖子内容、每个帖子的评论次数和赞、每个帖子的唯一 ID 号等)。然后,此数据将保存为数据框。注: 数据框实质上是用于存储数据的 R 中的表。 使用 Rfacebook 的”getPosts”功能以及步骤 2.3 中提取的 Post ID 提取有关页面上帖子的数据。 使用 Rfacebook 的”getPosts”功能,以及步骤 2.3 中提取的 Post ID,提取每个帖子上的评论数据(例如,评论帖子的用户 ID、发表评论时收到的帖子数量)。然后,此数据将保存为数据框。 使用步骤 2.5 中提取的注释 ED,提取每个帖子上所做的”评论赞”的数据(例如,喜欢评论的用户的 ED)。然后,此数据将保存为数据框。 将帖子、帖子赞、评论和评论等数据合并到一个数据框架中。 添加每月细分(即第 1 到 8 个月)。 3. 计算每个客户制作和接收的社交媒体活动 计算每个客户的帖子、评论、赞和评论赞的数量。 计算每个客户收到的帖子、评论、赞和评论赞的数量。 将每个客户制作和接收的社交媒体活动的数据框架加入到保留数据框架中。 计算喜欢和不喜欢的帖子和评论之间的差异。 计算带有注释和没有注释的帖子之间的差异。 将赞差异数据加入保留数据。 将注释差异数据加入保留数据。 计算每个客户端所做的所有赞。 计算每个客户端收到的所有赞。 确定哪些用户没有参与社交媒体组(即没有活动)。 4. 进行社交网络分析 创建边列表。边缘列表是社交网络内的关系列表,在这种情况下,它基于 1) 喜欢帖子和评论,2) 评论帖子。这是通过查看数据集中的两列来完成的。第一列包含发布帖子的人员的匿名 ID,第二列包含喜欢或评论帖子的人的匿名 ID。 创建顶点列表。顶点列表是组中所有个人的列表。这是通过将关系列表中的两列转换为一列,并删除重复的匿名 ID,以便仅保留唯一的匿名 ID 来实现的。 使用 igraph 包中的”graph.data.frame”和”get.adjacency”函数,从边和顶点列表中创建图形和图形矩阵对象。 使用 igraph 包中的”度”和”中间”函数,获取在线组的网络统计信息(度和间)。 5. 在《世界妇女研究会议》中进行计算机化的语言分析 将文本社交媒体数据(即帖子和评论)和发布/评论 ID 列导出到 CSV 文件中。 将文本社交媒体数据的 CSV 文件导入语言查询字数 (LIWC) 软件。 生成 LIWC 类别并保存到新的 CSV 文件。为此,请单击”分析文本”,然后单击”Excel/CSV 文件”,然后单击包含帖子和注释的列以选择要分析的文本。LIWC 完成对文本数据的分析后,将输出另存为新 CSV 文件。 将 LIWC 结果 CSV 文件导入 R,并与现有数据合并。数据由 LIWC 和现有数据框中存在后/注释 ID 列匹配。 在帖子和评论中计算每个用户的 LIWC 总分,然后加入保留数据。 计算所有文本数据(帖子和注释组合)中每个用户的 LIWC 总分,然后加入保留数据。 从保留数据帧中删除 N。 6. 进行回归分析(确定与在线社区的参与指标是否预测离线恢复计划的保留率) 定义独立的变量。 使用基 R 中的”lm”函数,使用保留数据作为因变量进行线性回归分析,将 LIWC 类别、注释、帖子赞和注释等作为独立变量进行。 将回归分析结果合并到一个数据框架中。 7. 创建每月国民账户体系地图 为 SNA 地图准备数据框。 根据每月累积的社交媒体活动创建边缘列表。 根据每月累积的社交媒体活动创建顶点列表。 根据每月累积的社交媒体活动创建图形和图形矩阵。 根据累积的社交媒体活动设置 SNA 地图的布局。 根据用户角色添加颜色。 创建 SNA 映射并将其保存到文件中。 8. 计算社交媒体组的每月累积社交媒体活动 按员工、客户和社交媒体组其他成员计算每月累积的社交媒体活动。 计算社交媒体组所有成员的每月累积社交媒体活动。 将每月累积的社交媒体活动数据框架加入在一起。

Representative Results

使用这种方法取得的代表性结果的详细描述,可以在我们最近的工作14中找到,这项工作得到了进行研究的机构的研究伦理委员会的审查和充分批准。在本文描述的报告中,该研究调查了在线参与恢复社区是否有助于通过恢复资本建设(在线社会互动的水平和质量提高和积极的身份发展)。换句话说,该研究考察了在线恢复资本指标是否在评估的八个月中发展,并预测在旨在促进成瘾者在早期阶段的社区参与的恢复计划中保留恢复。 为了绘制参与者在线互动方式,使用从恢复社区的社交媒体页面 (n = 609) 中提取的数据进行了社交网络分析 (SNA)。图1给出了社交网络及其演变的可视化表现。该图显示了每月以在线社区中所有参与者之间的联系(即评论帖子、喜欢帖子和喜欢评论)的形式观察在线社区中的活动,为期 8 个月。网络中的”代理”的连接数决定了它们在社交网络中的中心程度。采用计算机化的语言分析来评估文本数据(捕获社会身份标记),并进行了线性回归分析,以确定恢复资本预测计划保留的指标是否。这些分析表明,计划保留确实由以下形式预测:(a) 以评论赞和在社交媒体页面上收到的所有赞的形式收到的组验证级别,(b) 在社交网络(网络中心)中的位置,以及 (c) 组身份和成就(由在线交流的语言内容所捕获)。研究结果支持了这样一种观点,即总体而言,在线恢复社区成员之间的积极社会互动支持恢复过程。下文概述了这些调查结果。 图1:8个月以上在线社区社交网络的每月表现表明参与者之间社会互动模式的变化。这些表示说明,在开始时,联机社区中的大多数客户端成员(脱机恢复程序的客户端)大多断开连接,并且只有少量客户端驱动联机活动。但是,这逐渐改变,因此,8 个月后,客户端是最连接(因此最中心),在网络中连接数量最多(图改编自以前的出版物)14。请点击此处查看此图的较大版本。 描述性统计 参与者与在线社区的参与度是通过计算在线社区中所有参与者的贡献(计算员工、客户和更广泛的社区成员的帖子、评论和赞数)来衡量的。表1按8个月(按每一类别参与人提供)的类别分列。 组成员 在线贡献类型 第 1 个月 第 2 个月 第 3 个月 第 4 个月 第 5 个月 第 6 个月 第 7 个月 第 8 个月 所有 帖子和评论 382 388 (770) 579 (1349) 369 (1718) 530 (2248) 581 (2829) 796 (3625) 674 (4299) 帖子赞给定 1167 878 (2045) 1856 (3901) 1440 (5341) 1880 (7221) 1756 (8977) 2667 (11644) 1857 (13501) 注释赞给定 784 970 (1604) 825 (2429) 171 (2600) 634 (3234) 970 (4204) 825 (5029) 171 (5200) 员工 帖子和评论 129 106 (235) 170 (405) 96 (501) 185 (686) 176 (862) 227 (1089) 316 (1405) 帖子赞给定 188 147 (335) 302 (637) 209 (846) 385 (1231) 372 (1603) 567 (2170) 511 (2681) 注释赞给定 168 303 (471) 237 (708) 69 (777) 168 (945) 303 (1248) 237 (1485) 69 (1554) 客户 帖子和评论 145 155 (300) 214 (514) 132 (646) 208 (854) 286 (1140) 419 (1559) 253 (1812) 帖子赞给定 365 252 (617) 415 (1032) 303 (1335) 549 (1884) 529 (2413) 898 (3311) 576 (3887) 注释赞给定 143 318 (461) 235 (696) 33 (729) 143 (872) 318 (1190) 235 (1425) 33 (1458) 别人 帖子和评论 108 127 (235) 195 (430) 141 (571) 137 (708) 119 (827) 150 (977) 105 (1082) 帖子赞给定 614 479 (1093) 1139 (2232) 928 (3160) 946 (4106) 855 (4961) 1202 (6163) 770 (6933) 注释赞给定 473 349 (672) 353 (1025) 69 (1094) 323 (1417) 349 (1766) 353 (2119) 69 (2188) 表1:图中按类型(帖子和评论、喜欢给帖子和喜欢发表评论)在8个月内按类型(帖子和评论)显示的在线投稿数量。在线社区的成员被归类为工作人员(离线恢复计划雇用的支持人员)、客户(参与脱机恢复计划的恢复人员)和其他人(来自更广泛的社区)。 程序中保留的决定因素 检验了以下假设:(1) 计划保留应与回收资本发展指标(即反映在在线交互的数量和质量中)相关联,(2) 计划保留也应与身份变化指标(即积极恢复身份发展指标)。在线互动的数量由 a) 发布的帖子数量、b) 发表评论次数、c) 赞收到的帖子数、d) 收到赞的赞数以及 e) 收到的所有赞的数量表示。 为了确定在线交互的质量,分析了网络结构和语言内容。更具体地说,使用了来自社交网络分析(SNA)的度数和之间的系数,以及计算机化语言分析产生的正影响的语言指标。作为积极身份变化的指标(作为与恢复社区的识别),使用了”我们”和成就词(例如,尝试、目标、胜利等)的使用频率。最后,因变量(保留在程序中)由在程序中花费的总天数(此处为 86 天到 464 天)表示。如结果所示,在线互动和组内验证级别(如收到帖子和评论赞数所示)预测程序保留(表 2)。程序保留也通过标识标记进行预测(通过在帖子中使用代词”我们”以及帖子和评论中使用成就词捕获)。最后,如果参与者位于社交网络内(即中心程度),也是保留的一个重要方面(表2)。 变量 B 硒 ·* R2 收到评论赞 0.43 0.18 .47| 0.22 赞收到(全部) 0.08 0.03 .43| 0.18 类似注释的差异 1.09 0.5 .43| 0.19 网络程度 0.01 0 .43| 0.18 LIWC 我们 (邮政) 3.89 1.76 .43| 0.19 LIWC 成就(后) 0.56 0.26 .43| 0.18 LIWC 成就(全部) 0.14 0.07 .42| 0.17 表2:在线参与、网络统计和语言类别预测的保留时间。

Discussion

此处描述的方法基于一种测量在线组流程如何影响成瘾恢复计划中保留率的新方法。将这种方法应用于从成瘾中恢复的在线社区,发现有四个关键方面预测计划保留:高度参与在线社区,成为在线社交网络的中心,积极的影响表达与在线社区的其他成员沟通,并接受他人对网络14的贡献的验证。该方法获得的研究结果支持了现有的恢复理论模型。也就是说,复苏文献中的两个关键模型,即恢复15的社会认同模型和停止维持的社会认同模型16,都强调积极参与支持恢复。这两种模式都表明,增加对这类群体的认同和承诺有助于减少今后与使用群体的接触,并随后复发。

正如我们的研究所说明的,该方法使我们能够绘制出网络社区14个个体成员的恢复或变化轨迹。在线社交网络的可视化及其随时间的演变,可以提供关于在线社区成员从外围到网络中心移动的宝贵信息,反之亦然(网络中的这些移动表明与在线社区互动程度的变化)。在2017年的一项研究14中,对网络社区成员进行了访谈,这些成员在从网络外围到中心移动方面发生了最显著的变化,以此对基于SNA(计算机化)的发现进行三角分析。语言分析,以及针对保留数据的回归。未来的研究可能侧重于那些脱离网络社区的成员,那些从未参与过的人,或者更直接的结果衡量标准,如物质使用和再犯罪。此方法可以进一步微调,用于干预计划,例如,用于评估主持人在帮助论坛中的作用。

目前没有研究提供证据,说明此处描述的方法本身使用时的好处(所述方法与保留数据结合使用,并与与关键在线社区访谈的定性数据进行三角测量成员14),但这种方法可以提供准确和无偏见的数据,可以补充自我报告和其他措施在研究成瘾恢复。

该方法用于在社交媒体页面中检查在线社交互动,该页面是作为对标准面对面恢复计划的补充支持形式而建立的。但是,如果稍作更改,该方法可用于调查其他类型的在线社区(在线论坛、讨论组、聊天室、评论网站等)中的在线社交互动。这种方法的主要优点之一是,它可以适应并应用于任何在线社区戒毒社区以外的环境。例如,在我们自己的政治心理学研究中,我们使用类似的方法(从此处描述的方法开发)来捕获在线互动的质量以及极右在线社区成员之间这些交互的变化。实际上,该方法可以应用于任何在线社区,其中可以提取成员(作为社交网络链接)和语言内容之间的连接形式的数据。

然而,在访问和使用在线数据时,研究人员需要了解道德问题,有些问题适用于自我报告和其他类型的数据,有些一般是在线环境中遇到的。在这里描述的研究(这是谢菲尔德哈勒姆大学的研究伦理界批准),得到了管理恢复计划的组织的同意,并采取了严格的措施,以确保完全匿名开放社交媒体页面的参与者(例如,在线和保留数据匹配后,所有识别信息都从文件中删除,并且从可公开访问的在线通信中也没有使用潜在的自我识别报价)。

与该组织的密切沟通也确保项目参与者了解研究和研究结果,其中一名研究人员定期与小组会面,解释研究及其结果。但是,在其他情况下,如果在线社区与特定的离线程序无关,则可能更难确定应征求谁同意数据提取(尤其适用于非仲裁论坛,其中处于恢复中的人员寻求在线对等支持)。虽然将适用伦理研究的一般原则,但研究人员需要采用逐案处理的方法,以确保在线数据的提取和分析不会对参与者构成任何重大风险(例如,损害隐私)。

開示

The authors have nothing to disclose.

Acknowledgements

我们感谢英国乔布斯、朋友和之家的客户和员工,他们支持并同意参与我们的研究。

Materials

LIWC software Receptiviti https://liwc.wpengine.com/ computerised linguistic analysis software
R software n/a https://www.r-project.org/ free statistical and data visualisation sofware

参考文献

  1. Cloud, W., Granfield, R. Conceptualizing recovery capital: Expansion of a theoretical construct. Substance Use and Misuse. 43, 1971-1986 (2008).
  2. Best, D., et al. Mapping the recovery stories of drinkers and drug users in Glasgow: Quality of life and its associations with measures of recovery capital. Drug and Alcohol Review. 31 (3), 334-341 (2012).
  3. Laudet, A. B., White, W. L. Recovery capital as prospective predictor of sustained recovery, life satisfaction, and stress among former poly-substance users. Substance Use and Misuse. 43 (1), 27-54 (2008).
  4. Moorhead, S. A., et al. A new dimension of health care: systematic review of the uses, benefits, and limitations of social media for health communication. Journal of Medical Internet Research. 15, e85 (2013).
  5. White, M., Dorman, S. M. Receiving social support online: implications for health education. Health Education Research. 16, 693-707 (2001).
  6. Best, D., Bliuc, A. M., Iqbal, M., Upton, K., Hodgkins, S. Mapping social identity change in online networks of addiction recovery. Addiction Research and Theory. 26 (3), 163-173 (2018).
  7. Bliuc, A. M., Best, D., Beckwith, M., Iqbal, M. Online support communities in addiction recovery. Addiction, behavioral change and social identity: The path to resilience and recovery. , 137 (2016).
  8. Del Boca, F. K., Darkes, J. The validity of self‐reports of alcohol consumption: state of the science and challenges for research. 中毒. 98, 1-12 (2003).
  9. . Package ‘Rfacebook’ Available from: https://cran.r-project.org/web/packages/Rfacebook/Rfacebook.pdf (2017)
  10. . Package ‘dplyr’ Available from: https://cran.r-project.org/web/packages/dplyr/dplyr.pdf (2018)
  11. . Package ‘igraph’ Available from: https://cran.r-project.org/web/packages/igraph/igraph.pdf (2018)
  12. . Package ‘openxlsx’ Available from: https://cran.r-project.org/web/packages/openxlsx/openxlsx.pdf (2018)
  13. . How to get a Facebook access token which never expires Available from: https://smashballoon.com/custom-facebook-feed/access-token/ (2018)
  14. Bliuc, A. M., Best, D., Iqbal, M., Upton, K. Building addiction recovery capital through online participation in a recovery community. Social Science and Medicine. 193, 110-117 (2017).
  15. Best, D., et al. Overcoming alcohol and other drug addiction as a process of social identity transition: The Social Identity Model of Recovery (SIMOR). Addiction Research and Theory. 24, 111-123 (2016).
  16. Frings, D., Albery, I. P. The social identity model of cessation maintenance: Formulation and initial evidence. Addictive Behaviors. 44, 35-42 (2015).

Play Video

記事を引用
Bliuc, A., Iqbal, M., Best, D. Integrating Computerized Linguistic and Social Network Analyses to Capture Addiction Recovery Capital in an Online Community. J. Vis. Exp. (147), e58851, doi:10.3791/58851 (2019).

View Video