数据科学家发现,用 Instagram 诊断抑郁症更靠谱

“抑郁症,最恐怖的是,没有人相信你抑郁。他们会说你发神,会说是你自己想多了。”

不少人对抑郁症充满误解。遗憾的是,即使是医学上,人类对抑郁症也缺乏很深的理解,甚至,抑郁症的诊断都是个大问题。

媒体人张进从“双相情感障碍”痊愈后,一直关注抑郁症治疗领域的进展。他引用过 2010 年的一个数据:全国地市级以上非专科医院对抑郁症的识别率不到 20%,抑郁症误诊率高达 50%;即使在上海,综合医院的内科医生对抑郁症的识别率仅为 21%。

国外的数据也好不到哪儿去,有人分享了 118 份研究报告发现,抑郁症的正确诊断率只有 42%。

现在,对抑郁症的诊断主要依靠评定量表,它将病人的身体不适感、强迫症状、人际关系敏感、抑郁等感觉加以量化,用评分来确诊抑郁症(当然,量表之外,还需要精神科医生根据病人的当前状况、病史和症状,以及家庭病史,病人是否滥用酒精或药物等综合评定)。

最近,两位数据科学家发挥自己的专业优势,尝试了一种别处心裁的方法:用机器学习分析人们发布在 Instagram 上的照片,来帮助确诊抑郁症。他们在论文里说,这种方法的准确率达 70%。

Andrew G. Reecea 是哈佛大学的数据科学家,Christopher M. Danforth 则来自佛蒙特大学,他们的实验假设基于已有的研究成果:健康人会把暗色、灰色把负面情绪联系起来,而且更偏爱明亮、鲜艳的颜色,与之相反,抑郁症患者更偏爱暗色、灰色。另外,有研究显示,一个人身边灰色、暗色的增多,通常和他的抑郁症自我认知之间存在正相关。

选择 Instagram,是因为它很大程度上已经成了人们记录生活的平台。两位科学家分析了来自 166 位志愿者的 43950 张照片,分析对象包括照片的颜色、亮度、对比度、使用的滤镜、获得的点赞和评论,另外,他们还把照片中出现的人脸数量作为统计因素之一,因为抑郁症经常伴随着社交活动的减少。

研究发现,照片色彩增加,同时亮度、饱和度下降,通常预示着抑郁症。这意味着,抑郁症患者发布的照片更蓝、更暗,更灰。

另一个事实是,在 Instagram 上收到的评论越多,越有可能是抑郁症或者,相反的是,他们获得的赞相比普通人更少。

在全数据模型中,他们还发现,更高的发照片频率也预示着抑郁症。另外,抑郁症患者更愿意发送有人脸的照片,但是和普通人相比,他们的每张照片中的人脸数量更少。

最后,通过对滤镜的分析,两位数据科学家发现,和普通人相比,抑郁症人群更倾向于不使用任何滤镜。如果使用滤镜,“Inkwell 滤镜” 是他们的最爱,这个滤镜把照片变成黑白。相反,普通人最喜欢 Valencia 滤镜,它主要用来调亮照片的色彩。

instagram-filter

左边红色是健康人群对不同 Instagram 滤镜的偏爱程度,右边蓝色为抑郁症人群

 

Instagram 的 Inkwell 滤镜和 Valencia 滤镜

Instagram 的 Inkwell 滤镜和 Valencia 滤镜

现在的机器学习主要是监督学习,即从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。两位数据科学家为了验证数据模型的准确性,还找来了一些普通志愿者。他们事先不被告知任何相关信息,从 1-5 分为看到的照片在 4 个维度打分:高兴、悲伤、好感度、感兴趣程度。结果显示,在高兴和悲伤上,志愿者也基本能区分出抑郁症患者和普通人拍摄照片,但是在另外两个维度上,人工区分还是无法和机器模型相比。

另外,他们还用这个数据模型分析了抑郁症志愿者们第一次确诊前的照片,发现,在超过一半的时间里,它能够识别出“潜在”的抑郁症患者。

“使用这种研究方法的一大优势是,所有的研究对象都是计算机化的,所以,我们可以大规模地使用像素分析、人脸识别、元数据解析,而不用任何多余的人工输入。”

不过,他们也承认这种研究方法存在缺陷,最初参与的志愿者中,有 43% 的人出于隐私的考虑拒绝透露 Instagram 信息。另外,社交网络上流行的东西总是不断变化的,这样的社交网络研究模型也要随之不断改进。他们认为,这个模型不应被视为“不朽的事实”,但可以作为后续不断完善的研究模型的方法论基础。

订阅更多文章