数据科学家发现，用 Instagram 诊断抑郁症更靠谱-品玩

“抑郁症，最恐怖的是，没有人相信你抑郁。他们会说你发神，会说是你自己想多了。”

不少人对抑郁症充满误解。遗憾的是，即使是医学上，人类对抑郁症也缺乏很深的理解，甚至，抑郁症的诊断都是个大问题。

媒体人张进从“双相情感障碍”痊愈后，一直关注抑郁症治疗领域的进展。他引用过 2010 年的一个数据：全国地市级以上非专科医院对抑郁症的识别率不到 20%，抑郁症误诊率高达 50%；即使在上海，综合医院的内科医生对抑郁症的识别率仅为 21％。

国外的数据也好不到哪儿去，有人分享了 118 份研究报告发现，抑郁症的正确诊断率只有 42%。

现在，对抑郁症的诊断主要依靠评定量表，它将病人的身体不适感、强迫症状、人际关系敏感、抑郁等感觉加以量化，用评分来确诊抑郁症（当然，量表之外，还需要精神科医生根据病人的当前状况、病史和症状，以及家庭病史，病人是否滥用酒精或药物等综合评定）。

最近，两位数据科学家发挥自己的专业优势，尝试了一种别处心裁的方法：用机器学习分析人们发布在 Instagram 上的照片，来帮助确诊抑郁症。他们在论文里说，这种方法的准确率达 70%。

Andrew G. Reecea 是哈佛大学的数据科学家，Christopher M. Danforth 则来自佛蒙特大学，他们的实验假设基于已有的研究成果：健康人会把暗色、灰色把负面情绪联系起来，而且更偏爱明亮、鲜艳的颜色，与之相反，抑郁症患者更偏爱暗色、灰色。另外，有研究显示，一个人身边灰色、暗色的增多，通常和他的抑郁症自我认知之间存在正相关。

选择 Instagram，是因为它很大程度上已经成了人们记录生活的平台。两位科学家分析了来自 166 位志愿者的 43950 张照片，分析对象包括照片的颜色、亮度、对比度、使用的滤镜、获得的点赞和评论，另外，他们还把照片中出现的人脸数量作为统计因素之一，因为抑郁症经常伴随着社交活动的减少。

研究发现，照片色彩增加，同时亮度、饱和度下降，通常预示着抑郁症。这意味着，抑郁症患者发布的照片更蓝、更暗，更灰。

另一个事实是，在 Instagram 上收到的评论越多，越有可能是抑郁症或者，相反的是，他们获得的赞相比普通人更少。

在全数据模型中，他们还发现，更高的发照片频率也预示着抑郁症。另外，抑郁症患者更愿意发送有人脸的照片，但是和普通人相比，他们的每张照片中的人脸数量更少。

最后，通过对滤镜的分析，两位数据科学家发现，和普通人相比，抑郁症人群更倾向于不使用任何滤镜。如果使用滤镜，“Inkwell 滤镜” 是他们的最爱，这个滤镜把照片变成黑白。相反，普通人最喜欢 Valencia 滤镜，它主要用来调亮照片的色彩。

左边红色是健康人群对不同 Instagram 滤镜的偏爱程度，右边蓝色为抑郁症人群

现在的机器学习主要是监督学习，即从给定的训练数据集中学习出一个函数，当新的数据到来时，可以根据这个函数预测结果。两位数据科学家为了验证数据模型的准确性，还找来了一些普通志愿者。他们事先不被告知任何相关信息，从 1-5 分为看到的照片在 4 个维度打分：高兴、悲伤、好感度、感兴趣程度。结果显示，在高兴和悲伤上，志愿者也基本能区分出抑郁症患者和普通人拍摄照片，但是在另外两个维度上，人工区分还是无法和机器模型相比。

另外，他们还用这个数据模型分析了抑郁症志愿者们第一次确诊前的照片，发现，在超过一半的时间里，它能够识别出“潜在”的抑郁症患者。

“使用这种研究方法的一大优势是，所有的研究对象都是计算机化的，所以，我们可以大规模地使用像素分析、人脸识别、元数据解析，而不用任何多余的人工输入。”

不过，他们也承认这种研究方法存在缺陷，最初参与的志愿者中，有 43% 的人出于隐私的考虑拒绝透露 Instagram 信息。另外，社交网络上流行的东西总是不断变化的，这样的社交网络研究模型也要随之不断改进。他们认为，这个模型不应被视为“不朽的事实”，但可以作为后续不断完善的研究模型的方法论基础。