AI 助力精神健康诊断:新技术带来新希望

【川透社编译报道】人工智能在精神健康诊断领域取得进展,通过分析语音声学特性诊断精神疾病,克服文本分析局限,有望改善诊断和治疗,但仍需进一步发展。

传统精神健康诊断面临诸多困境,患者与精神科医生直接交流虽理论可行,但在实际操作中存在严重缺陷,即预约时间可能长达数月,并且最终得到的诊断结果往往是主观的,缺乏客观性和准确性。这促使科学家探索自动化诊断方式,AI技术应运而生,为该领域带来新希望。

文本分析的局限性

以往,基于文本的AI技术如大型语言模型(LLMs)已被应用于精神健康诊断,可从转录访谈中搜寻语言模式和上下文线索来诊断心理障碍。然而,其局限性显著。文化差异、语言障碍及不同的语言流利程度均会干扰结果准确性。并且,LLMs存在语言偏见,甚至会“产生幻觉”,即生成看似合理实则错误的信息,这在对准确性要求极高的精神健康诊断领域极为不利,可能导致误诊,影响患者治疗。

新技术原理与应用潜力

针对这些问题,新的AI诊断方法崭露头角。中南民族大学研究人员开发的模型采用独特策略,不聚焦于患者所说的具体字词,而是专注于语音发声方式的细微变化。研究人员推测,抑郁患者可能存在人类难以察觉的独特说话特征。该模型先在大量语音记录上进行预训练,以掌握复杂音频模式,包括节奏、音高变化和声音质量等通常难以被人耳感知的变化。之后利用抑郁患者录音进行针对性微调,专门用于检测抑郁。这种方法在实验中展现出令人瞩目的准确性,在二分分类任务中检测抑郁的准确率达96%,对抑郁严重程度四级分类的准确率达95%。

巴黎索邦大学研究人员则另辟蹊径,开发出通过智能手机应用记录声波并转换为频谱图的方法。模型通过分析这些频谱图中的特征来检测多种精神健康状况,如抑郁、焦虑、失眠和疲劳等。

这些新技术的潜在应用价值巨大。声波分析使那些难以准确表述自身精神状态或处于痛苦中的患者能更便捷地接受评估。其跨语言特性有助于惠及更广泛人群,尤其在精神健康专业人员匮乏的农村地区,意义非凡。对于忙碌不堪的临床医生而言,语音分析有助于对患者进行分类筛选,并为居家治疗患者提供持续监测。

尽管目前取得了一定成果,但精神健康诊断后的个性化治疗同样关键。不同患者即便病情相同,症状困扰各异,所需治疗方案也不尽相同。例如,在抑郁症患者中,部分人可能受记忆力问题困扰,而其他人可能主要受疲劳影响。因此,未来这一充满前景的技术应致力于构建能帮助医生为患者量身定制治疗方案的AI模型,从而在精神健康领域发挥更大作用。【全文完】

来源:《经济学人》2024年10月5 日刊 | 作者:不详
原文标题:Sound of mind