分享至
当今世界已开发国家的人口结构皆趋向高龄化,少子化的问题再加上人口老化,使得每个人的抚养重担越发沉重,社会上长照的服务资源供不应求,越来越多高龄者无法获得良好的照护与陪伴,是否有什麽办法能够协助纾缓这样的困境呢?在情绪辨识技术与聊天机器人技术较为成熟的现在,或许我们能够将导入情绪辨识系统的聊天机器人投入在高龄照护的现场,但也必须注意的是,人类的情绪模式复杂而多变,情绪辨识系统依旧无法完全取代真人的陪伴,多多关心身边的高龄者仍是我们必须与应该做的事情。
撰文|王冠云
情绪辨识技术和聊天机器人如今各自已经发展到一定的程度。另一方面,面对高龄化社会的到来,高龄者们的心理及生理照护需求也不断地升高,因此研究者们便开始思考,该如何应用科技补足这块劳务需求及供给的缺口。将具有情绪辨识技术的聊天机器人导入高龄照护现场,可能就是解决方案之一。
情绪是什麽?如何教机器辨别?
在心理学上,情绪 (emotion) 的定义有很多种,最常使用的定义是「一种复杂的反应模式,包含实验性的、行为的、生理的成分」,常常混淆的词汇如感觉 (feelings) 和心情 (moods),情绪 (emotion) 这个词在学术上含有更多「反应」的意思,意指着个体在面对事情或状况时产生的心理反应。1970年代,知名心理学家Paul Eckman定义了人类的六种基本情绪:快乐 (happiness)、悲伤 (sadness)、厌恶 (disgust)、恐惧 (fear)、惊喜 (surprise)、愤怒 (anger)。至今仍有很多研究沿用这个定义,或是以这六种基本情绪为基础进行相关的理论延伸。
在情绪识别 (emotion recognition) 方面,目前主要有四种方法:脑波讯号处理、声音/语音处理、脸部动作处理、文本处理。脑波讯号方面,最常使用的就是EEG的资料,利用EEG脑电波,将讯号送入机器学习模型,再进行情绪分类;声音/语音处理的部分,则是利用语音讯号来进行分类;脸部动作的部分不只是脸部表情,也可能利用眼动追踪来进行情绪的识别;而文本分析则往往是利用社群媒体上丰富的贴文及文本材料,进行相关的分类。
将情绪辨识模型导入网页应用程式
Machová (2023) 等人的研究尝试结合了情绪辨识模型以及聊天机器人模型,让聊天机器人可以具备识别聊天对象情绪的能力。研究者们的出发点是为了因应现在高龄化社会照护陪伴的需求,尤其是现在有许多生理上的科技辅具,如电动轮椅、机械手臂等等,但却少有具备社交性或与心理层面相关的自动化工具,因此Machová等人便将研究聚焦於改良聊天机器人。
为了让聊天机器人更具社交性,也希望能应用於高龄者们的生活情境,Machová等人 (2023) 收集了在Kaggle上的文本资料,训练出了一个聊天机器人模型。不过,这个聊天机器人模型还以高龄者们的对话问答集以及情绪辨识模型作为修正回话的基础,所以它能够说出对高龄者们而言更得体的话,同时也照顾到他们的情绪。
更进一步的,这个聊天机器人也导入到网页应用程式中,Machová等人 (2023) 使用了Python的Flask架构,制作了网页应用程式,如此一来,可以更好地串接机器学习模型以及人机互动介面,而图形化使用者介面 (GUI) 则是使用Python的套件Tkinter来制作。
情绪辨识的准确率达到九成以上
Machová等人 (2023) 改造了Paul Eckman的六种基本情绪,定义聊天时常出现的情绪为快乐、悲伤、爱、恐惧、惊喜、愤怒,而经过他们反覆训练模型的结果,使用CNN和RNN (LSTM) 这两个模型所做的情绪分类表现是最好的。在他们的研究中,准确率 (accuracy) 可以达到91%。
这个具有9成以上准确率的情绪辨识模型导入到聊天机器人之後,也能有效的辨识对话内容的情绪,并且根据情绪与之交流。Machová等人 (2023) 在论文中也提供了一段聊天机器人与高龄者对话的例子,在那个对话例子中,总共有10处可供聊天机器人判断情绪的句子,虽然其中有2处聊天机器人判断情绪的结果稍有瑕疵,但仍然不影响对话输出。整体而言,加入了情绪辨识之後,仍然能让聊天机器人与高龄者建立更有效的对话。
文本存在多种情感时,对机器而言是个挑战
如上所述,在研究中,尽管聊天机器人几乎能因为情绪辨识而让对话更具有同理心,但是人类在说话时,会在同样的文本中夹杂的多种情感,所以情绪辨识模型也可能会出现模棱两可的分类结果。此外,虽然聊天机器人可以作为与老年人交流的手段,但是在看似正向的文本中,辨识出其中隐藏着的负面情绪,对於机器人而言相当困难。因此,聊天机器人可以为老年人提供娱乐性的陪伴,但负面情绪的辨别仍是个具有挑战性的课题。
研究者也提出,聊天机器人与人的沟通必须具有一定的敏感度,而且不应受意识形态控制和影响,这对於现今充满负面能量的网路世界而言是相当重要的。所以聊天机器人和人类的互动,应该特别需要注意情绪的检测,能更适当地提供更好的人机互动服务。
但是,Machová等人 (2023) 也提醒,目前研究仍然存在着对於情感方面的局限性,文本中若有讽刺、成语、或是比喻等等,这种不按照字面意思解释的语言,对於机器而言仍然相当难以理解。所以研究者建议,未来趋势在於开发「多模态系统」即「不只处理文本,也能处理图像和声音」的系统,多方应用各种情绪辨识的科学方法,结合在同一个系统中时,对於自动情绪侦测这个领域而言或许会有更大的帮助。
参考文献
- Machová, K., Szabóova, M., & Paralič, J, 2023, “Detection of emotion by text analysis using machine learning.”, Frontiers in Psychology, 14, 1190326.
✨