Title | 基于竞赛视角探讨文本语义匹配技术在中文医学文本领域中的应用 |
Other Titles | Discussion on the Application of Text Semantic Matching Technology in the Field of Chinese Medical Text from the Perspective of Competition |
Authors | 骆迅 倪渊 汤步洲 雷健波 |
Affiliation | 平安医疗科技有限公司 哈尔滨工业大学深圳研究院 北京大学医学信息学中心 |
Keywords | 自然语言处理 文本语义匹配 迁移学习 智慧医疗 NLP text semantic matching transfer learning wise medical |
Issue Date | 15-Nov-2021 |
Publisher | 中国数字医学 |
Abstract | 为促进语义匹配技术在智慧医疗的发展,第5届中国健康信息处理大会(CHIP2019)举办医疗文本迁移学习比赛,通过竞赛的方式比较分析不同模型的性能,研究语义匹配模型在医疗领域的应用情况。针对头部队伍的模型研究表明,BERT类模型F1值比传统深度学习模型平均高出4%~5%。其中,效果最好的是Roberta,单模F1值超过0.86,准确率接近90%,和人类水平相当。此外,加入疾病领域知识后,模型训练收敛更快,F1值能提升约1%。说明随着自然语言处理(NLP)技术的发展,传统深度学习模型已被BERT(bidirectional encoder representations from transformer)类模型全方位超越,基于迁移学习的BERT类模型可能会是智能医疗问答系统日后的发展趋势。 为促进语义匹配技术在智慧医疗的发展,第5届中国健康信息处理大会(CHIP2019)举办医疗文本迁移学习比赛,通过竞赛的方式比较分析不同模型的性能,研究语义匹配模型在医疗领域的应用情况。针对头部队伍的模型研究表明,BERT类模型F1值比传统深度学习模型平均高出4%~5%。其中,效果最好的是Roberta,单模F1值超过0.86,准确率接近90%,和人类水平相当。此外,加入疾病领域知识后,模型训练收敛更快,F1值能提升约1%。说明随着自然语言处理(NLP)技术的发展,传统深度学习模型已被BERT(bidirectional encoder representations from transformer)类模型全方位超越,基于迁移学习的BERT类模型可能会是智能医疗问答系统日后的发展趋势。 |
URI | http://hdl.handle.net/20.500.11897/633025 |
ISSN | 1673-7571 |
Appears in Collections: | 医学信息中心 |