首页

在线投稿

在线选题

学者主页

学术机构

互知阅读

教研活动

开通VIP

登陆

浏览历史> 收藏> 个人中心>

全部

期刊

文献

标题

作者

单位

摘要

关键词

栏目

基金

文献检索

高级检索期刊导航

包含全部检索词

包含精确检索词

包含至少一个检索词

作者

出版物

发表时间

-

基于Bi-LSTM的医学文本分词模型

邵党国 黄初升 马磊 贺建峰 易三莉
昆明理工大学信息工程与自动化学院

中文分词（Chinese Word Segmentation,CWS）是自然语言处理（Natural Language Processing,NLP）中一项重要的基础任务。由于不同领域中文词汇的特殊性以及缺乏相关领域的标记数据，面向特定领域的分词任务是近年来中文分词研究面临的挑战之一。因此，提出了一种基于双向长短时记忆网络（Bidirectional Long Short-Term Memory,Bi-LSTM）的分词模型，其中分别使用了大规模的中文通用语料以及少量中文医学语料训练模型来构建这种全新的分词模型。该模型在仅使用少量中文医学领域标记数据的情况下，在该领域的分词任务上获得了较好的分词效果，实验结果中的最优F1值为95.54%，相比单独使用中文医学语料训练的分词模型，有比较明显的提升。

【栏　目】信息处理与传输

【分　类】工程技术

【关键词】中文分词自然语言处理双向长短期记忆网络领域分词

【出　处】《通信技术》2022年02期第151-159页（共9页）

【基　金】国家自然科学基金项目（61702069,61741112）~~

相关文献

陆庭辉；饶...：

针对隐匿高危勒索病毒攻击的检测

沈宜；郭先...：

数据智能在内容安全治理中的应用

陈群；吴郑...：

义务教育阶段免试就近入学分配策略研究——基于中文分词技术和贝...

教育传播与技术

开放试题巧设置,创新思维妙应用

中学生数理化·高考数学

初中数学教学中如何有效应用信息技术

文渊·小学版

从包豪斯的发展历史浅谈现代艺术对工业设计的影响

鞋类工艺与设计

小学语文识字教学策略探讨

重复经颅磁刺激技术在帕金森伴失眠患者中的应用及对症状评分、睡...

中国保健营养

魏江；杨佳...：

西方遇到东方：中国管理实践的认知偏狭性与反思

浅论农村初中生物教学的困境及对策

通信技术（2022年02期）

导出/参考文献

[1]邵党国，黄初升，马磊，贺建峰，易三莉. 基于Bi-LSTM的医学文本分词模型[J]. 通信技术 . 2022(02): 151-159. 点击复制

点击复制

PDF在线阅读

《基于Bi-LSTM的医学文本分词模型》

价格：0.00元

微信支付

支付宝支付

国家新闻出版总署

中国期刊协会

中国知网

互知教育

国家图书馆

国家版权局

中国记者网

中国文明网

中国农家书屋网

中国全民阅读网

关于我们版权公告客服中心在线咨询用户建议 PDF在线工具

Copyright © 2021-2024 全科互知 | 赣ICP备2021006197号-4 | 新出网证(赣)字20417号
赣公网安备 36012102000372号 | 赣B2-20210313 | 技术支持：道然科技

sasa

互知学术

sasa

全科互知