基于上下文相关字向量的中文命名实体识别

TP391.1; 命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类.由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据.为解决中文命名实体识别任务中因缺乏大规模标注语料而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问题,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能.同时,为解决命名实体识别中的未登录词问题,文中提出了基于字语言模型的中文NER系统.把语言模型学习到的字向量作为NER模型的输入,使得同一中文汉字在不同语境中有不同的表示.文中在6个中文NER数据集上进行...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:计算机科学 Jg. 48; H. 3; S. 233 - 238
Hauptverfasser: 张栋, 陈文亮
Format: Journal Article
Sprache:Chinesisch
Veröffentlicht: 苏州大学计算机科学与技术学院 江苏 苏州 215006 15.03.2021
Schlagworte:
ISSN:1002-137X
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Abstract TP391.1; 命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类.由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据.为解决中文命名实体识别任务中因缺乏大规模标注语料而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问题,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能.同时,为解决命名实体识别中的未登录词问题,文中提出了基于字语言模型的中文NER系统.把语言模型学习到的字向量作为NER模型的输入,使得同一中文汉字在不同语境中有不同的表示.文中在6个中文NER数据集上进行了实验.实验结果表明,基于上下文相关的字向量可以很好地提升NER模型的性能,其平均性能F1值提升了4.95%.对实验结果进行进一步分析发现,新系统在OOV实体识别上也可以取得很好的效果,同时对一些特殊类型的中文实体识别也有不错的表现.
AbstractList TP391.1; 命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类.由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据.为解决中文命名实体识别任务中因缺乏大规模标注语料而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问题,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能.同时,为解决命名实体识别中的未登录词问题,文中提出了基于字语言模型的中文NER系统.把语言模型学习到的字向量作为NER模型的输入,使得同一中文汉字在不同语境中有不同的表示.文中在6个中文NER数据集上进行了实验.实验结果表明,基于上下文相关的字向量可以很好地提升NER模型的性能,其平均性能F1值提升了4.95%.对实验结果进行进一步分析发现,新系统在OOV实体识别上也可以取得很好的效果,同时对一些特殊类型的中文实体识别也有不错的表现.
Author 张栋
陈文亮
AuthorAffiliation 苏州大学计算机科学与技术学院 江苏 苏州 215006
AuthorAffiliation_xml – name: 苏州大学计算机科学与技术学院 江苏 苏州 215006
Author_FL CHEN Wen-liang
ZHANG Dong
Author_FL_xml – sequence: 1
  fullname: ZHANG Dong
– sequence: 2
  fullname: CHEN Wen-liang
Author_xml – sequence: 1
  fullname: 张栋
– sequence: 2
  fullname: 陈文亮
BookMark eNotj81KAzEUhbOoYK3d-wTupt6bTGaapRT_oOBGwV3JJBNxlBQcRB9ArShqi6BgoT6AVBduhkLfJrH6Fg4qZ3HgLL6Ps0AqtmtTQpYQGohNEa1keXZ41kCBFADisEKqCEADZPHePKnn-UEClEVhGawS4V8mbnLnimtX3Hw-9mbDwl98-PGT7w--e_ez53NXjMvdD6a-f-vfRm768PV-6a9eF8mckUd5Wv_vGtldX9tpbQbt7Y2t1mo7yBEYBhJBK8EwNZrzUCihm4ZS4HGUMC6l0oLxyIDkQMHERjNNExUlIjU8kSqMWY0s_3FPpTXS7ney7smxLY2d36MUaOkpTewHFFxfAw
ClassificationCodes TP391.1
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.11896/jsjkx.191200074
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Computer Science
DocumentTitle_FL Chinese Named Entity Recognition Based on Contextualized Char Embeddings
EndPage 238
ExternalDocumentID jsjkx202103031
GrantInformation_xml – fundername: 国家自然科学基金
  funderid: (61876115)
GroupedDBID -0Y
2B.
4A8
5XA
5XJ
92H
92I
93N
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
CW9
GROUPED_DOAJ
PSX
TCJ
TGT
U1G
U5S
ID FETCH-LOGICAL-s1031-a10dc931efd5549c9d8f220576b35aacd9356f0a5020f7fd3d2bc6b9ef5bac473
ISSN 1002-137X
IngestDate Thu May 29 04:00:13 EDT 2025
IsPeerReviewed false
IsScholarly true
Issue 3
Keywords 命名实体识别
语言模型
上下文相关字向量
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1031-a10dc931efd5549c9d8f220576b35aacd9356f0a5020f7fd3d2bc6b9ef5bac473
PageCount 6
ParticipantIDs wanfang_journals_jsjkx202103031
PublicationCentury 2000
PublicationDate 2021-03-15
PublicationDateYYYYMMDD 2021-03-15
PublicationDate_xml – month: 03
  year: 2021
  text: 2021-03-15
  day: 15
PublicationDecade 2020
PublicationTitle 计算机科学
PublicationTitle_FL Computer Science
PublicationYear 2021
Publisher 苏州大学计算机科学与技术学院 江苏 苏州 215006
Publisher_xml – name: 苏州大学计算机科学与技术学院 江苏 苏州 215006
SSID ssib023646461
ssib051375750
ssib001164759
ssj0057673
Score 2.319471
Snippet TP391.1; 命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类.由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据.为解决中文命...
SourceID wanfang
SourceType Aggregation Database
StartPage 233
Title 基于上下文相关字向量的中文命名实体识别
URI https://d.wanfangdata.com.cn/periodical/jsjkx202103031
Volume 48
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVAON
  databaseName: DOAJ: Directory of Open Access Journal (DOAJ)
  issn: 1002-137X
  databaseCode: DOA
  dateStart: 20210101
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://www.doaj.org/
  omitProxy: false
  ssIdentifier: ssj0057673
  providerName: Directory of Open Access Journals
link http://cvtisr.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwtV3NbtQwELZK4cCFf8Q_e8CnVcBJnNg-JtusOKCKQ5H2VjmJA7QooG6pVpyBIhDQCgkkkOABUOHAZVWpb7Oh8BaMnWQT6AF64GKN7PHMZ88mM_bGY4Su2EmSEiWpRWTsWDSW0oqJqyzwRTJhXEpa5pm9webn-WAgbs4ciOuzMGv3WJ7z0Ug8-K-mhjowtj46uw9zT4VCBdBgdCjB7FD-k-Fx5GHRx2GAI6pLHhmCYx7URIgjHwsfc4YjhkWoK6EX93DoaiKYw4IZOQQLG0dCc_K-YQaBtJIDbI0cT3OGc1UvboggwqLUDgJBMnTpY-4bXUCH7cjYtEY4sLUW3ZEZ4T0zEKhhBonBFkx3E3VF2MMB0bxQ8rBpEVgIraaBaKYjiNobHY750qs86ml-mhoGzI8eLIhmBj8opRpArX1fUOs5jzQPmICTijnot3gM2MDp6rbQ1varcXT3IupCAEWI3_In5u4Ylw3aDofy1oPltr1HmROkCkScMu3NXh_Hhd5vWRouLY-uwnLbMXFg48-nX1kaDj2T8CLXqQYOOswTvLXtYEJmnVCuCWn1fQJ-K8WgB-Ahoid1dAPLU1YeWqkGVv_1D6Cu_QHJnIPLM5nfboVsC8fQkWqt1QnKZ-Q4mnl05wQ6Wt9j0qnc2kkkik_bk-1Xk_HzyfjF97frux_GxZNvxda7YmPz5_rr3fePJ-MtqC82d4qNl8WXj5OdNz--Pi2efT6FbvWjhd51q7pSxBrq-0wsaZM0Ea6tshTiaJGIlGf6qDnzY9eTMkmF6_kZkR6sojKWpW7qxIkfC5V5sUwoc0-j2fx-rs6gjpC2UpSLVJCUuooKqhT3YjfJmEpi3zmLLlejX6zeDsPF3y1y7q8c59Hh5km4gGZXVx6qi-hQsrZ6d7hyyRjyFzvAi0Y
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E4%B8%8A%E4%B8%8B%E6%96%87%E7%9B%B8%E5%85%B3%E5%AD%97%E5%90%91%E9%87%8F%E7%9A%84%E4%B8%AD%E6%96%87%E5%91%BD%E5%90%8D%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6&rft.au=%E5%BC%A0%E6%A0%8B&rft.au=%E9%99%88%E6%96%87%E4%BA%AE&rft.date=2021-03-15&rft.pub=%E8%8B%8F%E5%B7%9E%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2+%E6%B1%9F%E8%8B%8F+%E8%8B%8F%E5%B7%9E+215006&rft.issn=1002-137X&rft.volume=48&rft.issue=3&rft.spage=233&rft.epage=238&rft_id=info:doi/10.11896%2Fjsjkx.191200074&rft.externalDocID=jsjkx202103031
thumbnail_s http://cvtisr.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjkx%2Fjsjkx.jpg