Title基于自动构建术语分类体系的公司划分研究——以新三板公司主营业务概念为例
Other TitlesThe Study of Company Screening Method Based on Automatic Taxonomy Construction
Authors黄文彬
白浩东
Affiliation北京大学信息管理系
Keywords投资分析
术语分类体系
文本挖掘
investment field
taxonomy construction
text mining
Issue Date24-May-2021
Publisher情报学报
Abstract在股权交易市场中,投资人对科学有效地发现新三板市场中,从事特定业务的公司集合的需求日益增长。新三板挂牌公司具有业务范围小、创新性高和交叉性强的特性,投资人依据主营业务找出业务相关或相似的公司集合,并进行对比分析是极为困难的工作。本文提出基于自动构建术语分类体系的方法,得到具有层次结构的公司划分结果,帮助投资人快速找到投资标的与理解公司间业务的关联。本文利用半监督方法从新三板公司年度报告的商业模式文本数据中抽取出业务术语,并根据术语相似度聚类建立术语分类体系,最后,利用公司所含业务术语决定所有公司划分的结果。本文的研究结果可以服务投资人发现股权交易市场中主流业务概念,明确概念与业务之间的映射关联,并作为选股的依据。
在股权交易市场中,投资人对科学有效地发现新三板市场中,从事特定业务的公司集合的需求日益增长。新三板挂牌公司具有业务范围小、创新性高和交叉性强的特性,投资人依据主营业务找出业务相关或相似的公司集合,并进行对比分析是极为困难的工作。本文提出基于自动构建术语分类体系的方法,得到具有层次结构的公司划分结果,帮助投资人快速找到投资标的与理解公司间业务的关联。本文利用半监督方法从新三板公司年度报告的商业模式文本数据中抽取出业务术语,并根据术语相似度聚类建立术语分类体系,最后,利用公司所含业务术语决定所有公司划分的结果。本文的研究结果可以服务投资人发现股权交易市场中主流业务概念,明确概念与业务之间的映射关联,并作为选股的依据。
URIhttp://hdl.handle.net/20.500.11897/615205
ISSN1000-0135
Indexed中文核心期刊要目总览(PKU)
中国科学引文数据库(CSCD)
中国社会科学引文索引(CSSCI)
Appears in Collections:信息管理系

Files in This Work
There are no files associated with this item.

Web of Science®



Checked on Last Week

百度学术™



Checked on Current Time




License: See PKU IR operational policies.