“人大-新华”中国A股上市公司行业分类数据集
作者: 吴轲、应镇焜、钱宗鑫、周德馨
2026-05摘要: “人大-新华”A股上市公司行业分类数据集已于2026年3月正式发布并在新华财经数据终端上线,本数据集仅供学术研究及非商业用途使用。任何使用本数据集的研究成果(包括但不限于学术论文、研究报告、工作论文等),均需在参考文献中引用本文。
【数据范围】
样本时间区间:2007年—2023年
分类层级:一级行业26个、二级行业102个、三级行业271个
【字段说明】
本数据采用制表符(Tab)分隔,共包含五列:
- 股票代码:A股上市公司股票代码
- 年份:年报所属年度(YYYY)
- 一级行业分类:本数据集第一层级行业名称
- 二级行业分类:本数据集第二层级行业名称
- 三级行业分类:本数据集第三层级行业名称(采用其所属二级行业名称加罗马数字后缀的方式以示区分)
【使用说明与引用要求】
本数据集仅供学术研究及非商业用途使用。任何使用本数据集的研究成果(包括但不限于学术论文、研究报告、工作论文等),均需在参考文献中引用本文,引用格式如下:
中文引用格式:
吴轲、应镇焜、钱宗鑫、周德馨:《中国A股上市公司行业分类数据集构建——基于大语言模型的方法》,中国人民大学未来金融创新工程中心工作论文,2026年。
English Citation:
Wu, K., Ying, Z., Qian, Z., and Zhou, D., 2026, "Constructing an Industry Classification Dataset for Chinese A-share Listed Companies: A Large Language Model Approach", CFFI Working Paper.
数据集下载:
txt格式: 2007-2023人大-新华行业分类
excel格式: 2007-2023人大-新华行业分类