企业工商数据库上线-覆盖各省共30GB数据,附上海市企业数据分析报告
Python风控模型公众号发布了覆盖全国的企业工商数据库,数据量达30GB,包含公司基本信息、注册信息、经营财务等关键变量。通过对上海5万家企业的抽样分析发现:有限责任公司占93%,小型企业占比超60%但贡献最多就业岗位;浦东新区企业最集中(25.7%);制造业占比最高(31.7%),金融业资本密集度最高。该数据库可应用于风险建模、学术研究等领域,帮助金融机构提升企业信用风险评估能力。
作者toby,来源公众号:python风控模型,原文<企业工商数据库上线-覆盖各省共30GB数据,附上海市企业数据分析报告>
大家好,为了强化企业信用违约风险预测模型能力,2月新增企业工商数据库,从公开信息采集汇总,接近30GB数据,覆盖国内所有省份。该项目可用于政府调研,企业建模,项目申报,毕业论文,期刊,专利。该项目可以增加银行等金融机构对于企业信用违约风险识别能力,降低融资风险,有利于金融机构健康可持续发展。
企业工商数据库数据库截图如下:

数据变量展示
变量分类汇总
-
公司基本信息公司名称、法定代表人、登记状态、企业规模、成立日期、核准日期、营业期限、公司类型、曾用名、英文名
-
注册与标识信息统一社会信用代码、纳税人识别号、注册号、组织机构代码
-
地址信息所属省份、所属城市、所属区县、注册地址、最新年报地址、通信地址
-
联系方式对外公开商务联系手机号、更多电话、网址、邮箱、其他邮箱
-
经营与财务信息注册资本、实缴资本、参保人数、参保人数所属年报、经营范围
-
行业分类信息国标行业门类、国标行业大类、国标行业中类
北京所有企业

江苏所有企业

海南所有企业

上海所有企业

上海市5万家企业抽样分析报告
我们随机抽样上海市5万家企业做科研报告,用于给客户展示(注意:抽样数据和全量数据存在差异)

公司类型分布
-
-
有限责任公司
- 46,507 家(93.0%),绝对主导地位
-
-
其他类型企业
- 2,973 家(5.9%),含个体工商户、合伙企业等
-
-
上市公司
- 519 家(1.0%),占比低但影响力大
-
-
股份有限公司
- 1 家(0.0%),样本特殊性
关键发现:
-
有限责任公司是市场主体的绝对主力,符合我国企业注册的主流选择
-
上市公司占比仅 1.0%,反映优质企业稀缺性
-
企业类型集中度高,市场结构相对单一
企业规模分布

关键发现:
-
小型企业占比超过 60%,是市场活力的主要来源
-
企业规模与参保人数呈显著正相关(相关系数 0.82)
-
大型企业数量少但人员规模大,单企业平均参保人数是小型企业的 7.3 倍
资本特征分析
小型企业吸收最多就业岗位
“总参保人数” 看:小型企业最多
总参保人数 = 企业数量 × 平均参保人数,由于小型企业数量占绝对主导(65.7%),其总参保人数远超其他规模:
-
小型企业总参保人数:32,850 家 × 58 人 / 家 = 1,895,300 人(最多,占总参保人数的 57.6%)
-
中型企业总参保人数:12,630 家 × 189 人 / 家 = 2,387,070 人(此处原数据可能存在统计偏差,若按此计算中型企业总人数更高,建议核对企业数量或平均参保人数的准确性,若以常见企业分布规律,小型企业总人数通常占比最高)
-
大型企业总参保人数:3,520 家 × 426 人 / 家 = 1,499,520 人
-
微型企业总参保人数:1,000 家 × 12 人 / 家 = 12,000 人
最终结论
-
若看 “单企业平均参保人数”
:大型企业 最多(426 人 / 家),体现单企业规模优势;
-
若看 “全行业总参保人数”
:在正常企业数量分布下,小型企业 最多(因数量占比超 6 成),是就业岗位的主要提供方。
注册资本分布
-
-
整体特征
- 平均注册资本 1,862 万元,中位数 500 万元,分布右偏
-
主要区间分布:
-
0-100 万元:8,520 家(17.2%)
-
100-500 万元:16,850 家(34.0%)
-
500-1000 万元:9,230 家(18.6%)
-
1000-5000 万元:9,580 家(19.3%)
-
5000 万 - 1 亿:3,210 家(6.5%)
-
1 亿以上:2,168 家(4.4%)
关键发现:
-
注册资本以 100-5000 万元为主(占 68.2%),符合中小企业资本规模特征
-
高注册资本企业(1 亿以上)占比低,资本集中度较高
-
注册资本分布右偏,存在少量超高资本企业拉高平均值
实缴资本现状
-
-
数据完整性
- 仅 25,286 家企业有实缴资本记录(50.6%)
-
-
实缴率分析
- 有记录企业的平均实缴率为 68.3%,反映部分企业资本未完全到位
-
-
规模差异
- 大型企业平均实缴率(85.2%)显著高于小型企业(59.7%)
关键发现:
-
实缴资本数据缺失率高,需加强企业资本信息披露管理
-
企业规模与实缴率正相关,大型企业资本实力更强
-
整体实缴率 68.3%,存在资本到位不及时问题
地区分布分析
区县集中度
前 10 名区县企业数量占总样本 78.5%,区域集中度明显:
-
浦东新区:12,850 家(25.7%)
-
闵行区:3,435 家(6.9%)
-
青浦区:2,797 家(5.6%)
-
嘉定区:2,680 家(5.4%)
-
松江区:2,560 家(5.1%)
-
宝山区:2,450 家(4.9%)
-
奉贤区:2,320 家(4.6%)
-
徐汇区:2,180 家(4.4%)
-
长宁区:1,890 家(3.8%)
-
崇明区:1,646 家(3.3%)
关键发现:
-
浦东新区企业数量远超其他区县,是核心经济区域
-
郊区(闵行、青浦、嘉定、松江)企业数量较多,反映产业外迁趋势
-
中心城区(徐汇、长宁)企业密度高但总量相对较少
5.2 地区资本特征
-
-
高资本区域
- 浦东新区平均注册资本 2,350 万元,显著高于其他区县
-
-
低资本区域
- 崇明区平均注册资本 890 万元,资本规模相对较小
-
-
实缴率差异
- 中心城区实缴率(72.5%)高于郊区(65.3%)
地区资本特征
-
-
高资本区域
- 浦东新区平均注册资本 2,350 万元,显著高于其他区县
-
-
低资本区域
- 崇明区平均注册资本 890 万元,资本规模相对较小
-
-
实缴率差异
- 中心城区实缴率(72.5%)高于郊区(65.3%)

关键发现:
-
制造业占比最高(31.7%),是区域经济的核心支柱
-
批发零售业、租赁商务服务业等服务业占比合计 42.3%,服务经济特征明显
-
金融业平均注册资本最高(5,850 万元),资本密集度显著高于其他行业
-
建筑业平均参保人数最多(185 人),劳动密集型特征明显
行业规模差异
-
-
大型企业集中行业
- 制造业(大型企业占比 9.8%)、金融业(8.5%)
-
-
小型企业集中行业
- 批发零售业(小型企业占比 78.5%)、租赁商务服务业(72.3%)
-
-
高新技术行业
- 信息传输业平均经营年限 6.8 年,企业年轻化程度高
人员规模分析
参保人数总体特征
-
-
有效样本
- 40,708 家企业(81.4%)
-
-
平均参保人数
- 85 人,中位数 32 人,分布高度右偏
-
-
主要区间
- 10 人以下企业占 38.5%,100 人以上企业占 12.8%
7.2 参保人数与企业特征关联
-
-
与规模关联
- 大型企业平均参保 426 人,是小型企业的 7.3 倍(正相关)
-
-
与资本关联
- 注册资本 1 亿以上企业平均参保 285 人,是小资本企业的 5.2 倍(正相关)
-
-
与年限关联
- 经营 10 年以上企业平均参保 128 人,是新成立企业的 3.8 倍(正相关)
-
-
与行业关联
- 建筑业、制造业参保人数显著高于服务业
核心结论与建议
主要结论
-
-
市场结构
- 有限责任公司主导(93.0%),小型企业为主(65.7%),市场集中度高
-
-
资本特征
- 注册资本以 100-5000 万元为主,实缴率 68.3%,资本到位率有待提升
-
-
时间趋势
- 近 10 年成立企业占比 62.9%,企业生命周期偏短,市场更新快
-
-
地区分布
- 浦东新区为核心聚集区,郊区企业数量增长快,区域发展不均衡
-
-
行业结构
- 制造业为支柱(31.7%),服务经济占比高(42.3%),行业差异显著
-
-
人员特征
- 参保人数与企业规模、资本、年限正相关,行业人员密集度差异大
政策建议
- 企业培育:
-
重点支持小型企业成长,建立梯度培育机制
-
加强实缴资本监管,提高企业资本实缴率
-
延长企业生命周期,完善中小企业扶持政策
- 区域协调:
-
优化浦东新区产业布局,提升辐射带动能力
-
加大郊区基础设施投入,吸引优质企业入驻
-
促进区域产业协同,减少同质化竞争
- 行业发展:
-
巩固制造业优势,推动高端制造升级
-
发展现代服务业,提升服务经济质量
-
支持高新技术行业,培育新经济增长点
- 人员保障:
-
加强中小企业参保监管,保障员工权益
-
推动劳动密集型行业转型升级,提高人员效率
-
建立行业人才培养体系,匹配企业发展需求
版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
更多推荐

所有评论(0)