# 英国议会政治数据集深度分析报告:1970年以来议员信息与议会演讲全量数据
## 引言与背景
本数据集包含三套核心文件,全面记录了1970年以来英国议会的政治活动信息,是研究英国政治史、议会运作机制、政党演变及政治演讲分析的宝贵资源。
数据集构成包括:1. MPs_1970_onwards.csv:记录了1970年至今英国议会下议院议员的基本信息,包含9605条记录,涵盖议员身份标识、姓名、选区、政党归属、任期起止时间等关键元数据。
2. speeches_bps.csv:收录了英国主要政党领袖在党代会上的重要演讲,共353条记录,包含演讲者姓名、日期、所属政党及完整演讲文本。
3. speeches_ukpol.csv:包含11852条英国议会演讲记录,时间跨度从1821年至2022年,涵盖议会辩论、首相质询、政策声明等多种场景的演讲内容。
这套数据集为政治科学研究、自然语言处理、机器学习等领域提供了丰富的语料资源,可用于政党立场分析、政治话语演变研究、演讲风格识别等多个研究方向。
---
## 数据基本信息
### 数据字段说明
#### MPs_1970_onwards.csv 字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| item | URL | 议员在Wikidata中的唯一标识 | http://www.wikidata.org/entity/Q265935 | 100% |
| itemLabel | 字符串 | 议员姓名 | Nick Brown | 100% |
| constituencyLabel | 字符串 | 选区名称 | Newcastle upon Tyne East | 99.8% |
| partyLabel | 字符串 | 政党名称 | Conservative Party | 98.5% |
| start | 日期时间 | 任期开始时间 | 2019-12-12T00:00:00Z | 100% |
| electionLabel | 字符串 | 当选选举名称 | 2019 United Kingdom general election | 85.2% |
| end | 日期时间 | 任期结束时间 | 2022-05-04T00:00:00Z | 32.1% |
| endcauseLabel | 字符串 | 任期结束原因 | resignation | 15.3% |
| noteLabel | 字符串 | 备注信息 | abstained from taking their seat | 2.1% |
#### speeches_bps.csv 字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| Speaker | 字符串 | 演讲者姓名 | Theresa May (Conservative) | 100% |
| Date | 字符串 | 演讲日期 | 03/10/2018 | 100% |
| Party | 字符串 | 所属政党 | Conservative | 100% |
| Speech | 文本 | 演讲全文 | Thank you very much for that warm welcome... | 100% |
#### speeches_ukpol.csv 字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| Speaker | 字符串 | 演讲者姓名 | Diane Abbott | 100% |
| Year | 数字 | 演讲年份 | 2018.0 | 78.3% |
| Description | 字符串 | 演讲描述 | Below is the text of the speech made by... | 99.5% |
| Speech | 文本 | 演讲全文 | None The fact that the House of Commons... | 100% |
---
### 数据分布情况
#### 政党分布(MPs数据集)
| 政党名称 | 记录数量 | 占比 |
|---------|---------|------|
| Conservative Party | 4,270 | 44.5% |
| Labour Party | 3,835 | 39.9% |
| Liberal Democrats | 319 | 3.3% |
| Labour Co-operative | 318 | 3.3% |
| Scottish National Party | 197 | 2.1% |
| independent politician | 142 | 1.5% |
| Ulster Unionist Party | 90 | 0.9% |
| Liberal Party | 90 | 0.9% |
| Democratic Unionist Party | 72 | 0.7% |
| Social Democratic Party | 46 | 0.5% |
#### 时间分布(MPs数据集)
| 年份 | 记录数量 | 占比 |
|------|---------|------|
| 2019 | 729 | 7.6% |
| 2017 | 660 | 6.9% |
| 2015 | 657 | 6.8% |
| 2022 | 16 | 0.2% |
| 2021 | 10 | 0.1% |
| 2018 | 14 | 0.1% |
| 2016 | 10 | 0.1% |
| 2014 | 7 | 0.1% |
| 2020 | 7 | 0.1% |
| 2013 | 9 | 0.1% |
#### 政党分布(speeches_bps数据集)
| 政党名称 | 记录数量 | 占比 |
|---------|---------|------|
| Labour | 123 | 34.8% |
| Conservative | 117 | 33.1% |
| Liberal Democrat | 65 | 18.4% |
| Liberal | 45 | 12.7% |
| SDP-Liberal Alliance | 3 | 0.8% |
#### 年份分布(speeches_ukpol数据集)
| 年份 | 记录数量 | 占比 |
|------|---------|------|
| 2022 | 2,933 | 24.7% |
| 2021 | 2,206 | 18.6% |
| 2020 | 1,742 | 14.7% |
| 2019 | 658 | 5.6% |
| 2018 | 407 | 3.4% |
| 2016 | 528 | 4.4% |
| 2013 | 274 | 2.3% |
| 2012 | 253 | 2.1% |
| 2014 | 223 | 1.9% |
| 2011 | 186 | 1.6% |
---
### 主要实体分布
#### 主要演讲者(speeches_bps数据集)
| 演讲者 | 演讲次数 | 所属政党 |
|-------|---------|---------|
| Ashdown, Paddy | 45 | Liberal Democrat |
| Blair, Tony | 31 | Labour |
| Brown, Gordon | 29 | Labour |
| Cameron, David | 24 | Conservative |
| Thatcher, Margaret | 21 | Conservative |
| Steel, David | 15 | Liberal |
| Asquith, Herbert | 13 | Liberal |
| Wilson, Harold | 12 | Labour |
| Hague, William | 11 | Conservative |
| Baldwin, Stanley | 10 | Conservative |
#### 主要演讲者(speeches_ukpol数据集)
| 演讲者 | 演讲次数 | 备注 |
|-------|---------|------|
| Boris Johnson | 300 | 前首相 |
| Volodymyr Zelenskyy | 273 | 乌克兰总统 |
| Theresa May | 248 | 前首相 |
| David Cameron | 194 | 前首相 |
| Michael Gove | 162 | 内阁大臣 |
| Matt Hancock | 155 | 前卫生大臣 |
| Sajid Javid | 152 | 前财政大臣 |
| Liz Truss | 141 | 前首相 |
| Keir Starmer | 132 | 工党领袖 |
| Ed Miliband | 121 | 前工党领袖 |
---
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 时间跨度长 | MPs数据覆盖1970-2022年,演讲数据覆盖1821-2022年 | 支持长期政治趋势分析、历史比较研究 |
| 数据规模大 | 合计超过21810条记录,包含完整演讲文本 | 适合大规模文本挖掘、机器学习训练 |
| 多维度信息 | 包含议员身份、政党归属、选区、任期等多维度元数据 | 支持多维度交叉分析、关系网络构建 |
| 权威来源 | 数据来源于Wikidata及英国议会官方记录 | 数据可信度高,适合学术研究 |
| 完整原始文件 | 包含完整演讲文本,最长演讲超过40000字符 | 支持全文检索、情感分析、主题建模 |
| 标注信息丰富 | 包含政党标签、时间标签、演讲场景描述 | 便于数据分类、筛选和标注训练 |
| 跨党派覆盖 | 涵盖37个政党,包含主要政党领袖演讲 | 支持政党立场对比、政治话语分析 |
| 时效性强 | 最新数据更新至2022年 | 支持当代政治研究、实时分析 |
---
## 数据样例
### MPs数据样例
| itemLabel | constituencyLabel | partyLabel | start | electionLabel |
|-----------|-------------------|------------|-------|---------------|
| Boris Johnson | Uxbridge and South Ruislip | Conservative Party | 2019-12-12 | 2019 United Kingdom general election |
| Keir Starmer | Holborn and St Pancras | Labour Party | 2019-12-12 | 2019 United Kingdom general election |
| Jeremy Corbyn | Islington North | independent politician | 2020-10-29 | - |
| Theresa May | Maidenhead | Conservative Party | 2019-12-12 | 2019 United Kingdom general election |
| Nicola Sturgeon | Glasgow Southside | Scottish National Party | 2019-12-12 | 2019 United Kingdom general election |
| Tim Farron | Westmorland and Lonsdale | Liberal Democrats | 2019-12-12 | 2019 United Kingdom general election |
| Ian Blackford | Ross, Skye and Lochaber | Scottish National Party | 2019-12-12 | 2019 United Kingdom general election |
| Liz Truss | South West Norfolk | Conservative Party | 2019-12-12 | 2019 United Kingdom general election |
| Rishi Sunak | Richmond (Yorks) | Conservative Party | 2019-12-12 | 2019 United Kingdom general election |
| Angela Rayner | Ashton-under-Lyne | Labour Party | 2019-12-12 | 2019 United Kingdom general election |
### 演讲数据样例(speeches_bps)
| Speaker | Date | Party | Speech摘要 |
|---------|------|-------|-----------|
| Theresa May (Conservative) | 03/10/2018 | Conservative | 关于第一次世界大战百年纪念及国家建设的演讲 |
| Jeremy Corbyn (Labour) | 26/09/2018 | Labour | 关于女性选举权百年及工党政策的演讲 |
| Vince Cable (Liberal Democrat) | 18/09/2018 | Liberal Democrat | 关于脱欧政策及二次公投的演讲 |
| David Cameron | 07/10/2015 | Conservative | 关于保守党胜选后的施政纲领演讲 |
| Ed Miliband | 23/09/2014 | Labour | 关于苏格兰公投及国家未来的演讲 |
### 演讲数据样例(speeches_ukpol)
| Speaker | Year | Description |
|---------|------|-------------|
| Diane Abbott | 2018 | 工党会议关于安全与警务的演讲 |
| Diane Abbott | 2020 | 关于家庭暴力法案的议会辩论 |
| Debbie Abrahams | 2020 | 关于社会保障申领者死亡问题的演讲 |
| Leo Abse | 1959 | 关于小学教育问题的首次演讲 |
| Gerry Adams | 1994 | 关于爱尔兰经济统一的演讲 |
| Nigel Adams | 2020 | 关于冠状病毒应对措施的声明 |
| Boris Johnson | 2020 | 关于脱欧贸易谈判的演讲 |
| Michael Gove | 2020 | 关于教育改革的政策声明 |
| Matt Hancock | 2020 | 关于新冠疫苗研发的通报 |
| Keir Starmer | 2021 | 关于反对党政策的议会演讲 |
---
## 应用场景
### 1. 政治话语分析与政党立场研究
本数据集为政治话语分析提供了丰富的语料基础。研究人员可以通过分析不同政党领袖在不同时期的演讲内容,揭示政党立场的演变轨迹。例如,通过对比撒切尔夫人、布莱尔、卡梅伦等不同时期首相的演讲,可以研究英国保守主义和工党政纲的变化趋势。此外,数据集涵盖了1970年以来的完整时间跨度,使得长期政治话语分析成为可能。研究人员可以追踪特定政策议题(如经济政策、欧盟关系、社会福利等)在不同年代的话语表达方式变化,从而理解政治叙事的演变规律。
### 2. 自然语言处理与文本挖掘
大规模的演讲文本为自然语言处理研究提供了宝贵资源。研究人员可以利用这些数据进行多种NLP任务:文本分类可用于自动识别演讲的政治立场或主题;情感分析能够揭示演讲中的情感倾向和修辞策略;命名实体识别可提取演讲中涉及的人物、机构和地点;主题建模则能发现演讲中的核心议题和潜在主题。此外,这些数据还可用于训练政治领域的语言模型,或用于构建政治领域的词向量表示,为后续的机器学习任务提供基础。
### 3. 议会运作机制研究
MPs数据集包含的议员基本信息、任期数据和政党归属信息,为研究英国议会运作机制提供了基础数据。通过分析议员的任期长度、政党转换情况、选区分布等,可以深入了解英国议会的人员构成和动态变化。研究人员可以分析不同政党在议会中的席位变化,探讨选举结果对议会构成的影响;研究议员的任期模式,分析连任情况和更替频率;分析跨党派转换现象,研究政治立场变化的原因和影响;还可以结合选区信息,分析地域政治倾向的分布特征。
### 4. 历史事件与政策变迁研究
演讲数据记录了英国政治史上的重要事件和政策变迁。通过分析特定时期的演讲内容,可以深入理解重大历史事件的背景和影响。例如,撒切尔时代的演讲反映了新自由主义经济政策的兴起,布莱尔时期的演讲体现了"第三条道路"的政治理念,而近年来的演讲则围绕脱欧、新冠疫情等议题展开。研究人员可以追踪特定政策议题在不同时期的讨论重点变化,分析政策辩论的演变过程,还可以通过对比不同政党在同一议题上的表述,理解政治分歧的本质。
### 5. 演讲风格与修辞分析
本数据集为研究政治演讲的修辞策略和语言风格提供了丰富素材。通过分析不同政治家的演讲风格,可以揭示其个人特点和政治策略。研究人员可以分析政治领袖的语言风格特征,如正式程度、情感表达、修辞手法等;研究演讲中的叙事结构和论证方式,理解政治说服的机制;还可以对比不同性别、不同背景政治家的演讲风格差异,探讨政治沟通的多样性。这些分析不仅有助于理解政治传播的规律,也为政治沟通策略的优化提供参考。
---
## 结尾
本数据集是研究英国政治的宝贵资源,包含了从1970年至今的议员信息和从1821年至今的议会演讲记录,合计超过21810条记录。数据集的核心优势在于其时间跨度长、数据规模大、多维度信息丰富以及包含完整的原始演讲文本。
这些数据支持多种研究方向,包括政治话语分析、政党立场研究、自然语言处理、议会运作机制研究、历史事件分析和演讲风格研究等。无论是学术研究还是产业应用,这套数据集都提供了坚实的基础。
如果您需要获取完整的数据集文件或有进一步的数据分析需求,欢迎私信获取更多信息。
---
数据规模概览: - MPs_1970_onwards.csv: 9,605条记录 - speeches_bps.csv: 353条记录 - speeches_ukpol.csv: 11,852条记录 - 总计:超过21,810条记录时间覆盖范围: - 最早记录:1821年 - 最新记录:2022年 - 时间跨度:超过200年核心价值: - 支持长期政治趋势分析 - 适合大规模文本挖掘和机器学习 - 多维度交叉分析能力强 - 数据来源权威可靠看了又看
验证报告
以下为卖家选择提供的数据验证报告:





