# 人类大脑RNA-seq基因表达数据集:阿尔茨海默病与脑损伤研究的宝贵资源
## 引言与背景
随着全球人口老龄化加剧,神经退行性疾病如阿尔茨海默病已成为重大公共卫生挑战。理解大脑在正常衰老和疾病状态下的基因表达变化,对于揭示疾病机制、开发诊断生物标志物和治疗靶点至关重要。本数据集提供了来自多个人类供体大脑组织的大规模RNA测序数据,涵盖多个关键脑区,为神经科学研究提供了宝贵的资源。
本数据集包含四个核心文件:样本元数据(columns-samples.csv)、基因注释信息(rows-genes.csv)、标准化FPKM表达矩阵(fpkm_table_normalized.csv)和原始FPKM表达矩阵(fpkm_table_unnormalized.csv)。这些数据全面记录了人类大脑不同区域的基因表达谱,为研究衰老、痴呆和创伤性脑损伤相关的分子机制提供了坚实的数据基础。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|-------|
| rnaseq_profile_id | 整数 | RNA测序样本唯一标识符 | 488395315 | 100% |
| donor_id | 整数 | 供体唯一标识符 | 309335467 | 100% |
| donor_name | 字符串 | 供体名称 | H14.09.030 | 100% |
| specimen_id | 整数 | 标本唯一标识符 | 309357843 | 100% |
| specimen_name | 字符串 | 标本名称 | H14.09.030.TCx.01 | 100% |
| rna_well_id | 整数 | RNA样本孔位标识 | 395325172 | 100% |
| structure_id | 整数 | 脑区结构标识 | 10235 | 100% |
| structure_acronym | 字符串 | 脑区缩写 | TCx | 100% |
| structure_color | 字符串 | 脑区颜色标记 | #ebbfd0 | 100% |
| structure_name | 字符串 | 脑区全称 | temporal neocortex | 100% |
| hemisphere | 字符串 | 大脑半球 | left | 100% |
| gene_id | 整数 | 基因唯一标识符 | 499304660 | 100% |
| chromosome | 字符串 | 染色体编号 | 1 | 100% |
| gene_entrez_id | 整数 | Entrez基因ID | 100287102 | 99.8% |
| gene_symbol | 字符串 | 基因符号 | DDX11L1 | 100% |
| gene_name | 字符串 | 基因名称 | DEAD/H box helicase 11 like 1 | 100% |
| fpkm_value | 浮点数 | FPKM表达值 | 0.655725482647648 | 99.9% |
### 脑区分布情况
| 脑区缩写 | 脑区全称 | 样本数量 | 占比 |
|---------|---------|---------|-----|
| TCx | temporal neocortex(颞叶新皮质) | 142 | 31.2% |
| PCx | parietal neocortex(顶叶新皮质) | 138 | 30.3% |
| HIP | hippocampus(海马体) | 124 | 27.2% |
| FWM | white matter of forebrain(前脑白质) | 51 | 11.2% |
| 总计 | | 455 | 100% |
### 大脑半球分布
| 半球 | 样本数量 | 占比 |
|-----|---------|-----|
| left | 229 | 50.3% |
| right | 226 | 49.7% |
| 总计 | 455 | 100% |
### 供体分布(Top 10)
| 供体名称 | 样本数量 | 占比 |
|---------|---------|-----|
| H14.09.007 | 12 | 2.6% |
| H14.09.002 | 11 | 2.4% |
| H14.09.004 | 11 | 2.4% |
| H14.09.015 | 10 | 2.2% |
| H14.09.017 | 10 | 2.2% |
| H14.09.028 | 10 | 2.2% |
| H14.09.032 | 10 | 2.2% |
| H14.09.038 | 10 | 2.2% |
| H14.09.058 | 10 | 2.2% |
| H14.09.094 | 10 | 2.2% |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 多脑区覆盖 | 涵盖颞叶新皮质、顶叶新皮质、海马体和前脑白质四个关键脑区 | 支持跨脑区基因表达差异分析,揭示区域特异性表达模式 |
| 双侧半球数据 | 包含左、右大脑半球样本,分布均衡 | 支持半球对称性研究,探索大脑偏侧化表达特征 |
| 大规模基因覆盖 | 包含数万个人类基因的表达数据 | 支持全基因组关联分析和基因共表达网络构建 |
| 双表达矩阵 | 提供标准化和原始FPKM两种表达数据 | 满足不同分析需求,标准化数据便于跨样本比较 |
| 完整注释信息 | 包含基因符号、Entrez ID、染色体位置等完整注释 | 便于基因功能注释和通路分析 |
| 标准化处理 | 表达数据经过严格标准化处理 | 确保数据质量,提高分析可靠性 |
| 数据来源| [典枢]() | |
## 数据样例
### 样本元数据样例
csv
rnaseq_profile_id,donor_id,donor_name,structure_name,hemisphere
488395315,309335467,H14.09.030,temporal neocortex,left
496100277,309335441,H14.09.004,white matter of forebrain,right
496100278,309335438,H14.09.001,white matter of forebrain,left
496100279,309335438,H14.09.001,temporal neocortex,left
496100281,309335439,H14.09.002,hippocampus,right
496100283,309335439,H14.09.002,parietal neocortex,right
496100284,309335439,H14.09.002,white matter of forebrain,right
496100285,309335439,H14.09.002,temporal neocortex,right
496100287,309335440,H14.09.003,temporal neocortex,left
496100288,309335440,H14.09.003,hippocampus,left### 基因注释样例
csv
gene_id,chromosome,gene_entrez_id,gene_symbol,gene_name
499304660,1,100287102,DDX11L1,DEAD/H box helicase 11 like 1
499304661,1,653635,WASH7P,WAS protein family homolog 7 pseudogene
499304662,1,102466751,MIR6859-1,microRNA 6859-1
499304663,1,100302278,MIR1302-2,microRNA 1302-2
499304664,1,645520,FAM138A,family with sequence similarity 138, member A
499304666,1,79504,OR4G4P,olfactory receptor, family 4, subfamily G, member 4 pseudogene
499304668,1,79501,OR4F5,olfactory receptor, family 4, subfamily F, member 5
499304678,1,102723917,LOC102723917,uncharacterized LOC102723917
499304688,1,105378947,proline-rich extensin-like protein EPR1
499304706,1,148398,SAMD11,sterile alpha motif domain containing 11### FPKM表达矩阵样例(部分基因在不同脑区的表达)
| gene_symbol | TCx_left | TCx_right | HIP_left | HIP_right | PCx_left | PCx_right | FWM_left | FWM_right |
|------------|---------|----------|---------|----------|---------|----------|---------|----------|
| DDX11L1 | 0.66 | 0.52 | 0.15 | 0.46 | 0.38 | 0.22 | 0.09 | 0.17 |
| WASH7P | 4.83 | 5.45 | 4.56 | 5.30 | 5.18 | 5.01 | 5.07 | 5.26 |
| SAMD11 | 2.18 | 1.95 | 2.45 | 2.12 | 2.33 |
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






