NHANES 数据提取系统指南
选择变量
按代码或描述搜索
快速选择常用指标
多种方式满足不同需求
管理预选池
将变量加入预选池
随时查看或移除
支持多次添加
设置筛选条件
- 选择调查周期
- 限定年龄/性别
- 定义纳排标准
精确筛选目标人群
提取数据
选择变量导出
生成 CSV 表格文件
简洁快速高效
分类变量标签含义查询
当您遇到分类变量时(如教育程度 DMDEDUC2 ):
B. 输入变量代码:"DMDEDUC2" 或输入英文关键词"Education" 或输入中文关键词"教育"
C. 查看返回结果:
1 = 9年教育
2 = 9-11年教育
3 = 12年教育或GED
4 = 大学或AA学位
5 = 研究生或更高教育
7 = 拒绝回答
9 = 不知道
本网站并没有整理所有的分类变量标签含义,若没有查询到相关变量。请点击NHANES 官网 进行查询。
最佳实践建议
- 推荐流程 :查询变量/预设变量 → 加入预选 → 设置条件 → 检查样本量 → 导出
- 使用「预设变量」快速获取 BMI、血压等常用指标
- 复杂筛选分步添加,实时验证样本量变化
- 导出文件包含 SEQN、年份及所选变量
常见问题
1. 为什么提取的数据有两个ID,一个是'SEQN',一个是'SEQN_new'?
这是因为我们网站整合了"NHANES III" 和 "NHANES" 两个数据库的数据。在这两个数据库中,'SEQN'是每个受访者的原始编号,但它并不是唯一的。例如,一个'SEQN'值为3的编号,对应两个不同的受访者,一个来自NHANES III,另一个来自NHANES。为了解决这个重复问题,我们在提取数据时引入了'SEQN_new'。这个新ID是唯一的:如果编号以'I'开头,比如'I-1',表示这个受访者来自NHANES III (1988-1994);如果以'C'开头,比如'C-1',则表示来自NHANES (1999-2018)。这样,'SEQN_new'就能清楚地区分每个受访者,避免混淆。
2. 生存结局的变量名称和标签是什么意思?
关于病例的死亡数据,这些信息来源于NDI(国家死亡指数)。需要注意的是,并非所有病例都有死亡数据记录,且18岁以下的病例不包含死亡数据。具体指标的含义可以参考NDI官方网站(链接 )获取更多详细信息。以下是相关变量的解释:
MORSTAT: 死亡状态,1表示死亡,0表示存活。 UCOD_LEADING: 死亡原因(1 = 心脏病, 2 = 恶性肿瘤, 3 = 慢性下呼吸道疾病, 4 = 意外伤害, 5 = 脑血管疾病, 6 = 阿尔茨海默病, 7 = 糖尿病, 8 = 流感或肺炎, 9 = 肾病, 10 = 其他)。 PERMTH_INT: 随访月数,表示病例的随访时间(以月为单位)。
3. 为什么变量查询中找不到想要的变量?
常见的变量(如人口学信息、实验室指标、疾病信息和生存结局等)已整理在"预设变量"模块中,方便快速选择。在"变量查询"中搜索时,请确保将查询内容填入对应的搜索框,例如变量代码应输入到"变量代码"框中。使用中文关键词搜索时,可能因翻译差异导致结果不匹配,例如"体重"可能被翻译为"重量","身高"可能显示为"站立高度"。建议尝试使用单字(如"重"或"高")进行搜索,以扩大检索范围,提高命中率。
4. 为什么变量查询中找到多个相同含义的变量?
在不同的调查年份,数据库可能会使用不同的变量代码来表示相同的指标。因此,我们整合了这些具有相同含义的变量。如果查询结果中出现多个类似变量,建议选择测量人数最多、覆盖调查周期最长的变量。例如,糖化血红蛋白(LBXGH)测量人数为 88,428,而糖化血红蛋白复制1(LBXGH1)测量人数为 23,476。在没有特殊需求的情况下,优先选择 LBXGH,以保证数据的完整性和代表性。
5. 为什么标签含义查询中查不到我的变量?
常见的变量示例包括:"您是否曾被医生或其他健康专业人员告知患有XXXX疾病?"其标签含义通常为:1 = 是的,2 = 不是,7 = 拒绝回答,9 = 不知道,空值 = 数据缺失。然而,本网站并未整理所有分类变量的标签含义。如果您未能查询到相关变量的解释,建议访问NHANES官网进行详细查询,或访问 NHANES 变量查询页面 获取更多信息。
变量查询
选择调查周期
年龄筛选
性别筛选
纳入标准
排除标准
选择提取变量
预选变量池 (当前数量: 0)
自定义提取
标签含义查询
注册
登录
重置密码
设置新密码
会员管理
选择会员类型
黄金会员-一年
黄金会员-三个月
黄金会员-一周
购买会员后,您将收到激活码,请在下方输入激活码以开通会员。