NS

Zstats队列设计、数据整理与统计平台

CHARLS数据库简介

数据库的结构中，变量描述指的是数据中变量。。。。

CHARLS数据库中还包含

使用指南:

1.变量搜索一般使用中文变量描述或者英文变量名去搜索
2.该平台是数据整理与分析平台，如果你需要原始数据，请到CHARLS官网下载:https://charls.pku.edu.cn/en/
3.尽量搜索产生 3-5 个变量后，立刻点击整合、立刻更新数据集，不要等搜索了十几个变量后再去创建数据集，容易出错，而且不容易找到出错原因
4.我们平台支持导入历史数据集，请在第二页数据集整合界面进行操作

CHARLS变量筛选

变量描述:

筛选时可加入符号|或运算, &与运算, 比如 '性别|体重'

分类:

变量标签:

变量名:

Reset filters

CHARLS变量列表 (注意:此处提供的是CHARLS数据集变量信息, 1代表有, 0代表该年份没有该变量)

变量购物车 (购物车总数量不能超过20个,后续请整合购物车变量后，再行添加)

"购物车"的变量可能不是您想要的, 请您仔细检查, 对不需要的变量去掉 ☑

下载变量信息

本阶段已选变量

下载变量信息

队列选择 (数量最大为500个)

请先确定队列模式

单队列多队列

注意事项:1.单队列指的是调查周期纳入的人群如2011,2013;多队列是指多个周期纳入新对象的整合 2.单队列比多队列样本量略小，但是数据结构简单，容易开展纵向分析

主队列设置

追加队列设置

一般建议选择2013作为追加队列

选择暴露因素注意:一般暴露因素最多3-5个

确定你的随访结束时间

截止方式

固定随访周期固定随访截止时间

请输入数字作为固定周期数

选择结局变量

队列信息

选择定量结局变量

注:定量结局将会被计算前后差值

选择二分类结局

注:二分类结局将会被计算生存时间

是否计算各个周期与基线的差值(限定量因素)

是否计算最后一个周期与基线的差值(限定量因素)

是否计算生存时间(限二分类因素)

最终数据集展示

转为宽数据

下载数据

原始数据集(待纳排)

数据纳排, 绘制流程图

变量编码信息

请以排除的方式, 剔除不符条件的研究对象

说明: 我们开展数据分析的时候，很多时候往往会筛选子集进行分析，例如女性，老年人，高血压患者等，或者排除不符合条件的对象。

是否自动剔除缺失

示例1:缺失值排除请使用 = 搭配 NA; 示例2:范围值排除，比如排除18-30的值请使用区间(n1-n2) 搭配 18-30;

请以排除的方式，剔除暴露、结局的变量值不符合要求的研究对象

说明:此处对最重要指标暴露因素、结局变量进行考察，排除异常值、排除缺失值(=NA)、排除你不感兴趣的对象

请以排除的方式，剔除其他变量的变量值不符合要求的研究对象

说明:如果其他变量或协变量的变量值不符合要求或者缺失(=NA)的对象，你需要排除，请慎重考虑开展纳排

纳排流程图

纳排后数据集

Excel SPSS