Zstats队列设计、数据整理与统计平台


数据库的结构中,变量描述指的是数据中变量。。。。

CHARLS数据库中还包含



使用指南:

  1. 1.变量搜索一般使用中文变量描述或者英文变量名去搜索
  2. 2.该平台是数据整理与分析平台,如果你需要原始数据,请到CHARLS官网下载:https://charls.pku.edu.cn/en/
  3. 3.尽量搜索产生 3-5 个变量后,立刻点击整合、立刻更新数据集,不要等搜索了十几个变量后再去创建数据集,容易出错,而且不容易找到出错原因
  4. 4.我们平台支持导入历史数据集,请在第二页数据集整合界面进行操作

CHARLS变量筛选

筛选时可加入符号|或运算, &与运算, 比如 '性别|体重'
Reset filters Reset filters

CHARLS变量列表 (注意:此处提供的是CHARLS数据集变量信息, 1代表有, 0代表该年份没有该变量)

Loading...

变量购物车 (购物车总数量不能超过20个,后续请整合购物车变量后,再行添加)

"购物车"的变量可能不是您想要的, 请您仔细检查, 对不需要的变量去掉 ☑





本阶段已选变量


队列选择 (数量最大为500个)

注意事项:1.单队列指的是调查周期纳入的人群如2011,2013;多队列是指多个周期纳入新对象的整合 2.单队列比多队列样本量略小,但是数据结构简单,容易开展纵向分析

主队列设置


追加队列设置

一般建议选择2013作为追加队列




选择暴露因素 注意:一般暴露因素最多3-5个

确定你的随访结束时间








选择结局变量

队列信息


                    

选择定量结局变量

注:定量结局将会被计算前后差值

选择二分类结局

注:二分类结局将会被计算生存时间

最终数据集展示

Loading...

转为宽数据





原始数据集(待纳排)

Loading...

数据纳排, 绘制流程图


                      

说明: 我们开展数据分析的时候,很多时候往往会筛选子集进行分析,例如女性,老年人,高血压患者等,或者排除不符合条件的对象。


示例1:缺失值排除请使用 = 搭配 NA; 示例2:范围值排除,比如排除18-30的值请使用 区间(n1-n2) 搭配 18-30;


                        

说明:此处对最重要指标暴露因素、结局变量进行考察,排除异常值、排除缺失值(=NA)、排除你不感兴趣的对象



                          

说明:如果其他变量或协变量的变量值不符合要求或者缺失(=NA)的对象,你需要排除,请慎重考虑开展纳排



                        

纳排后数据集

Loading...