特别提醒:
1.数据集变量名不要含有空格或符号如括号、※等
2.支持10 M 以内的的各种格式数据集
3.数据导入前,不妨阅读下关于数据集格式的介绍
数据库变量概览
表格内容:
一、基本情况
本平台数据导入格式为csv、excel、rds,也包括常见的SPSS软件格式、SAS软件的数据格式,数据集大小不超过10M.
Excel格式的数据集可自建,也可基于SPSS导出
CSV格式一般可以从excel导出或者基于SPSS导出;
初学者我建议从SPSS导出,因为SPSS具有固定的数据集格式,而EXCEL没有.
二、对数据集格式的要求
无论是CSV,还是excel格式,它的格式基本是相同的!
1.首行是变量名,一般是英文或者拼音,不建议用汉字,更不要有其它符合例如 (、*、%等。
2.从第二行开始,每一行都代表着一个研究对象的所有变量信息。
3.每一列都代表所有人一个变量的变量值
4.一般建议,CSV和excel中的变量值,建议用数字表示,比如男性=1,女性=2;血型(1、2、3、4),这种做法比较灵活,而且可以保证数据集在各统计软件通行无阻;对于数据集赋值不清者,请列一份变量赋值表
5.缺失值默认处理,一般是空白代替,不要写NA
6.除非特殊字符串(比如姓名),数据库变量值不要出现汉字或者英文字符串,会导致后续分析被卡。
三、如何整理出规范的数据集
如果你是数据分析高手,数据整理方法请自便,我觉得初学者最好将原始数据集导入到SPSS进行整理。
SPSS整理的特点是:
它具有固定的数据集格式、他有一些固定的计算、转换功能,对于初学者是足够用; 不像EXCEL一样不小心修改了数据值而你不知情。
当然我有些时候也会借助EXCEL进行修改。
记住了,SPSS数据集中变量值一般都是数字赋值。
RCS曲线的绘制
模型变量选择
回归变量选择
潜在混杂变量筛选设置
需要调整的协变量
请选择协变量
请指定分类协变量
P值的设置
显示P值
P值小数位数
P值X轴
P值Y轴
Overall(标签)
nonlinear(标签)
坐标轴、标签和字体
X轴标题
Y轴标题
字号
曲线设置
曲线粗细
曲线颜色
区间 (透明度)
参照值
曲线下载设置
选择图片
保存的类型
曲线页面
长度(cm)
宽度(cm)
DPI
中文字体