特别提醒:
1.数据集变量名不要含有空格或符号如括号、※等
2.支持10 M 以内的的各种格式数据集
3.数据导入前,不妨阅读下关于数据集格式的介绍
数据库变量概览
表格内容:
一、基本情况
本平台数据导入格式为csv、excel、rds,也包括常见的SPSS软件格式、SAS软件的数据格式,数据集大小不超过10M.
Excel格式的数据集可自建,也可基于SPSS导出
CSV格式一般可以从excel导出或者基于SPSS导出;
初学者我建议从SPSS导出,因为SPSS具有固定的数据集格式,而EXCEL没有.
二、对数据集格式的要求
无论是CSV,还是excel格式,它的格式基本是相同的!
1.首行是变量名,一般是英文或者拼音,不建议用汉字,更不要有其它符合例如 (、*、%等。
2.从第二行开始,每一行都代表着一个研究对象的所有变量信息。
3.每一列都代表所有人一个变量的变量值
4.一般建议,CSV和excel中的变量值,建议用数字表示,比如男性=1,女性=2;血型(1、2、3、4),这种做法比较灵活,而且可以保证数据集在各统计软件通行无阻;对于数据集赋值不清者,请列一份变量赋值表
5.缺失值默认处理,一般是空白代替,不要写NA
6.除非特殊字符串(比如姓名),数据库变量值不要出现汉字或者英文字符串,会导致后续分析被卡。
三、如何整理出规范的数据集
如果你是数据分析高手,数据整理方法请自便,我觉得初学者最好将原始数据集导入到SPSS进行整理。
SPSS整理的特点是:
它具有固定的数据集格式、他有一些固定的计算、转换功能,对于初学者是足够用; 不像EXCEL一样不小心修改了数据值而你不知情。
当然我有些时候也会借助EXCEL进行修改。
记住了,SPSS数据集中变量值一般都是数字赋值。
相关分析
散点图
线性回归森林图
在森林图上显示的变量
选择森林的变量
左侧变量
右侧
修改的变量
输入变量名
关于森林图的设置
点估计和置信区间设置
颜色
点估计设置
样式
大小
置信区间设置
样式
顶点的高度
宽度
参考线
颜色
样式
宽度
坐标轴和标签设置
字号
x轴标签
图宽
图和文本间距
X轴设置
X轴转换类型
限制X轴范围
最小值
最大值
对齐方式
标题对齐
文本对齐
其他颜色设置
显示底纹
曲线下载设置
保存的类型
曲线页面
长度(cm)
宽度(cm)
DPI
中文字体
在森林图上显示的变量
选择森林的变量
显示常数项
左侧变量
右侧
修改的变量
输入变量名
关于森林图的设置
点估计和置信区间设置
颜色
点估计设置
样式
大小
置信区间设置
样式
顶点的高度
宽度
参考线
颜色
样式
宽度
坐标轴和标签设置
字号
x轴标签
图宽
图和文本间距
X轴设置
X轴转换类型
限制X轴范围
最小值
最大值
对齐方式
标题对齐
文本对齐
其他颜色设置
显示底纹
曲线下载设置
保存的类型
曲线页面
长度(cm)
宽度(cm)
DPI
中文字体