零基础学习SPSS|教程一
0. 引言
从今天开始,我将持续更新SPSS系列教程,欢迎大家持续关注我的公众号/知乎/语雀平台:Smilence工作室
1. 本章目标
- 认识SPSS
- 学会定义变量
- 学会导入数据
2. 认识SPSS
维基简介:SPSS原名社会科学统计包(英语Statistical Package for the Social Sciences)。1968年,美国斯坦福大学三位研究生开发出最早的SPSS软件,当时主要面向中小型计算机和企业用户,产品统称SPSSx版。1975年,芝加哥成立SPSS公司。1984年,SPSS公司首先推出世界上第一个可以在DOS上运行的统计分析软件的PC版本,即SPSS/PC+版。后来又相继推出Windows和Mac OS X等操作系统上的版本,并不断扩展软件的功能相关服务,形成了目前SPSS的基本面貌。2008年9月15日,SPSS 17.0 for Windows版发布。2009年7月28日,SPSS公司发表PASW(Predictive Analytics Suite Workstation)18.0,同时该公司也被IBM收购。
界面介绍:
数据视图(Data View):与Excel界面类似,列是变量名
变量视图(Variable View):行是变量名,列是变量信息
数据输出窗口:数据的导出窗口
语法编辑窗口:编辑分析的语法(主菜单栏Analyze—点击任意分析—选择任意变量—Paste打开语法编辑窗口)
脚本编辑窗口:Python脚本实现自动化操作(主菜单File—New—Script打开语法编辑窗口)
帮助窗口:软件提供的帮助(主菜单Help)
3. 变量的定义
点击底部切换到变量视图,分别输入变量的名称、类型、宽度、小数等
变量名称(Name):中文、英文或@组成的变量名,默认为VAR
注意事项:不能使用数字、英文标点、相同变量名(不区分大小写)、all或and等名称命名
变量类型(Type):例如数值或字符串(文本)等,对话框中即可设置宽度(Width)和小数(Decimals),宽度为字符数(英文数字为1,汉字为2),小数即小数位数。
标签(Label):对变量的进一步描述,在数据视图下停留在变量名处即可看到变量信息
值(Values):设置输入内容的对应关系,简单来说就是设置问卷时的选择题,单选题设置1对应选项一,2对应选项二,以此简化录入的过程;多选题一个选项设置一个变量,定义1和0,分别为选了和未选。(数据视图下点主菜单View—Value Labels转换为选项)
缺失值(Missing):定义缺失值的数值,例如Gender有两个可能取值,1是男性,2是女性,缺失值定义为0,若有保密或不愿意回答的,录入0就知道是Missing缺失值了。
测量(Measure):分为定类尺度(Nominal)、定序尺度(Ordinal)和定比尺度(Scale)
定类尺度仅用于区分类别,例如性别;定序尺度可用于排序,例如满意度评价;定比尺度可用于比较大小、加减运算,例如收入。
4. 数据的导入和查看
输入数据:定义变量后即可直接在数据视图下输入数据。
导入数据:SPSS支持常用的.sav/.xlsx/.txt文件,英文界面下中文乱码,在设置中将language/output改为中文即可
Mac同学注意:SPSS25在macOS Catalina下存在文件夹无法访问的问题,官网查询得知是由于macOS的文件隐私权限提高,文稿、下载、桌面、外载硬盘无法读取,解决方法是将数据放在其他位置(例如Macintosh HD/用户/XXX文件夹下)或将软件更新到26版本,安装时允许访问。
导入Excel文件:可选是否从第一行数据读取变量名以及数据范围
导入Text文件:根据向导导入文件,可以分隔符或固定宽度分隔数据(可以保存导入方式下次直接使用)
分隔符:以特定符号(如制表符)分隔数据
固定宽度:以特定宽度分隔数据(需保证个案宽度一致)
查看文件信息:主菜单File—Display Data File Information—Working File
查看变量信息:主菜单Utilities—Variables或右击变量查看变量信息