R语言把某些数替换成na_R语言的学习心得分享(4)
在上两篇文章中,我们分析了R中的主要数据结构,那么今天我来写一下其他的数据结构——因子和和列表。
我们先来看看因子,大家在提供一些表格数据的时候,难免会需要不同种含义的数据,即类别变量,应用我们之前学过的,我们可以利用字符向量来解决。但是,假如我们需要处理更多的类别变量的时候,利用字符向量就显得很笨拙。在R语言中,便提供了因子这一数据结构来更好的解决这一个问题。因子,也被称为因子型变量,是R中便于对数据进行分类,并将其储存为级别的数据对象。它可以是一个类别的集合,也可以是有序项目的集合。因子型变量所取得的所有值被称为因子水平。下面我们来看一下如何创建一个因子呢。
我们利用factor()函数来创建因子。通过该函数,我们可以将括号中的不同种类别的向量转换成因子类型。具体用法为factor(character,levels,labels,exclude)。下面我们逐一举例说明。
首先,我们写一个最基础的:
从这里面可以清楚的看到,原本括号里面的字符类型的向量此时已经转化为了因子类型,下面的Levels是一个显著的标志。这个Levels表示的是因子的水平,放置在括号之中的话便可以对其因子水平进行约束。