线性表的链式存储结构 / 链表

1.1 定义:

线性表的链式存储结构不限制数据元素的物理存储状态,也就是说,其数据元素的物理位置是随机的。

对于每一个元素来说,它需要存储自身信息在数据域中,还需要存储直接后继的位置信息在指针域中,这两部分信息共同构成一个结点(Node)。n 个结点就链结成一个链表,如果每一个结点只有一个指针域,那么它就是单链表。

头指针:头指针保存第一个结点(首元结点)的存储位置,因为最后一个结点没有后继结点,所以它的指针域为空(NULL / ^)。

头结点:有时候,首元结点前还会设置一个头结点,有头结点的时候,头指针保存的是头结点的存储位置。对于头结点,其数据域不一定要包含信息,其指针域则保存的是首元结点的存储位置。如下图所示:

Tip: 设计头结点是为了操作的统一。

链表并不是随机存取结构,并不能根据一个给定元素就能马上找到另一个目标元素,而是只能从头指针开始顺链查找,这称为顺序存取结构

1.2 单链表:

在开始之前,我们还是先定义单链表中每个结点的结构:

typedef struct Link{
    char elem; // 数据域
    struct Link *next; // 指针域
}link; // link为结点名,每个结点都是一个 link 结构体

Tip:因为指针也是指向一个结点,这里尤其要注意将指针类型声明为 struct Link

(1) 初始化空表:

link *initLink(){
    link *p = (link*)malloc(sizeof(link));// 创建一个头结点
    link *temp = p;// 声明头指针并指向头结点
    temp->next = NULL; // 头结点的指针域置空
    return p;
}

(2) 整表创建:

例如,创建一个存储 {1,2,3,4} 且无头结点的链表:

link *initLink(){    // 这里函数返回一个 link 类型的指针,所以函数名加 *
    link *temp = (link*)malloc(sizeof(link));// 创建首元结点
    link *p = temp;// 创建头指针并指向首元结点
    
    // 首元节点先初始化
    temp->elem = 1;
    temp->next = NULL;
    
    // 从第二个节点开始创建
    for (int i=2; i<5; i++) {
     // 创建一个新节点并初始化
        link *a=(link*)malloc(sizeof(link));
        a->elem=i;
        a->next=NULL;
        // 将temp节点与新建立的a节点建立逻辑关系
        temp->next=a;
        // 指针temp每次都指向新链表的最后一个节点
        temp=temp->next;
    }
    //返回建立的节点,只返回头指针 p 即可,通过头指针即可找到整个链表
    return p;
}

(3) 查找元素:

p 为原链表,elem 表示被查找的元素
link *selectElem(link *p,int elem){
    // 新建一个指针,直接指向首元结点
    link *t = p->next;
    while(t && t->elem != elem){
        t=t->next;
    }
    return t;
}

因为存在头结点,所以这里首先获取首元结点,然后从首元结点开始依次往后面遍历,查找是否有符合的元素。如果查找成功,返回的 t 是元素的地址,查找失败则返回 NULL。

(4) 修改元素:

// change 表示目标结点在链表中的位置,newElem 为新的数据域的值
link *changeElem(link *p,int change,int newElem){
    link *temp = p->next;
    // 遍历到要修改的结点
    for (int i = 1;i<change;i++) {
        temp = temp->next;
    }
    temp->elem = newElem;
    return p;
}

(5) 删除元素:
包括两步,一个是摘除结点并改变连接,一个是释放被摘除结点的内存。关键代码是:

temp->next = temp->next->next;

如下图所示:

具体实现代码是:

//p为原链表,add 为要删除元素的位序
link *delElem(link *p,int add){
    // temp 首先指向首元结点
    link *temp = p;
    // 先寻找被删除结点的上一个结点
    for (int i = 1; i<add-1; i++) {
        temp = temp->next;
    }
    link *del = temp->next;// 单独设置一个指针指向被删除结点,后面方便释放其内存
    temp->next = temp->next->next;
    free(del);// 手动释放该结点,防止内存泄漏
    return p;
}

注意这是没有头结点的情况,如果有头结点,循环判断应该是 i<add,因为初始的 temp 指向的是头结点。

(6) 插入元素:
包括两步,一个是将插入位置后的结点作为新结点的 next,一个是将新结点作为插入位置前的结点的 next,也就是关键代码:

new->next = temp->next;
temp->next = new;

如下图所示:

注意:这里顺序不能颠倒,如果是先确定插入位置前结点和新结点的连接,那么插入位置后结点将无法获取,因为其获取是依赖于插入位置前结点的next的,而这个next已经被覆盖。

具体代码为:

// p为原链表,elem表示新数据元素,add表示新元素插入的位置
link *insertElem(link *p,int elem,int add){
    link *temp = p;// 创建指向首元结点的指针
    // 遍历寻找插入位置前的结点
    for(int i = 1;i<add;i++){
        if(temp == NULL){
            printf("插入位置无效\n");
            return p;
        }
        temp = temp->next;
    }
    // 创建新结点并初始化
    link *c = (link*)malloc(sizeof(link));
    c->elem = elem;
    // 改变连接关系
    c->next = temp->next;
    temp->next = c;
    return p;
}

if 语句用来判断 add 是否合法,因为如果 add 过大,那么一直遍历下去会得到一个 next 为 NULL 的temp,之后报错。

1.3 循环链表:

当单链表中最后一个结点的指针域不为空,而是指向头结点的时候,就形成一个环,这叫循环链表。循环链表进行元素遍历的时候,循环终止条件不再是 p->next = NULL,而是 p->next = L

如果使用尾指针,那么可以用 O(1) 的时间找到尾结点和首元结点,而且可以简化合并两个循环链表的过程:

对于上面这两个循环链表,合并的思路大概是:A表尾连B表头。所以这里要改变 rearA->next,事先要先保存一开始的 rearA->next,即A表的头结点,之后将B表的首元结点给 rearA->next;之后我们要将一开始保留的A表头结点作为 rearB->next,事先要先保存一开始的 rearA->next,即B表的头结点,方便最后释放内存。

用图片表示的思路是:

用代码表示的思路是:

p = rearA->next;
rearA->next = rearB->next->next;
reerB->next = p;
free(p);

1.4 双向链表

单链表的每一个结点中,额外多出一个指向前驱结点的指针域,这时候就成了双向链表。双向链表的尾结点指针域指向头结点时,就成了双向循环链表,如下图:

插入操作

插入操作一定要注意顺序,我们可以先处理新结点的前驱和后继,之后再依次处理后结点、前结点。

// 新结点的前驱后继
s->prior = p;
s->next = p->next;
// 后结点
p->next->prior = s;
// 前结点
p->next = s;

删除操作

删除很简单,如下图把中间的 p 删除,那么对于后结点,我们要修复它的前驱指针;对于前结点,我们要修复它的后继指针,最后一步是释放被删除结点的内存

p->prior->next = p->next;
p->next-prior = p->prior;