数据结构考试习题
问答题
什么是数据结构?有关数据结构的讨论涉及哪3个方面?
答:按某种逻辑关系组织起来的一组数据元素,按一定的存储方式存储于计算机中,并在其上定义了一个运算的集合,称为一个数据结构。
数据结构涉及以下三方面的内容:
(1)数据成员以及它们相互之间的逻辑关系,也称为数据的逻辑结构。
(2)数据元素及其关系在计算机存储器内的存储表示,也称为数据的物理结构,简称为存储结构。
(3)施加于该数据结构上的操作,即运算。
什么是算法?算法的5个特性是什么?
答:通常算法定义为解决某一特定任务而规定的一个指令序列。一个算法应当具有以下特性。
(1)有穷性:一个算法无论在什么情况下都应在执行有穷步后
结束。(2)确定性:算法的每一步都应确切地、无歧义地定义。对于每一种情况,需要执行的动作都应严格地、清晰地规定。
(3)可行性:算法中每一条运算都必须是足够基本的。也就是
说,它们原则上都能精确地执行,甚至人们仅用笔和纸做有限
次运算就能完成。(4)输入:一个算法必须有0个或多个输入。它们是在算法开始运算前给予算法的量。这些输入取自特定的
对象的集合。它们可以使用输入语句由外部提供,也可以使用
赋值语句在算法内给定。(5)输出:一个算法应有一个或多个
输出,输出的量是算法运算的结果。
简述顺序表和链表存储方式的主要优缺点。
答:顺序表的优点是可以随机存取元素,存储密度高,结构简单;缺点是需要一片地址连续的存储空间,不便于插入和删除元素(需要移动大量的元素),表的初始容量难以确定。链表的优点是便于结点的插入和删除(只需要修改指针属性,不需要移动结点),表的容量扩充十分方便:缺点是不能进行随机访问,只能顺序访问,另外每个结点上增加指针属性,导致存储密度较低。
带头结点的双链表和循环双链表相比有什么不同?在何时使用循环双链表?
答:在带头结点的双链表中,尾结点的后继指针为None,头结点的前驱指针不使用;在带头结点的循环双链表中,尾结点的后继指针指向头结点,头结点的前驱指针指向尾结点,当需要快速找到尾结点时,可以使用循环双链表。
什么叫“假溢出”?如何解决假溢出?
答:在非循环顺序队中,当队尾指针已经到了数组的上界,不能再做进队操作,但其实数组中还有空位置,这就叫“假溢出”。解决假溢出的方式之一是采用循环队列。
如果某个一维整数数组A的元素个数n很大,存在大量的重复元素,且所有值相同的元素紧跟在一起,请设计一种压缩存储方式使得存储空间更节省。
答:采用元素类型形如“[整数,个数]”的列表压缩存储,例如数组A为{1,1,1,5,5,5,5,3,3,3,3,4,4,4,4,4,4},共有17个元素,对应的压缩存储为[[1,3],[5,4],[3,4],[4,6]],在压缩列表中只有8个整数,从中看出,重复元素越多,采用这种压缩存储方式越节省存储空间。
已知一颗完全二叉树的第6层(设根结点为第1层)有8个叶子结点,则该完全二叉树的结点个数最多是多少?最少是多少?
答:完全二叉树的叶子结点只能在最下面两层,对于本题而言,结
点最多的情况是第6层为倒数第二层,即16层构成一棵满二叉树,5层构成一棵满二叉树,其结点总数为25-31=31,再加上第6层的结点,总计31+8=39。这样最少的结点个数为39。
其结点总数为26-1=63。其中第6层有25=32个结点,含8个叶子结点,则另外有32-8=24个非叶子结点,它们中每个结点都有两个孩子结点(均为第7层的叶子结点),计为48个叶子结点。这样最多的结点个数=63+48=111。
结点最少的情况是第6层为最下层,即1
已知一颗完全二叉树有50个叶子结点,则该二叉树的总结点数至少应有多少个?
答:n0=50,n=n0+n1+n2,度之和=n-1=n1+2*n2,由此推出n2=49,这样
n=n1+99,所以当n1=0时n最少,因此n至少有99个结点。
若干个包含不同权值的字母已经对应好一组哈夫曼编码,如果某个字母对应的编码为001,则什么编码不可能对应其他字母?什么编码肯定对应其他字母?
由哈夫曼树的性质可知,以0、00和001开头的编码不可能对应
其他字母。该哈夫曼树的高度至少是3,其最少叶子结点的情况如图1. 6所示,因此以000、01和1开头的编码肯定对应其他字母。
采用普里姆(Prim)算法从顶点1出发构造出下图1.8的一颗最小生成树。
答:采用普里姆(Prim)算法构造最小生成树的过程如图1.13所示。
采用克鲁斯卡尔(Kruskal)算法构造出下图1.8的最小生成树。
答:采用克鲁斯卡尔(Kruskal)算法构造最小生成树的过程如图
1.13所示。
设图中顶点表示村庄,有向边代表交通路线,若要建立一家医院,试问建在哪个村庄能使各村庄的总体交通代价最小。
答:采用Floyd算法求出两顶点之间的最短路径长度。其邻接矩阵如下:
答:(接上页)
从A4中求得每对村庄之间的最少交通代价。假设医院建在i村庄时其他各村庄往返总的交通代价如表1.2所示,显然把医院建在村庄3时总体交通代价最少。
假设一颗二叉排序树的关键字为单个字母,其后序遍历序列为ACDBFIJHCGE,回答以下问题。(1)画出该二叉排序树。(2)求在等概率下的查找成功的平均查找长度。(3)求在等概率下的查找不成功的平均查找长度。
答:(1)该二叉排序树的后序遍历序列为ACDBFIJHGE,则中序遍历
序列为ABCDEFGHIJ,由后序序列和中序序列构造的二叉排序树如图1.
23所示。
(2)ASL成功=(1x1+2x2+4x3+2x4+1x5)/10=3。
(3)ASL不成功=(6x3+3x4+2x5)/11=3.64。
设有一组关键字为(19,1,23,14,55,20,84,27,68,11,10,77),其哈希函数为h(key)=key%13,采用开放地址法的线性探测法解决冲突,试在0~18的哈希表中对该关键字序列构造哈希表,并求在成功情况下的平均查找长度。
答:依题意,n=12,m=19。利用线性探测法计算下一地址的计算公 式为:
d0=h(key)
dj+1=(dj+1)%m j=0,1,…
计算各关键字存储地址的过程如下:
h(19)=19%13=6
h(1)=1%13=1
h(23)=23%13=10
h(14)=14%13=1 冲突
d0=1,d1=(1+1)%19=2
h(55)=55%13=3
h(20)=20%13=7
h(84)=84%13=6 冲突
d0=6,d1=(6+1)%19=7 仍冲突
d2=(7+1)%19=8
h(27)=27%13=1 冲突
d0=1,d1=(1+1)%19=2 仍冲突
d2=(2+1)%19=3 仍冲突
d3=(3+1)%19=4
h(68)=68%13=3 冲突
d0=3,d1=(3+1)%19=4 仍冲突
d2=(4+1)%19=5
h(11)=11%13=11
h(10)=10%13=10 冲突
d0=10,d1=(10+1)%19=11 仍冲突
d2=(11+1)%19=12
h(77)=77%13=12 冲突
d0=12,d1=(12+1)%19=13
因此,构建的哈希表如表1.3所示。
表1.3中的探测次数即为相应关键字成功查找时所需比较关键字的次 数,因此:
ASL成功=(1+2+1+4+3+1+1+3+1+1+3+2)/12=1.92
请回答下列关于堆排序中堆的两个问题:(1)堆的存储表示是顺序的还是链式的?(2)设有一个小根堆,即堆中任意结点的关键字均小于它的左孩子和右孩子的关键字,其中具有最大关键字的结点可能在什么地方?
答:(1)通常,堆的存储表示是顺序的。因为堆排序将待排序序列
看成是一棵完全二叉树,然后将其调整成一个堆,而完全二叉树特
别适合于采用顺序存储结构,所以堆的存储表示采用顺序方式最合
适。
(2)小根堆中具有最大关键字的结点只可能出现在叶子结点中,因
为最小堆的最小关键字的结点必是根结点,而最大关键字的结点由
偏序关系可知,只有叶子结点可能是最大关键字的结点。
程序题
有两个集合采用整数顺序表A、B存储,设计一个算法求两个集合的差值C,C仍然用顺序表存储,并给出算法的时间和空间复杂度。例如A=(1,3,2),B=(5,1,4,2),并集C=(3)。
解:将集合A中所有不属于集合B的元素添加到C中,最后返回C。对应的算法如下:
1 | def Diff(A,B): |
有一个递增有序的整数双链表L,其中至少有两个结点,设计一个算法就地删除L中所有值重复的结点,即多个相同值重复的结点仅保
留一个。例如,L=(1,2,2,2,3,5,5),删除后L=(1,2,3,
5)。
解:在递增有序的整数双链表L中,值相同的结点一定是相邻的。首先
让pre指向首结点,p指向其后续结点,然后循环,直到p为空为止:
(1)若p结点值等于前驱结点(pre结点)值,通过pre结点删除p结点,置p=pre.next。
(2)否则,pre、p同步后移一个结点。
对应的算法如下:
1 | def Delsame(L): |
给定一个字符串str,设计一个算法采用顺序栈判断str是否为形如“序列1@序列2”的合法字符串,其中序列2是序列1的逆序,在str中恰好只有一个@字符。
解:设计一个栈st,遍历str,将其中‘@’字符前面的所有字符进栈,再扫描str中‘@’字符后面的所有字符,对于每个字符ch,退栈一个字符,如果两者不相同,返回False。当循环结束时,若str扫描完毕并且栈空,返回True,否则返回False。对应的算法如下:
1 | def match(str): |
有一个整数数组a,设计一个算法将所有偶数位元素移动到所有奇数位元素的前面,要求它们的相对次序不改变。例如,
a={1,2,3,4,5,6,7,8},移动后a={2,4,6,8,1,3,5,7}。
解:采用两个队列来实现,先将a中的所有奇数位元素进qu1队中,所有偶数位元素进qu2队中,再将qu2中的元素依次出队并放在a中,qu1中的元素依次出队并放到a中。对应的算法如下:
1 | defMove(): |
假设字符串s采用String对象存储,设计一个算法,在串s
中查找子串t最后一次出现的位置。例如,s=“abcdabcd”,
t=“abc”,结果为4.
(1)采用BF算法求解。
(2)采用KMP算法求解。
解:用lasti记录串s中子串t最后一次出现的位置(初始为-1),修改BF算法和KMP算法,在s中找到一个t后用lasti记录其位置,此时
i指向s中t子串的下一个字符,将j置为0继续查找。对应的算法如下:MaxSize=100
#基于BF算法
1 | def BF(s,t): |
设计一个算法,求一个n行n列的二维整型数组a的左下角-
右下角和右上角-左下角两条对角线的元素之和。
解:置s为0,用s累加a的左上角-右下角元素a[i]i之和,再用s累加a的右上角-左下角元素a[j]n-j-1之和。当n为奇数时,两条对角线有一个重叠的元素a[n/2][n/2],需从s中减去。对应的算法如下:
1 | def Diag(a): |
设有一个不带表头结点的整数单链表p,设计一个递归算法getno(p,x)查找第一个值为x的结点的序号(假设首结点的序号为0),没有找到时返回-1。
解:设计getno1(p,x,no)算法,其中形参no表示p结点的序号,初始时p为首结点,no为0。
(1)p=None,返回-1。
(2)p.data=x,返回no。
(3)其他情况返回小问题getno1(p.next,x,no+1)的结果。
对应的递归算法如下:
1 | def getno1(p,x,no): |
设有一个不带表头结点的整数单链表p,设计一个递归算法delx(p,x)删除单链表p中第一个值为x的结点。
解:设f(p,x)的功能是返回在单链表p中删除第一个值为x的结点后结果单链表的首结点。对应的递归模型如下:
f(p,x)=None 当p=None时
f(p,x)=p.next 当p.data==x时
f(p,x)=p(q=f(p.next,x),p.next=q)其他情况
对应的递归算法如下:
1 | if p==None: |
设有一个不带表头结点的整数单链表p,设计一个递归算法delxall(p,x)删除单链表p中所有值为x的结点。
解:设f(p,x)的功能是返回在单链表p中删除所有值为x的结点后结果单链表的首结点。对应的递归模型如下:
f(p,x)=None 当p=None时
f(p,x)=q(q=f(p.next,x)) 当p.data==x时
f(p,x)=p(q=f(p.next,x),p.next=q)其他情况对应的递归算法如下:
1 | def delxall(p,x): |
假设二叉树中每个结点值为单个字符,采用二叉链存储结构存储。试设计一个算法,求一颗给定二叉树bt中的所有大于x的结点个数。
解:可以采用任何遍历方法,这里采用用先序遍历。对应的算法如下:
1 | def GreaterNodes(bt,x) : |
假设二叉树中每个结点值为单个字符,采用二叉链存储结构存储。试设计一个算法,按从右到左的次序输出一颗二叉树bt中的所有叶子结点。
解:3种递归遍历算法都是先遍历左子树,再遍历右子树,这里只需要改为仅输出叶子结点,并且将左、右子树遍历的次序倒过来即可。以先序遍历为基础修改的算法如下:
1 | def RePreOrder(bt):#求解算法 |
给定一个带权有向图的邻接表存储结构G,创建对应的邻接矩阵存储结构g。
解:先将邻接矩阵g的元素初始化(g.edges[i][j]=0,其他置为
∞),然后遍历邻接表G的每个单链表,修改g中edges数组的相应元素。对应的算法如下:
1 | def AdjToMat(G): |
一个长度为L(L大于等于1)的升序序列S,处在第éL/2ù个位置的
数称为S的中位数。例如,若序列S1=(11,13,15,17,19),则S1的中
位数是15。两个序列的中位数是含它们所有元素的升序序列的中位数。例如,
S2=(2,4,6,8,20),则S1和S2的中位数是11。现有两个等长升序序列A
和B,试设计一个在时间和空间两方面都尽可能高效的算法,找出两个序列A
和B的中位数,并说明所设计算法的时间复杂度和空间复杂度。
解:两个升序序列分别采用int数组A和B存放。先求出两个升序序列A、B的 中位数,设为a和b。若a=b,则a或b即为所求的中位数;否则,舍弃a、b中
的较小者所在序列之较小一半,同时舍弃较大者所在序列之较大一半,要求
两次舍弃的元素个数相同。在保留的两个升序序列中重复上述过程,直到两
个序列中均只含一个元素时为止,则较小者即为所求的中位数。对应的算法 如下:
1 | def FindMedian(A,B,n): #求解算法 |
上述算法的时间复杂度为O (log2n),空间复杂度为O(1)
设计一个算法,输出在一颗二叉排序树中查找某个关键字k经过的查
找路径。
解:使用path列表存储经过的结点关键字,当找到关键字为k的结点时,向
path中添加k并返回;否则将当前结点t的关键字添加到path,再根据比较结
果在左或者右子树中递归查找。对应的算法如下:
1 | def SearchPath(bt,k) : #求解算法 |
编写一个实验程序,采用快速排序完成一个整数序列的递增 排序,要求输出每次划分的结果,并用相关数据进行测试。 解:快速排序的过程参见《教程》9.3.2节,每次以base为基准划分的 输出格式是“[左子序列]base[右子序列]”。
1 | def disp(R,s,t,i): #输出每一次划分的结果 |