当前位置: 首页 > article >正文

【函数题】6-10 二分查找

6-10 二分查找

  • 1 题目原文
  • 2 思路解析
    • 2.1 基本二分查找算法
    • 2.2 常用二分模板
      • 2.2.1 第一个大于等于目标值的元素下标
      • 2.2.2 第一个大于目标值的元素下标
      • 2.2.3 最后一个小于等于目标值的元素下标
      • 2.2.3 最后一个小于目标值的元素下标
      • 2.2.4 小结
  • 3 代码实现
    • 3.1 本题代码实现
      • 3.1.1 递归法
      • 3.1.2 迭代法
    • 3.2 常用模板
      • 2.2.1 第一个大于等于目标值的元素下标
      • 2.2.2 第一个大于目标值的元素下标
  • 4 总结

1 题目原文

题目链接:6-10 二分查找

本题要求实现二分查找算法。

函数接口定义:

Position BinarySearch( List L, ElementType X );

其中 List 结构定义如下:

typedef int Position;
typedef struct LNode *List;
struct LNode {
    ElementType Data[MAXSIZE];
    Position Last; /* 保存线性表中最后一个元素的位置 */
};

L 是用户传入的一个线性表,其中 ElementType 元素可以通过 >==< 进行比较,并且题目保证传入的数据是递增有序的。函数 BinarySearch 要查找 XData 中的位置,即数组下标(注意:元素从下标 1 开始存储)。找到则返回下标,否则返回一个特殊的失败标记 NotFound

裁判测试程序样例:

#include <stdio.h>
#include <stdlib.h>

#define MAXSIZE 10
#define NotFound 0
typedef int ElementType;

typedef int Position;
typedef struct LNode *List;
struct LNode {
    ElementType Data[MAXSIZE];
    Position Last; /* 保存线性表中最后一个元素的位置 */
};

List ReadInput(); /* 裁判实现,细节不表。元素从下标1开始存储 */
Position BinarySearch( List L, ElementType X );

int main()
{
    List L;
    ElementType X;
    Position P;

    L = ReadInput();
    scanf("%d", &X);
    P = BinarySearch( L, X );
    printf("%d\n", P);

    return 0;
}

/* 你的代码将被嵌在这里 */

输入样例1:

5
12 31 55 89 101
31

输出样例1:

2

输入样例2:

3
26 78 233
31

输出样例2:

0

代码长度限制 16 KB
时间限制 100 ms
内存限制 64 MB

2 思路解析

    在本篇文章中,除了解决题目以外,还将简单地总结一下二分查找算法,二分查找是一个灵活的算法,即使有基本模板可以套用,但是一般的二分查找题目都需要对基本模板进行修改,这需要读者能深刻理解二分查找算法的原理(原理并不难)。而且基本模板的实现细节也因人而异,选择自己喜欢的一个基本模板即可,只需要记住一套基本模板,然后随题意去修改这个基本模板即可。

2.1 基本二分查找算法

    基本二分查找算法就是从一个升序数组 arr 中查找元素 X 是否存在,注意数组中的数是不重复的。目的一般是返回元素 X 在数组中的下标,如果不存在则返回一个约定的值(常见的是 -1,数组长度 n等)。
    我现在不知道这个数在哪里,甚至连它在不在数组里面都不知道,要怎么找呢?那我就它在数组的正中间,即下标为 p = ⌊ n 2 ⌋ p=\lfloor\frac{n}{2}\rfloor p=2n的地方:
        1. 如果运气够好,这个位置的元素恰好就是 X,即 a r r [ p ] = X arr[p]=X arr[p]=X,那直接返回 p p p 即可;
        2. 如果运气不够好,这个位置的元素 a r r [ p ] > X arr[p]>X arr[p]>X,说明元素 Xp 的左边,因此将数组查找范围减半(把下标大于等于 p 的元素都忽略),只关注 arr[p - 1] 及之前的元素即可;
        3. 如果这个位置的元素 a r r [ p ] < X arr[p]<X arr[p]<X,说明元素 Xp 的右边,同理,将数组查找范围减半(把下标小于等于 p 的元素都忽略),只关注 arr[p + 1] 及之后的元素即可。
    经历一遍上面猜想的步骤,可以看到,问题又变得和原问题一样了:在一个缩小了的数组里寻找元素 X。不难得出下面的递归思路伪代码:

# arr: 升序数组
# X: 待查找元素
# start: 待查找数组的左边界(闭区间)
# end: 待查找数组的右边界(闭区间)
f(arr, X, start, end):
	if start > end:
		 # 这里返回 -1 表示没找到
		return -1
	# 猜想X在数组中间位置
	mid = (start + end) / 2
	if arr[mid] == X:
		# 猜对了,直接返回下标
		return mid
	if arr[mid] > X:
		# 没猜对,X在mid的左边,则朝左边寻找,将右界变小
		return f(arr, X, start, mid - 1)
	# 没猜对,X在mid的右边,则朝右边寻找,将左界变大
	return f(arr, X, mid + 1, end)

    但是我们一般不喜欢递归解法,除非只有递归解法,不然的话都要看看能不能把递归转为迭代。上面的递归思路转为迭代还是很好办的,并且符合人的一般思维,如下:

f(arr, X):
	l = 0 # 待查找数组的左边界(闭区间),假设数组下标从0开始
	r = arr.length - 1 # 待查找数组的右边界(闭区间),假设数组下标从0开始
	while l <= r:
		mid = (l + r) / 2
		if arr[mid] == X:
			return mid
		if arr[mid] > X:
			r = mid - 1;
		else:
			l = mid + 1;
	# 如果 X 存在,则一定会在循环中找到并返回,不会执行这一句,如果执行了这句,表示 X 不存在
	# 这里假设 X 不存在时返回 -1
	return -1

    上面就是基本二分查找算法的思路,也是本题所考察的知识点。为什么要数组中的元素不重复呢?这是因为这里只考虑元素 X 在不在数组中,如果在则返回其下标,如果有多个 X 的话,那么应该返回哪个下标呢?随便返回一个下标一般是不合理的。所以就干脆直接限制数组元素不重复。

2.2 常用二分模板

    如果是为了解决本题,那么上一小节就已经解决了。这一小节主要补充几个常用模板,这些模板可用于任何非递减数组(非递增数组同理)。

2.2.1 第一个大于等于目标值的元素下标

有一个非递减数组 arr,长度为 n,查找 arr 中第一个大于等于 X 的元素下标,下标从 0 开始。

    首先考虑两个特殊情况:
        1. 如果 X 小于 arr 中的最小元素,则应该返回 0
        2. 如果 X 大于 arr 中的最大元素,则应该返回 n
    然后开始查找,不过和上面查找存不存在的思路有所区别:
        1. 最中间那个下标 mid 处的值小于 X,说明答案在 mid 右边;
        2. 最中间那个下标 mid 处的值大于等于 X,说明答案在 mid 左边。
    由此可以得到上面问题的答案,直到最后,数组左边界即为答案。
    模板见代码实现。

2.2.2 第一个大于目标值的元素下标

有一个非递减数组 arr,长度为 n,查找 arr 中第一个大于 X 的元素下标,下标从 0 开始。

    首先考虑两个特殊情况:
        1. 如果 X 小于 arr 中的最小元素,则应该返回 0
        2. 如果 X 大于 arr 中的最大元素,则应该返回 n
    然后开始查找,不过和上面查找存不存在的思路有所区别:
        1. 最中间那个下标 mid 处的值小于等于 X,说明答案在 mid 右边;
        2. 最中间那个下标 mid 处的值大于 X,说明答案在 mid 左边。
    由此可以得到上面问题的答案,直到最后,数组左边界即为答案。
    模板见代码实现。

2.2.3 最后一个小于等于目标值的元素下标

有一个非递减数组 arr,长度为 n,查找 arr 中最后一个小于等于 X 的元素下标,下标从 0 开始。

    易知,最后一个小于等于目标值的元素下标 = 第一个大于目标值的元素下标 - 1

2.2.3 最后一个小于目标值的元素下标

有一个非递减数组 arr,长度为 n,查找 arr 中最后一个小于 X 的元素下标,下标从 0 开始。

    易知,最后一个小于目标值的元素下标 = 第一个大于等于目标值的元素下标 - 1

2.2.4 小结

    上面的四种情况只需要实现两种情况即可,参照 C++lower_boundupper_bound 函数。其余两种情况可以由另外两种情况转化而来。容易知道的是,前两种情况返回值的取值范围是 [0,n],后两种的返回值取值返回为 [-1,n-1],在应用二分查找时需要注意这些边界情况并小心处理。

3 代码实现

3.1 本题代码实现

3.1.1 递归法

Position BinarySearchHelp(List L, ElementType X, Position l, Position r) {
    if (l > r) return NotFound;
    Position mid = l + (r - l) / 2;
    if (L->Data[mid] == X) {
        return mid;
    }
    if (L->Data[mid] > X) {
        return BinarySearchHelp(L, X, l, mid - 1);
    }
    return BinarySearchHelp(L, X, mid + 1, r);
}

Position BinarySearch(List L, ElementType X) {
    return BinarySearchHelp(L, X, 1, L->Last);
}

3.1.2 迭代法

Position BinarySearch(List L, ElementType X) {
    Position l = 1, r = L->Last, mid = 0;
    while (l <= r) {
        mid = l + (r - l) / 2;
        if (L->Data[mid] == X) {
            return mid;
        }
        if (L->Data[mid] > X) {
            r = mid - 1;
        } else {
            l = mid + 1;
        }
    }
    return NotFound;
}

3.2 常用模板

2.2.1 第一个大于等于目标值的元素下标

int first_ge(int* arr, int n, int target) {
    int l = 0, r = n - 1, mid = 0;
    while (l <= r) {
        mid = l + (r - l) / 2;
        if (arr[mid] >= target) {
            r = mid - 1;
        } else {
            l = mid + 1;
        }
    }
    return l;
}

2.2.2 第一个大于目标值的元素下标

int first_ge(int* arr, int n, int target) {
    int l = 0, r = n - 1, mid = 0;
    while (l <= r) {
        mid = l + (r - l) / 2;
        if (arr[mid] > target) {
            r = mid - 1;
        } else {
            l = mid + 1;
        }
    }
    return l;
}

4 总结

    二分算法是一种思想,就像基本原理一样,原理很好懂,但是实现方法千变万化,喜好因人而异,上面所记录的都是一种 闭区间 的写法,即数组的左边界和右边界都是同时取得到的,另外还有 左闭右开 写法,比如 C++lower_bound 函数等,以及 开区间 等写法,其实原理就一个:二分,答案在哪边,就往哪边走。


http://www.kler.cn/a/549225.html

相关文章:

  • 【LeetCode】438.找到字符串中所有的字母异位词
  • 请解释设备像素、CSS 像素、设备独立像素、DPR、PPI 之间的区别?
  • 详解如何使用Pytest内置Fixture tmp_path 管理临时文件
  • Redis之持久化
  • VUE3环境搭建
  • 【iOS】SwiftUI状态管理
  • Kotlin 2.1.0 入门教程(十八)函数式接口
  • AI与SEO协同:智能关键词挖掘与精准部署策略
  • 2025年前端工程师职业发展的系统性应聘规划
  • 深度学习(1)-简单神经网络示例
  • 【力扣】98.验证搜索二叉树
  • 2025 N1CTF crypto 复现
  • linux-5.10.110内核源码分析 - bcm2711 pcie BAR地址分配
  • Vue 3 30天精进之旅:Day 26 - SSR与Nuxt.js
  • Linux、Docker与Redis核心知识点与常用命令速查手册
  • haproxy实现MySQL服务器负载均衡
  • 用队列实现栈
  • pycharm上传github问题:rejected
  • 基于fastadmin快速搭建导航站和API接口站点系统源码
  • 【VB语言】EXCEL中VB宏的应用