百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

大厂面试:找出数组中第k大的数的最佳算法

wptr33 2024-12-13 16:37 12 浏览

一.前置条件

假如数组为a,大小为n,要找到数组a中第k大的数。

二.解决方案

1.使用任意一种排序算法(例如快速排序)将数组a进行从大到小的排序,则第n-k个数即为答案。

2.构造一个长度为k的数组,将前k个数复制过来并降序排序。然后依次将 k+1 到 n 位的数分别插入 k 长度的数组中并保持数组长度为k且降序排列。最终长度为k的数组的最后一个元素即是答案。

3.将数组的所有元素构造一个大顶堆,然后删除堆顶元素k次并重新构成大顶堆,则第k次操作后的堆顶元素即为答案。

4.用快速排序的思想不把数组元素全排序的优化算法。

1)先看一下快速排序(降序排序)的算法。

/**
快速排序主函数
a:要排序的数组
left:排序数组左边界索引
right:排序数组右边界索引
*/
public void quickSort(int a[], int left, int right) {
  if (left < right) {
  //算出基准元素索引值index
  int index = partition(a, left, right);
  //对低于index索引的数组递归排序
  quickSort(a, left, index - 1);
  //对高于index索引的数组递归排序
  quickSort(a, index + 1, right);
  }
}
//算出基准元素索引值,此索引值左侧值都大于基准元素值,此索引值右侧值都小于基准元素值
public int partition(int[] num, int left, int right) {
  if (num == null || num.length <= 0 || left < 0 || right >= num.length) {
  	return 0;
  }
  //获取数组基准元素的下标
  int prio = num[left + (right - left) / 2];
  //从两端交替向中间扫描
  while (left <= right) {
    while (num[left] > prio)
   	 left++;
    while (num[right] < prio)
   	 right--;
    if (left <= right) {
      //将不符合条件的元素值交换位置并继续扫描
      swap(num, left, right);
      left++;
      right--;
    }
  }
  return left;
}
//交换元素
public void swap(int[] num, int left, int right) {
  int temp = num[left];
  num[left] = num[right];
  num[right] = temp;
}

2)我们选择数组区间 a[0…n-1]的中间位置的一个元素 a[n/2]作为 pivot,对数组 a[0…n-1]进行分区,这样数组就分成了三部分,a[0…p-1]、a[p]、a[p+1…n-1]。

如果 p+1=k,那 a[p]就是要求解的答案;如果 k>p+1, 说明第 k 大元素出现在 a[p+1…n-1]区间,我们再按照上面的思路递归的在 a[p+1…n-1]这个区间内查找。同理,如果 k<p+1,那就在 a[0…p-1]区间内递归查找。

3)所以改进后的代码如下:

public int quickSortKthLargest(int a[], int left, int right, int k) {
  if (left < right) {
    //算出基准元素索引值index
    int index = partition(a, left, right);
    //索引对应的值就是第k大的数
    if(index+1==k){
    return a[index];
    }
    //在索引左边继续查找
    else if(index+1>k){
     return quickSortKthLargest(a, left, index-1, k);
    }
    //在索引右边继续查找
    else{
     return quickSortKthLargest(a, index+1, right, k);
    }

  }else{
  	return -1;
  }
}

5.在Python中,我们可以使用内置的heapq库来查找数组的第k大元素。heapq库实现了一个堆数据结构,我们可以利用堆的性质来找到数组的第k大元素。

代码如下:

# 返回第k大元素
def get_kth_largest(a, k):
  # heapq.nlargest(k, a)会返回数组a中最大的k个元素,
  # 然后我们通过[-1]来取得这k个元素中的最后一个,也就是第k大的元素。
  return heapq.nlargest(k, a)[-1]

6.使用最小堆来查找第k大的元素。

首先构建一个空的最小堆。遍历数组a,如果堆的大小小于k,我们就把当前元素加入堆中。如果堆的大小已经达到了k,我们就比较当前元素和堆顶元素(也就是堆中的最小元素),如果当前元素大于堆顶元素,我们就把堆顶元素替换为当前元素,再重新调整最小堆结构。这样,当遍历完整个数组后,堆顶元素就是数组的第k大元素(即是大小为k的最小堆(保存了数组中的最大的k个数)的最小元素)。

代码如下:

def get_kth_largest(a, k):
  heap = []
  for num in a:
    # 若最小堆大小小于k,则将元素插入最小堆
    if len(heap) < k:
   	 heapq.heappush(heap, num)
    else:
    # 若元素大于最小堆堆顶元素,则插入最小堆并重新排列
    if num > heap[0]:
    	heapq.heapreplace(heap, num)
  # 堆顶元素即为数组的第k大元素
  return heap[0]




致力于C、C++、Java、Kotlin、Android、Shell、JavaScript、TypeScript、Python等编程技术的技巧经验分享。

若作品对您有帮助,请关注、分享、点赞、收藏、在看、喜欢。您的支持是我们为您提供帮助的最大动力。

相关推荐

用Java实现RAG的3大核心模块与7个必知细节

一、真实场景驱动:某制造企业的知识管理之痛某汽车零部件企业有超过20万份技术文档(PDF/HTML/Word),工程师每天平均花费2小时查找资料。我们为其构建的Java版RAG系统,将查询耗时缩短至1...

在 C# .NET 中从 PDF 中提取表数据

概述:...

【分享】教你如何使用 Java 读取 Excel、docx、pdf 和 txt 文件

在Java开发中,我们经常需要读取不同类型的文件,包括Excel表格文件、"doc"和"docx"文档文件、PDF文件以及纯文本文件。其中最常用的是A...

Spring AI 模块架构与功能解析

SpringAI是Spring生态系统中的一个新兴模块,专注于简化人工智能和机器学习技术在Spring应用程序中的集成。本文将详细介绍SpringAI的核心组件、功能模块及其之间的关...

告别付费!一站式服务,PDF多功能工具!

大家好,我是Java陈序员。今天,给大家介绍一个PDF多功能在线操作工具,完全免费开源!...

本地PDF操作神器:永久告别盗版和破解,再也不用担心安全问题

前言PDF(便携式文档格式)目前已经成为了文档交换和存储的标准。然而,找到一个功能全面、安全可靠、且完全本地化的PDF处理工具并不容易。...

Python rembg 库去除图片背景

rembg是一个强大的Python库,用于自动去除图片背景。它基于深度学习模型(如U^2-Net),能够高效地将前景物体从背景中分离,生成透明背景的PNG图像。本教程将带你从安装到实际应用...

31个必备的python字符串方法,建议收藏

字符串是Python中基本的数据类型,几乎在每个Python程序中都会使用到它。...

python学习day1——输出格式化

print一般在控制台中我们用print进行输出,默认情况下,使用格式为:print(*objects,sep='',end='\n')第一个参数是我们要在控制台...

一张图认识Python(附基本语法总结)

一张图认识Python(附基本语法总结)一张图带你了解Python,更快入门,一张图认识Python(附基本语法总结)Python基础语法总结:1.Python标识符在Python里,标识符有字...

学习编程第188天 python编程 字典格式化

今天学习的是刘金玉老师零基础Python教程第84期,主要内容是python字典格式化。...

Python基础数据类型转换

Python中的基础数据类型转换可以分为隐式转换和显示转换。隐式转换是python解释器自动转换,显示转换是通过内置函数实现。无论哪种方式进行的转换,均为转换为对应类型的数据,而非改变原数据的类型。...

python之json基本操作

1.概述JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它具有简洁、清晰的层次结构,易于阅读和编写,还可以有效的提升网络传输效率。Python标准库的...

Python之迭代器及其用法

前面章节中,已经对列表(list)、元组(tuple)、字典(dict)、集合(set)这些序列式容器做了详细的介绍。值得一提的是,这些序列式容器有一个共同的特性,它们都支持使用for循环遍历存储...

从初始化一个现代 python项目学习到的东西

uv我准备用uv初始化一个python项目环境我用的是苹果笔记本MacBookPro,具体的操作系统及硬件参数如下:...