
數(shù)據(jù)結(jié)構(gòu)常見的八大排序算法
八大排序,三大查找是《數(shù)據(jù)結(jié)構(gòu)》當(dāng)中非?;A(chǔ)的知識點,在這里為了復(fù)習(xí)順帶總結(jié)了一下常見的八種排序算法。
常見的八大排序算法,他們之間關(guān)系如下:
排序算法
他們的性能比較:
性能比較
下面,利用Python分別將他們進行實現(xiàn)。
直接插入排序
算法思想:
直接插入排序
直接插入排序的核心思想就是:將數(shù)組中的所有元素依次跟前面已經(jīng)排好的元素相比較,如果選擇的元素比已排序的元素小,則交換,直到全部元素都比較過。
因此,從上面的描述中我們可以發(fā)現(xiàn),直接插入排序可以用兩個循環(huán)完成:
第一層循環(huán):遍歷待比較的所有數(shù)組元素
第二層循環(huán):將本輪選擇的元素(selected)與已經(jīng)排好序的元素(ordered)相比較。
如果:selected>ordered,那么將二者交換
代碼實現(xiàn)
希爾排序
算法思想:
希爾排序
希爾排序的算法思想:將待排序數(shù)組按照步長gap進行分組,然后將每組的元素利用直接插入排序的方法進行排序;每次將gap折半減小,循環(huán)上述操作;當(dāng)gap=1時,利用直接插入,完成排序。
同樣的:從上面的描述中我們可以發(fā)現(xiàn):希爾排序的總體實現(xiàn)應(yīng)該由三個循環(huán)完成:
第一層循環(huán):將gap依次折半,對序列進行分組,直到gap=1
第二、三層循環(huán):也即直接插入排序所需要的兩次循環(huán)。具體描述見上。
代碼實現(xiàn):
簡單選擇排序
算法思想
簡單選擇排序
簡單選擇排序的基本思想:比較+交換。
從待排序序列中,找到關(guān)鍵字最小的元素;
如果最小元素不是待排序序列的第一個元素,將其和第一個元素互換;
從余下的N-1個元素中,找出關(guān)鍵字最小的元素,重復(fù)(1)、(2)步,直到排序結(jié)束。
因此我們可以發(fā)現(xiàn),簡單選擇排序也是通過兩層循環(huán)實現(xiàn)。
第一層循環(huán):依次遍歷序列當(dāng)中的每一個元素
第二層循環(huán):將遍歷得到的當(dāng)前元素依次與余下的元素進行比較,符合最小元素的條件,則交換。
代碼實現(xiàn):
堆排序
堆的概念
堆:本質(zhì)是一種數(shù)組對象。特別重要的一點性質(zhì):任意的葉子節(jié)點小于(或大于)它所有的父節(jié)點。對此,又分為大頂堆和小頂堆,大頂堆要求節(jié)點的元素都要大于其孩子,小頂堆要求節(jié)點元素都小于其左右孩子,兩者對左右孩子的大小關(guān)系不做任何要求。
利用堆排序,就是基于大頂堆或者小頂堆的一種排序方法。下面,我們通過大頂堆來實現(xiàn)。
基本思想:
堆排序可以按照以下步驟來完成:
首先將序列構(gòu)建稱為大頂堆;
(這樣滿足了大頂堆那條性質(zhì):位于根節(jié)點的元素一定是當(dāng)前序列的最大值)
構(gòu)建大頂堆
取出當(dāng)前大頂堆的根節(jié)點,將其與序列末尾元素進行交換;
(此時:序列末尾的元素為已排序的最大值;由于交換了元素,當(dāng)前位于根節(jié)點的堆并不一定滿足大頂堆的性質(zhì))
對交換后的n-1個序列元素進行調(diào)整,使其滿足大頂堆的性質(zhì);
Paste_Image
重復(fù)2.3步驟,直至堆中只有1個元素為止
代碼實現(xiàn):
冒泡排序
基本思想
冒泡排序
冒泡排序思路比較簡單:
將序列當(dāng)中的左右元素,依次比較,保證右邊的元素始終大于左邊的元素;
(第一輪結(jié)束后,序列最后一個元素一定是當(dāng)前序列的最大值;)
對序列當(dāng)中剩下的n-1個元素再次執(zhí)行步驟1。
對于長度為n的序列,一共需要執(zhí)行n-1輪比較
(利用while循環(huán)可以減少執(zhí)行次數(shù))
*代碼實現(xiàn):
快速排序
算法思想:
快速排序
快速排序的基本思想:挖坑填數(shù)+分治法
從序列當(dāng)中選擇一個基準(zhǔn)數(shù)(pivot)
在這里我們選擇序列當(dāng)中第一個數(shù)最為基準(zhǔn)數(shù)
將序列當(dāng)中的所有數(shù)依次遍歷,比基準(zhǔn)數(shù)大的位于其右側(cè),比基準(zhǔn)數(shù)小的位于其左側(cè)
重復(fù)步驟1.2,直到所有子集當(dāng)中只有一個元素為止。
用偽代碼描述如下:
1.i=L;j=R;將基準(zhǔn)數(shù)挖出形成第一個坑a[i]。
2.j--由后向前找比它小的數(shù),找到后挖出此數(shù)填前一個坑a[i]中。
3.i++由前向后找比它大的數(shù),找到后也挖出此數(shù)填到前一個坑a[j]中。
4.再重復(fù)執(zhí)行2,3二步,直到i==j,將基準(zhǔn)數(shù)填入a[i]中
代碼實現(xiàn):
歸并排序
算法思想:
歸并排序
歸并排序是建立在歸并操作上的一種有效的排序算法,該算法是采用分治法的一個典型的應(yīng)用。它的基本操作是:將已有的子序列合并,達(dá)到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。
歸并排序其實要做兩件事:
分解----將序列每次折半拆分
合并----將劃分后的序列段兩兩排序合并
因此,歸并排序?qū)嶋H上就是兩個操作,拆分+合并
如何合并?
L[first...mid]為第一段,L[mid+1...last]為第二段,并且兩端已經(jīng)有序,現(xiàn)在我們要將兩端合成達(dá)到L[first...last]并且也有序。
首先依次從第一段與第二段中取出元素比較,將較小的元素賦值給temp[]
重復(fù)執(zhí)行上一步,當(dāng)某一段賦值結(jié)束,則將另一段剩下的元素賦值給temp[]
此時將temp[]中的元素復(fù)制給L[],則得到的L[first...last]有序
如何分解?
在這里,我們采用遞歸的方法,首先將待排序列分成A,B兩組;然后重復(fù)對A、B序列
分組;直到分組后組內(nèi)只有一個元素,此時我們認(rèn)為組內(nèi)所有元素有序,則分組結(jié)束。
代碼實現(xiàn):
基數(shù)排序
算法思想
基數(shù)排序:通過序列中各個元素的值,對排序的N個元素進行若干趟的“分配”與“收集”來實現(xiàn)排序。
分配:我們將L[i]中的元素取出,首先確定其個位上的數(shù)字,根據(jù)該數(shù)字分配到與之序號相同的桶中
收集:當(dāng)序列中所有的元素都分配到對應(yīng)的桶中,再按照順序依次將桶中的元素收集形成新的一個待排序列L[]
對新形成的序列L[]重復(fù)執(zhí)行分配和收集元素中的十位、百位...直到分配完該序列中的最高位,則排序結(jié)束
根據(jù)上述“基數(shù)排序”的展示,我們可以清楚的看到整個實現(xiàn)的過程
代碼實現(xiàn)
后記
寫完之后運行了一下時間比較:
1w個數(shù)據(jù)時:
10w個數(shù)據(jù)時:
從運行結(jié)果上來看,堆排序、歸并排序、基數(shù)排序真的快。數(shù)據(jù)分析培訓(xùn)
對于快速排序迭代深度超過的問題,可以將考慮將快排通過非遞歸的方式進行實現(xiàn)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10