查找概念
查找(Searching): 即根據給定的某個值,在查找表中確定一個其關鍵字給定值的數據元素(或記錄)。
查找表(Search Table):有同一類型的數據元素(或記錄)構成的集合。
關鍵字(Key): 數據元素中某個數據項的值,又稱鍵值,可用于標識一個數據元素。
主關鍵字(Primary Key): 可以唯一標識一個記錄的關鍵字。
次關鍵字(Secondary Key): 可以識別多個數據元素(或記錄)的關鍵字。
查找表分類
-
靜態查找(Static Search Table):只作查找操作的查找表。主要操作有:
- 查詢某個“特定的”數據元素是否在查找表中。
- 檢索某個“特定的”數據元素和各種屬性。
-
動態查找表(Dynamic Search Table):在查找過程中同時插入查找表中不存在的數據元素,或者從查找表中刪除已經存在的某個特定的數據元素。主要操作有兩個:
- 查找時插入數據元素;
- 查找時刪除數據元素。
一、順序查找
順序查找(Sequential Search)又叫線性查找,是最基本查找技術,它的查找過程是:從表中第一個(或最后一個)記錄開始,逐個進行記錄關鍵字和給定值比較,若相等,則查找成功,返回查找記錄;若知道最后一個記錄都不相等,則表中沒有所查的記錄,查找不成功。
順序查找代碼實現
/**
* 1.順序查找
* a是要查找的數組
* n是查找的數組個數, key為查找的關鍵字
*/
int sequence_search(int *a, int n, int key){
for (int i = 1; i < n; i++) {
if (a[i] == key)
return i;
}
return 0; // 返回0表示沒找到
}
順序查找優化
因為上一段代碼每次循環時都需要對i
是否越界進行判斷,實際上可以省去這一步,就是添加一個哨兵來解決。
在查找方向的盡頭(查找表第一個元素或者最后一個元素)放置“哨兵”,免去查找過程越界的判斷。
順序查找優化代碼實現(添加哨兵)
/**
* 1.1順序查找優化,添加哨兵
* 注意 這里將a[0]設置為哨兵 那么a[0]就不能用來存儲需要查找的數據
* 如果找到 返回的數據表示在數組中索引所在的位置 從0開始的 也就是說如果返回的是1的話 是數組的第二個元素 所以可以在返回的結果上+1
* 同樣 這兒哨兵也可以放在數組的尾巴上 a[n-1] = key
*/
int guard_search(int *a, int n, int key){
int i = n;
a[0] = key; // 哨兵
while (a[i] != key)
i--;
return i; // 返回0表示沒找到
}
代碼解釋
- 代碼從尾部開始查找。
- 由于
a[0] = key
,那么在a[i] = key
時,返回i
值,查找成功。否者一定在最終的a[0]
處等于key
,此時返回的是0,查找失敗。 - 這里將
a[0]
設置為哨兵 那么a[0]
就不能用來存儲需要查找的數據。 - 哨兵也可以放在數組的尾巴上
a[n-1] = key
,那么這里也不能用來存放數據查找數據。
順序查找總結
- 順序查找平均查找次數為
(n+1)/2
。 - 順序查找的時間復雜度為
O(n)
. - 查找效率低下,在一些小型數據查找時適用。
二、折半查找(二分查找)
- 折半查找前提:線性表中的記錄必須是關鍵碼有序(通常從小到大有序),線性表必須采用順序存儲。
-
折半查找的基本思想:
- 在有序表中,取中間記錄作為比較對象,若給定值 = 中間記錄的關鍵字,則查找成功。
- 給定值 < 中間記錄關鍵字,則在中間記錄左半區域繼續查找;
- 給定值 > 中間記錄關鍵字,則在中間記錄右半區域繼續查找;
- 不斷重復上述過程,直到查找成功,若所有查找區域無記錄,查找失敗為止。
折半查找(二分查找)代碼實現
/**
* 2.二分查找
*/
int Binary_Search(int * a, int n, int key){
int low,mid,high;
low = 1;
high = n;
while (low <= high) {
mid = (low + high) / 2;
if (a[mid] < key)
low = mid + 1;
else if(a[mid] > key)
high = mid - 1;
else
return mid;
}
return 0; // 找不到 返回0
}
折半查找總結
- 折半查找的時間復雜度為
O(logn)
。明顯優于順序查找。 - 折半查找的前提條件需要有序的順序存儲,對于靜態查找表比較合適。
三、插值查找
對于插值查找,就是對于二分查找的優化,將二分查找中的mid = (low + high) / 2
改為mid = low + (high - low) * (key - a[low]) / (a[high] - a[low])
。
插值查找是根據查找關鍵子key與查找表中最大最小記錄關鍵字比較后的查找方法,核心在于插值計算公式(key-a[low])/(a[high] - a[low])
。
插值查找代碼實現
/**
* 3.插值查找
*/
int Insert_Search(int * a, int n, int key){
int low,mid,high;
low = 1;
high = n;
while (low < high) {
mid = low + (high - low) * (key - a[low]) / (a[high] - a[low]);
if (a[mid] < key)
low = mid + 1;
else if(a[mid] > key)
high = mid - 1;
else
return mid;
}
return 0; // 沒找到 返回0
}
插值查找總結
- 時間復雜度依舊為
O(logn)
。 - 對于表長較大,而關鍵字分部比較均勻的查找表來說,平均性能要比折半好很多。
- 如果數組中的分部類似{1,100,200,1000,10000...10000}這種極端不均勻的數據,用插值法也不太合適。
四、菲波那切查找
- 菲波那切查找是利用黃金分割原理來實現的。
- 菲波那切查找用到了菲波那切數列,關于在這里有提到過遞歸和分治思想之遞歸
-
斐波那契查找首先要利用斐波那契數列數組來進行黃金分割。
菲波那切查找代碼
int F[100]; //斐波那契數列
/**
* 4.斐波那契查找
*/
int Fibonacci_Search(int *a, int n, int key){
int low, mid, high, i, k = 0;
low = 1;
high = n;
while (n > F[k] - 1)
k++;
for (i = n; i < F[k] - 1; i++)
a[i] = a[n];
while (low <= high) {
mid = low + F[k-1]-1;
if (key < a[mid]) {
high = mid - 1;
k = k - 1;
}else if (key > a[mid]){
low = mid + 1;
k = k - 2;
}else{
if (mid <= n)
return mid; // 若相等則說明mid即為查找到的位置
else
return n;
}
}
return 0;
}
測試
int main(int argc, const char * argv[]) {
int arr[] = {1000,2,3,4,5,6,7,8,9,10};
int key = 2; // 要查找的值
int reslut = sequence_search(arr, 10, key);
printf("1. 順序查找\nreslut = %d\n", reslut);
int reslut2 = guard_search(arr, 9, key);
printf("\n1.1 順序查找(哨兵模式)\nreslut2 = %d\n", reslut2);
int result3 = Binary_Search(arr, 10, key);
printf("\n2. 折半查找\nreslut3 = %d\n", result3);
int result4 = Insert_Search(arr, 10, key);
printf("\n2.1 插入查找\nreslut4 = %d\n", result4);
F[0] = 0;
F[1] = 1;
for (int i = 2; i < 100; i++)
F[i] = F[i-1] + F[i-2];
int result5 = Fibonacci_Search(arr, 10, key);
printf("\n3. 斐波那契查找\nreslut5 = %d\n", result5);
return 0;
}
測試