網友評分: 9.7分
Hashing(加密哈希生成程序)是一款功能強大的加密哈希生成工具。你是不是在找占空間小的加密哈希生成軟件?那就來下載Hashing免費版使用。它支持MD5、SHA-1、SHA-224、SHA-256、SHA-385、SHA-512。您可以在短時間里處理您想要的文件數量。您也可以手工輸入十六進制。
哈希值,即HASH值,是通過對文件內容進行加密運算得到的一組二進制值,主要用途是用于文件校驗或簽名。
不同的文件(哪怕細微的差異)得到的哈希值均不相同,因此哈希值可做為文件唯一性判別。
對于普通上網者而言,可以通過對下載后的文件進行哈希值較驗,以判斷該文件是否在發布后被人修改過,保證下載的正確性。
類似的還有md5校驗。
隨機生成編輯
隨機數生成是許多加密操作不可分割的組成部分。例如,加密密鑰需要盡可能地隨機,以便使生成的密鑰很難再現。加密隨機數生成器必須生成無法以計算方法推算出(低于 p < .05 的概率)的輸出;即,任何推算下一個輸出位的方法不得比隨機猜測具有更高的成功概率。.NET Framework 中的類使用隨機數生成器生成加密密鑰。
RNGCrypto Service Provider 是隨機數生成器算法的實現。
散列函數的性質編輯
所有散列函數都有如下一個基本特性:如果兩個散列值是不相同的(根據同一函數),那么這兩個散列值的原始輸入也是不相同的。這個特性是散列函數具有確定性的結果,具有這種性質的散列函數稱為單向散列函數。但另一方面,散列函數的輸入和輸出不是唯一對應關系的,如果兩個散列值相同,兩個輸入值很可能是相同的,但也可能不同,這種情況稱為“散列碰撞(collision)”,這通常是兩個不同長度的輸入值,刻意計算出相同的輸出值。輸入一些數據計算出散列值,然后部分改變輸入值,一個具有強混淆特性的散列函數會產生一個完全不同的散列值。
典型的散列函數都有非常大的定義域,比如SHA-2最高接受(2-1)/8長度的字節字符串。同時散列函數一定有著有限的值域,比如固定長度的比特串。在某些情況下,散列函數可以設計成具有相同大小的定義域和值域間的單射。散列函數必須具有不可逆性。
散列函數的應用編輯
由于散列函數的應用的多樣性,它們經常是專為某一應用而設計的。例如,加密散列函數假設存在一個要找到具有相同散列值的原始輸入的敵人。一個設計優秀的加密散列函數是一個“單向”操作:對于給定的散列值,沒有實用的方法可以計算出一個原始輸入,也就是說很難偽造。為加密散列為目的設計的函數,如SHA-2,被廣泛的用作檢驗散列函數。這樣軟件下載的時候,就會對照驗證代碼之后才下載正確的文件部分。此代碼有可能因為環境因素的變化,如機器配置或者IP地址的改變而有變動。以保證源文件的安全性。
錯誤監測和修復函數主要用于辨別數據被隨機的過程所擾亂的事例。當散列函數被用于校驗和的時候,可以用相對較短(但不能短于某個安全參數, 通常不能短于160位)的散列值來驗證任意長度的數據是否被更改過。
加密
主條目:加密散列函數
一個典型的加密單向函數是“非對稱”的,并且由一個高效的散列函數構成;一個典型的加密暗門函數是“對稱”的,并且由一個高效的隨機函數構成。
確保傳遞真實的信息
消息或數據的接受者確認消息是否被篡改的性質叫數據的真實性,也稱為完整性。發信人通過將原消息和散列值一起發送,可以保證真實性。
散列表
主條目:散列表
散列表是散列函數的一個主要應用,使用散列表能夠快速的按照關鍵字查找數據記錄。(注意:關鍵字不是像在加密中所使用的那樣是秘密的,但它們都是用來“解鎖”或者訪問數據的。)例如,在英語字典中的關鍵字是英文單詞,和它們相關的記錄包含這些單詞的定義。在這種情況下,散列函數必須把按照字母順序排列的字符串映射到為散列表的內部數組所創建的索引上。
散列表散列函數的幾乎不可能/不切實際的理想是把每個關鍵字映射到唯一的索引上(參考完美散列),因為這樣能夠保證直接訪問表中的每一個數據。
一個好的散列函數(包括大多數加密散列函數)具有均勻的真正隨機輸出,因而平均只需要一兩次探測(依賴于裝填因子)就能找到目標。同樣重要的是,隨機散列函數不太會出現非常高的沖突率。但是,少量的可以估計的沖突在實際狀況下是不可避免的(參考生日悖論或鴿洞原理)。
在很多情況下,heuristic散列函數所產生的沖突比隨機散列函數少的多。Heuristic函數利用了相似關鍵字的相似性。例如,可以設計一個heuristic函數使得像FILE0000.CHK,FILE0001.CHK,FILE0002.CHK,等等這樣的文件名映射到表的連續指針上,也就是說這樣的序列不會發生沖突。相比之下,對于一組好的關鍵字性能出色的隨機散列函數,對于一組壞的關鍵字經常性能很差,這種壞的關鍵字會自然產生而不僅僅在攻擊中才出現。性能不佳的散列函數表意味著查找操作會退化為費時的線性搜索。
錯誤校正
主條目:錯誤校正與檢測
使用一個散列函數可以很直觀的檢測出數據在傳輸時發生的錯誤。在數據的發送方,對將要發送的數據應用散列函數,并將計算的結果同原始數據一同發送。在數據的接收方,同樣的散列函數被再一次應用到接收到的數據上,如果兩次散列函數計算出來的結果不一致,那么就說明數據在傳輸的過程中某些地方有錯誤了。這就叫做冗余校驗。
校正錯誤時,至少會對可能出現的擾動大致假定一個分布模式。對于一個信息串的微擾可以被分為兩類,大的(不可能的)錯誤和小的(可能的)錯誤。我們對于第二類錯誤重新定義如下,假如給定H(x)和x+s,那么只要s足夠小,我們就能有效的計算出x。那樣的散列函數被稱作錯誤校正編碼。這些錯誤校正編碼有兩個重要的分類:循環冗余校驗和里德-所羅門碼。
語音識別
對于像從一個已知列表中匹配一個MP3文件這樣的應用,一種可能的方案是使用傳統的散列函數——例如MD5,但是這種方案會對時間平移、CD讀取錯誤、不同的音頻壓縮算法或者音量調整的實現機制等情況非常敏感。使用一些類似于MD5的方法有利于迅速找到那些嚴格相同(從音頻文件的二進制數據來看)的音頻文件,但是要找到全部相同(從音頻文件的內容來看)的音頻文件就需要使用其他更高級的算法了。
那些并不緊隨IT工業潮流的人往往能反其道而行之,對于那些微小差異足夠健壯的散列函數確實存在?,F存的絕大多數散列算法都是不夠健壯的,但是有少數散列算法能夠達到辨別從嘈雜房間里的揚聲器里播放出來的音樂的健壯性。有一個實際的例子是Shazam服務。用戶可以用手機打開其app,并將話筒靠近用于播放音樂的揚聲器。該項服務會分析正在播放的音樂,并將它于存儲在數據庫中的已知的散列值進行比較。用戶就能夠收到被識別的音樂的曲名。
Rabin-Karp字符串搜索算法
Rabin-Karp字符串搜索算法是一個相對快速的字符串搜索算法,它所需要的平均搜索時間是O(n).這個算法是創建在使用散列來比較字符串的基礎上的。
應用編輯
HASH是根據文件的內容的數據通過邏輯運算得到的數值, 不同的文件(即使是相同的文件名)得到的HASH值是不同的, 所以HASH值就成了每一個文件在電驢(eMule)里的身份證.
不同HASH值的文件在電驢(eMule)里被認為是不同的文件,相同的HASH值的文件的內容肯定是完全相同(即使文件名不同).
HASH值還有文件校驗的功能,相當于文件的校驗碼. 所以還可以用來檢查文件下載是否正確(所以電驢(eMule)下載完畢時,都會再HASH文件一遍, 檢查文件是否出錯)。
標簽: 哈希