網友評分: 9.7分
貴鶴語料管理與檢索助手支持單關鍵詞和語法組合結構查詢的語料管理和檢索工具。支持語料庫自建管理, 并可用以提取文獻中的語句,可將對話和敘述語句分別提取,適合漢語語法研究人員使用。
語料庫是語料庫語言學研究的基礎資源,也是經驗主義語言研究方法的主要資源。應用于詞典編纂,語言教學,傳統語言研究,自然語言處理中基于統計或實例的研究等方面。
?、闭Z料庫中存放的是在語言的實際使用中真實出現過的語言材料,因此例句庫通常不應算作語料庫;
?、舱Z料庫是承載語言知識的基礎資源,但并不等于語言知識;
?、痴鎸嵳Z料需要經過加工(分析和處理),才能成為有用的資源。
一、語料管理
所有語料均存放于程序目錄corpus文件夾中。
1、加入語料
可通過兩種方式加入語料:一是直接復制語料(TXT文檔)到corpus文件夾中,二是通過軟件界面“加入語料”按鈕進入加入語料操作界面進行操作。
2、刪除語料
為確保不誤刪語料,軟件界面上不提供刪除語料的操作功能,只能從程序目錄corpus文件夾中進行操作。
3、語料分類分級
在corpus文件夾根據語料類別建立新文件夾,以語料類別名稱命名,即可建立一個語料類別。每個文件夾下的文件夾都算一個子類。比如建立一個“北方話”的文件夾,該文件夾下又可建立“東北話”、“西北話”、“北京話”等子文件夾,每個子文件夾下放入相應的語料TXT文檔,軟件運行后,即可在軟件右側文獻列表中看到相應的樹形目錄。
二、語料檢索
語料查詢時,一定要先在文獻列表中選中相應的文獻??梢砸淮芜x擇多篇文獻后進行檢索。
1、單個關鍵詞檢索
在關鍵詞輸入框中輸入一個關鍵詞,設置好左右顯示字數(即關鍵詞左右兩側的字數),點“搜索”按鈕,就可以搜索到所選文獻中含關鍵詞的語句并顯示到搜索提取語句列表中。
2、雙關鍵詞組合檢索
在關鍵詞輸入框中輸入兩個關鍵詞,兩詞之間以一個空格符號間隔,右側設置關鍵詞的配合模式(1、兩關鍵詞間隔字符數;2、第二詞在第一詞之后的多少字符范圍內),點“搜索”按鈕,即可檢索出符合兩關鍵詞配合特點的語句并提取顯示出來。
三、文獻語句提取
1、提取對話句:選中文獻,點“提取對話句”按鈕,會將文獻中引號內的對話語句提出出來以供進一上使用。
2、提取敘述句:選中文獻,點“提取對話句”按鈕,會將文獻中對話之外的敘述句提取出來以供進一步使用。
3、提取所有語句:不區分對話和敘述類別,以漢語常用的斷句標點作標記,按順序逐句提取所有語句。由于是單線程方式提取,速度比較慢。字數較多的文獻花的時間可能較多。