網友評分: 4.4分
stata是一款功能強大的圖表繪制軟件,能夠幫助用戶輕松進行各種統計分析,包括管理、分析、繪制定量數據等,提高大家的工作效率。軟件結合了強大的數據編輯器、散點圖、直方圖等功能,為數據的統計分析工作提供了幫助。
一、統計功能
1、統計功能很強,除了傳統的統計分析方法外,還收集了近 20 年發展起來的新方法,如 Cox 比例風險回歸,指數與 Weibull 回歸,多類結果與有序結果的 logistic 回歸, Poisson 回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。具體說, 具有如下統計分析能力:
2、數值變量資料的一般分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,交互效應模型,平衡和非平衡設計,嵌套設計,隨機效應,多個均數的兩兩比較,缺項數據的處理,方差齊性檢驗,正態性檢驗,變量變換等。
3、分類資料的一般分析:參數估計,列聯表分析 ( 列聯系數,確切概率 ) ,流行病學表格分析等。
4、等級資料的一般分析:秩變換,秩和檢驗,秩相關等
5、相關與回歸分析:簡單相關,偏相關,典型相關,以及多達數十種的回歸分析方法,如多元線性回歸,逐步回歸,加權回歸,穩鍵回歸,二階段回歸,百分位數 ( 中位數 ) 回歸,殘差分析、強影響點分析,曲線擬合,隨機效應的線性回歸模型等。
6、其他方法:質量控制,整群抽樣的設計效率,診斷試驗評價, kappa 等。
二、作圖功能
1、作圖模塊,主要提供如下八種基本圖形的制作 : 直方圖 (histogram) ,條形圖 (bar), 百分條圖 (oneway) ,百分圓圖 (pie) ,散點圖 (twoway) ,散點圖矩陣(matrix) ,星形圖 (star) ,分位數圖。這些圖形的巧妙應用,可以滿足絕大多數用戶的統計作圖要求。在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。
2、矩陣運算功能
矩陣代數是多元統計分析的重要工具, 提供了多元統計分析中所需的矩陣基本運算,如矩陣的加、積、逆、 Cholesky 分解、 Kronecker 內積等;還提供了一些高級運算,如特征根、特征向量、奇異值分解等;在執行完某些統計分析命令后,還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等。
三、程序設計功能
1、一個統計分析軟件,但它也具有很強的程序語言功能,這給用戶提供了一個廣闊的開發應用的天地,用戶可以充分發揮自己的聰明才智,熟練應用各種技巧,真正做到隨心所欲。事實上, 軟件的 ado 文件 ( 高級統計部分 ) 都是用軟件中自己的語言編寫的
2、統計分析能力遠遠超過了 SPSS ,在許多方面也超過了 SAS !由于在分析時是將數據全部讀入內存,在計算全部完成后才和磁盤交換數據,因此計算速度極快(一般來說, SAS 的運算速度要比 SPSS 至少快一個數量級,而軟件的某些模塊和執行同樣功能的 SAS 模塊比,其速度又比 SAS 快將近一個數量級?。?程序也是采用命令行方式來操作,但使用上遠比 SAS 簡單。其生存數據分析、縱向數據(重復測量數據)分析等模塊的功能甚至超過了 SAS 。用程序繪制的統計圖形相當精美,很有特色。
四、功能列表
1、數據管理 (Data management)
資料轉換、分組處理、附加檔案、 ODBC 、行 - 列轉換、數據標記、字符串函數…等
2、基本統計 (Basic statistics)
直交表、相關性、 t- 檢定、變異數相等性檢定、比例檢定、信賴區間…等3、線性模式 (Linear models)穩健 Huber/White/sandwich 變異估計,三階最小平方法、類非相關回歸、齊次多項式回歸、 GLS4、廣義型線性模式 (Generalized linear models)
十連結函數、使用者 - 定義連結、 ML 及 IRLS 估計、九變異數估計、七殘差…等
5、二元、計數及有限應變量
(Binary,count,and limited dependent variables)
羅吉斯特、 probit 、卜松回歸、 tobit 、 truncated 回歸、條件羅吉斯特、多項式邏輯、巢狀邏輯、負二項、 zero-inflated 模型、 Heckman 選擇模式、邊際影響
6、Panel 數據 / 交叉 - 組合時間序列
(Panel data/cross-sectional time-series)
隨機及固定影響之回歸、 GEE 、隨機及固定 - 影響之卜松及負二項分配、隨機 - 影響、工具變量回歸、AR(1) 干擾回歸
7、無母數方法 (Nonparametric methods)
8、多變量方法 (Multivariate methods)
9、因素分析、多變量回歸、 anonical 相關系數
模型檢定及事后估計量支持分析
(Model testing and post-estimation support)
10、Wald 檢定、 LR 檢定、 線性及非線性組合、非線性限制檢定、邊際影響、修正平均數 Hausman 檢定11、群集分析 (Cluster analysis)
加權平均,質量中心及中位數聯結、 kmeans 、 kmedians 、 dendrograms 、停止規則、使用者擴充12、圖形 (Graphics)
直線圖、散布圖、條狀圖、圓餅圖、 hi-lo 圖、回歸診斷圖…
13、調查方法 (Survey methods)
抽樣權重、叢集抽樣、分層、線性變異數估計量、擬 - 概似最大估計量、回歸、工具變量…
14、生存分析 (Survival analysis)
Kaplan – Meier 、 Nelson – Aalen, 、 Cox 回歸 ( 弱性 ) 、參數模式 ( 弱性 ) 、危險比例測試、時間共變項、左 - 右檢查、韋柏分配、指數分配…
15、流行病學工具 (Tools for epidemiologists)比例標準化、病例控制、已配適病例控制、 Mantel – Haenszel,藥理學、 ROC 分析、 ICD-9-CM
16、時間序列 (Time series)
ARIMA 、 ARCH/GARCH 、 VAR 、 Newey – West 、 correlograms 、 periodograms 、白色 - 噪音測試 ,17、最小整數根檢定、時間序列運算、平滑化
最大概似法 (Maximum likelihood)
18、轉換及常態檢定 (Transforms and normality tests)
Box – Cox 、次方轉換 Shapiro – Wilk 、 Shapiro – Francia 檢定
其它統計方法 (Other statistical methods)
樣本數量及次方、非線性回歸、逐步式回歸 、統計及數學函數
包含樣本范例 (Sample session)
19、再抽樣及模擬方法 (Resampling and simulation methods)
bootstrapping 、 jackknife 、蒙地卡羅模擬、排列檢定
五、網絡功能
安裝新指令、網絡升級、網站檔案分享、最新消息
一、自定義您的表格
1、匯總統計
2、假設檢驗的結果
3、回歸結果
4、LR 和 Wald 檢驗、GOF 統計…
5、任何 Stata 命令的結果
二、貝葉斯計量經濟學
1、VAR模型
2、IRF 和 FEVD 分析
3、動態預測
4、面板/縱向數據模型
5、線性和非線性 DSGE 模型
三、PyStata——Python和Stata
1、從Stata調用Python。
2、從 Python 調用 Stata。
3、無縫交換數據、元數據和結果。
4、使用 Jupyter Notebook、Spyder、PyCharm IDE 等中的 Stata。
四、帶有 Stata 的 Jupyter Notebook
1、從 Jupyter Notebook 調用 Stata 和 Mata。
2、輕松重現您的作品并與他人協作。
3、在 Python 中訪問來自 Stata 分析的結果。
4、Stata 輸出、圖形和表格與您的 Jupyter Notebook 無縫集成。
五、差異中的差異 (DID) 和 DDD 模型
1、評估政策、治療或干預的效果。
2、控制混淆未觀察到的組和時間特征。
3、使用面板數據或重復的橫截面。
4、使用 DID,從 1855 年開始流行。
六、更快的Stata
1、Stata 速度很快,而且越來越快。
2、更快的排序和折疊
3、更快的混合模型
3、更快的估計命令
4、更快的導入分隔
七、Java集成
1、在 Stata 中以交互方式使用 Java(如 JShell)。
2、在 do 文件中嵌入 Java 代碼。
3、在 ado 文件中嵌入 Java 代碼。
4、無需外部程序即可“即時”編譯和執行 Java 代碼。
一、直方圖畫法
1、輸入命令【sysuse auto,clear】,導入自帶數據集1978 Automobile Data。(小編這里以Stata自帶的數據庫為例。)
2、下面,我們做變量Price的直方圖。輸入命令【histogram price】即可完成,如下圖。會自動根據變量的取值范圍,設置相應的橫縱坐標,非常方便。
二、折線圖畫法
1、如果要制作兩個變量的折線圖,輸入命令【line y x】,例如這里我們做price和weight的折線圖,效果如下
2、此外,還可以做多個變量間的折線圖,輸入命令【line price weight turn】,效果如下,當變量較多時折線圖看起來較亂。
1、新的元分析套件;改進和擴展的選擇建模(邊距適用于所有地方)
2、Python與集成;貝葉斯預測,多鏈以及更多
3、面板數據的擴展回歸模型(ERM);導入SAS和SPSS數據集
4、靈活的非參數序列回歸;內存中的多個數據集,即幀
5、置信區間的樣本大小分析;非線性DSGE模型
6、多組IRT;面板數據Heckman選擇模型
7、具有滯后的NLME:多劑量藥代動力學模型等
8、Heteroskedastic命令probit;圖形大小以英寸,厘米和打印機點為單位
9、Mata中的數值積分;Mata中的線性編程
10、文件編輯器:自動完成,語法高亮等;暗模式和標簽式窗口