網友評分: 5.8分
stata是一款專業的大數據分析工具,它主要功能就是用于數據分析、數據管理和統計圖繪制,支持線性混合模型、均衡重復、均衡反復和普羅比模式統計,擁有包羅一切的統計圖圖庫,能實現各類統計圖的繪制,同時提供矩形運算功能,無需借助第三方工具即可完成,是科學研究、教育、農業生產、大型企業統計分析的必備工具。
本stata10.0版本已經綠色處理,無需安裝軟件,隨時可以打開使用,有需要的用戶不要錯過。
統計功能
除了傳統的統計分析方法外,stata還收集了近20年發展起來的新方法,如Cox比例風險回歸,指數與Weibull回歸,多類結果與有序結果的logistic回歸,Poisson回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。
作圖功能
主要提供如下八種基本圖形的制作: 直方圖(histogram),條形圖(bar), 百分條圖(oneway),百分圓圖(pie),散點圖(twoway),散點圖矩陣(matrix),星形圖(star),分位數圖。這些圖形的巧妙應用,可以滿足絕大多數用戶的統計作圖要求。在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。
矩陣運算功能
提供了多元統計分析中所需的矩陣基本運算,如矩陣的加、積、逆、Cholesky 分解、Kronecker內積等;還提供了一些高級運算,如特征根、特征向量、奇異值分解等;在執行完某些統計分析命令后,還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等。
程序設計功能
具有很強的程序語言功能,這給用戶提供了一個廣闊的開發應用的天地,用戶可以充分發揮自己的聰明才智,熟練應用各種技巧,真正做到隨心所欲。事實上,Stata的ado文件(高級統計部分)都是用Stata自己的語言編寫的。
1、 set more off%2Fon
表示要求持續翻屏。碰到大樣本量數據檢驗的時候用stata經常會碰到這樣的情況,一個summarize之后出來一大堆東西然后不停的按空格往下拖。 當使用set more off后,結果就會一拖到底了。
2、 set memory 20m (,permanent)
stata對于大部分其他統計軟件而言都很快,主要的原因是因為stata是將數據載入內存進行分析的,同理要配給stata足夠的內存才可行。當分析一個很大樣本量的時候,數據內存量很可能不夠,就要使用這個命令了。在Intercooled和SE版本中其分配的內存量是可以調節的,small stata是不能更改的。(我記得默認的Intercool是1m,SE是10m。)命令中“20m”表示的是分配內存量的大小。后面括號里的意思是表示永遠分配給20m大小。
3、 log using XXX(,replace )%2Fon%2Foff%2Fclose
在過去使用stata的時候我比較郁悶的是要開一個word,邊算邊把運行結果粘貼到word里面。而其實不用這個樣子的,在剛開始的時候使用log的命令,就會自動記錄下以后運行的所有結果,然后使用log close,就會關閉結果輸出文件。而log off%2Fon 是用來表示記錄功能的暫停和重新打開的。
4、 local%2Fglobal
這兩個命令比較高級了,屬于暫元命令。(其實這兩個命令還是一個意思。唯一的區別在于在兩程序內使用同一暫元,則在主程序中local說定義的暫元不會因子程序的重新定義而改變叫做“主程序局域”,而global卻會發生變化成為“子程序全局暫元”??床欢磕蔷蛯α?,暫時不用理解那么深刻啦„„)
其實這兩個命令是用來給變量名或者變量值改名字的。改了之后要調用新名字的話local用` ‘ 而global用$。
5、 tempvar%2Ftempfile
這兩個命令跟上面兩個相似,但是是產生臨時變量和臨時數據文件的。在進行stata運行的時候,尤其是初級玩家對于各種命令不是很熟悉就會容易生成一大堆自己制造的變量,容易把原來的數據庫搞得亂七八糟。這時候使用tempvar的話就不會破壞原來的數據庫。其實preserve„restore也可以達到一樣的效果,但是要是怕突然出現死機什么的,用tempvar還是更好一點。同理,tempfile也是用來產生臨時文件的。
6、 program
這個命令是用來創造命令的。比如你覺得什么時候自己有了一個非常奇葩%2F有意思%2F驚艷%2F無聊的想法,想讓stata運行,但是苦于不知道應該什么命令,就可以通過program這個命令自創一個來。在使用program的時候其實跟input差不多,到最后的時候一定要記得end。