本發明公開了一種多變量數據的特征選擇新方法,適合分類與回歸分析,屬于化學計量學領域。該方法從樣本和特征方向同時進行蒙特卡羅劃分產生子模型,統計評價模型所產生的結果,以可視化的形式直觀呈現出來,方便特征選擇。具體包括以下幾個步驟:1,從特征方向多次隨機劃分數據并構建模型,以分類或回歸系數方法選擇較多的最優特征;2,從樣本方向多次劃分新的數據,構造訓練集和預測集,計算預測錯誤率或交互驗證均方殘差;3,統計分析結果的均值和方差,以均值對方差作圖;4,分析圖形中均值和方差均較小的區域內所構建的模型,統計所有特征在該區域內的出現次數,以此作為特征選擇的依據。方法適合特征數目大、共線性程度高的數據分析。
聲明:
“復雜多變量數據的特征選擇新方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)