時間:2017年11月23日 分類:電子論文 次數:
大量冗余的數據可能包含有用信息也可能包含無用信息,利用數據挖掘技術去除掉多余的無用信息,對于提升手機數據質量和工作效率非常有幫助。為此,數據挖掘技術在目前軟件工程中有著舉足輕重的作用,數據挖掘技術對于提取,篩選,分析和整理能力遠超于人工操作軟件,比其更高效更精準。數據挖掘也為軟件開發者提供了幫助,為其帶來了有用信息,有用數據,從而也提高了軟件開發者的工作效率。
關鍵詞:軟件工程,數據挖掘,數據挖掘技術
1 數據挖掘的基本概述
軟件工程數據主要是指開發軟件過程中所涉及的各類數據,如需求分析、可行性分析、設計等文檔,開發商通信、軟件注釋、代碼、版本、測試用例和結果、使用說明、用戶反饋等信息數據,一般情況下其是軟件開發者獲取軟件數據的唯一來源;而數據挖掘是指在海量數據中集中發現有用知識或信息的過程。
軟件工程數據挖掘的工作原理 主要包括數據預處理階段、挖掘階段以及評估階段三個方面。在挖掘階段主要是運用分類、統計、關聯、聚類、異常檢測等一系列算法的過程。在評估階段數據挖掘的意義主要在于其結果應易被用戶理解,其結果評估主要有兩個環節分別是模式過濾和模式表示。
數據挖掘在計算機軟件工程中的研究相當多,它是分析數據的一種新穎方式。目前,隨著社會工作的復雜度,需要更加完善的軟件,因此對于軟件代碼的數量也在急劇增加進而導致了數據量的快速增長。而傳統的數據計算方式已經不能滿足目前對于大量數據進行分析的要求,所以,研究者希望能夠發掘出一種新的數據分析方式更高效的整理出有用的數據信息。軟件開發中會積累大量的數據,比如說文本數據,測試數據,用戶信息數據以及用戶體驗反饋數據等等,軟件開發者為了開發出更好的軟件就必須分析和整理這些數據。但是,目前軟件工程開發的軟件越來越大,其數據越累越復雜對于數據的處理已經超出了人工處理的能力的范疇,所以說繼續使用傳統數據處理的方式來收集,整理和分析數據已經不可能實現。因此,推動了人們對于新的數據處理方式的研究,所以才提出了軟件工程數據挖掘技術。
2 軟件工程數據挖掘的應用
隨著計算機軟件工程的發展,可以發現傳統的數據挖掘技術具有很多的不足,存在一定的缺陷。傳統的數據挖掘技術的定位系統不完善,定位不精確,并沒有體現出數據挖掘技術的高性能,它不足以滿足當代對于數據處理的要求,因此需要對傳統的數據挖掘技術進行改進和完善,這是我們目前的首要任務之一。為了迎合現代化網絡信息技術的快速發展,需要發掘出新的數據處理模式,就是在這樣的背景條件下,誕生了軟件工程數據挖掘技術。相比于存在很多缺陷與不足的傳統軟件工程而言,軟件工程數據挖掘技術更加簡單、方便、高效以及精確。軟件工程數據挖掘技術并不需要特定的技術平臺,體現了其普適性。當前,我國已經開始深入的研究軟件工程數據挖掘技術,但是,仍然需要更深的開發其性能以便更好地滿足社會的需求。
3 軟件工程數據挖掘面臨的挑戰
軟件工程數據相比于普通數據更加復雜,所以對于軟件工程數據進行處理具有很大的挑戰性。處理軟件工程的大量數據具有:軟件工程數據復雜性,軟件工程的數據處理非傳統以及需要嚴格精確的軟件工程數據的分析結果等三方面的困難。
3.1 對數據復雜性的分析
軟件工程數據包括結構化數據和非結構化數據。軟件工程中所產生的缺陷報告以及各種版本信息構成了結構化數據信息;而軟件工程處理過程中所產生的代碼信息和文本文檔信息構成了非結構化數據信息。由于這兩類數據包含的具體內容不同,所以需要分別處理這兩種數據,需要使用不同的算法對他們進行處理。雖然說需要不同方式處理這兩種數據但是并不表示這兩種數據之間沒有任何聯系,事實上,它們之間存在著重要的對應關系。例如:代碼中存在著缺陷報告,版本信息中存在著對應的文檔信息,由于它們之間存在著這樣的對應關系,所以使得人們不能很好地對其進行整體分析,這就促使了人們開發出一種新的算法,新的數據分析技術能夠同時將結構化信息和非結構化信息這兩種對應數據一起挖掘出來。
3.2 對數據處理非傳統的分析
分析和評估軟件工程數據挖掘出來的信息,這是數據挖掘過程的最后一步。客戶是軟件工程數據挖掘數據處理的最后宿體,軟件開發者需要對最終挖掘出來的數據進行轉變,格式轉變是為了滿足廣大客戶對于數據不同的要求。但是,由于需要對數據進行格式轉變,相當于增加了一定的工作量,那么軟件工程數據挖掘的效率則會被大大降低。對于客戶而言,他們需要的信息各種各樣并不單一,比如說客戶可能會同時需要具體的例子和編程代碼等;或者說需要具體例子和缺陷報告等;或者三者皆需要。由此可見,我們仍然需要改進和完善軟件工程數據挖掘技術來提高其效率。怎樣才能做到讓客戶得到滿意的數據挖掘結果呢?那么就需要高效的數據挖掘技術將各類信息進行歸納總結,改變其格式。這樣的技術,不僅僅可以滿足客戶需求而且還可以使軟件開發者從中得到更大的利益。
3.3 對數據挖掘結果好壞的評價標準
對于傳統的數據挖掘技術而言,它也有一套自己的對于數據結果處理好壞的分析標準,而這個標準對于傳統數據挖掘技術數據處理的分析較準確。但是,在當前的軟件工程所要處理的數據量很大,傳統的評價標準已經不能滿足現在的數據分析要求;使用不同的數據結果評價標準來評判不同的數據挖掘結果。然而不同的評價標準之間的聯系并不緊密,因此就需要開發者針對不同的數據類型做出不同的評價分析標準以便滿足客戶需求。想要對數據分析結果是否準確,數據挖掘的信息是否合理等等這些不同的問題進行更加深刻的了解,就要求開發者有獨特的見解,對于數據結果是否精確有一定的判斷能力。總之,獲取準確的信息就是軟件工程數據挖掘的目的。所以,最后獲得的數據是否滿足要求就是評判軟件工程數據挖掘結果是否完美的標準。
4 對軟件工程數據挖掘應用進行分析
4.1 對軟件數據挖掘技術進行分析
在軟件開發的過程中,數據挖掘技術包括兩個方面:(1)程序編寫;(2)程序成果。在這個過程中,程序結構和程序功能技術的主要作用就是檢索出有效的信息。提升信息的有效性需要聯系到客戶的實際需要,同時也需要對程序編寫過程進行智能化培訓。將調用、重載和多重繼承等關系家合起來進行有效的記錄各種相關信息,重視靜態規則的同時利用遞歸測試的方式來分配工作,從而更有效的掌握關聯度之間的可信性。
4.2 做好軟件維護中的軟件工程數據挖掘工作
在軟件維護的過程中,軟件修復和軟件改善工作依賴于數據挖掘技術。數據挖掘技術在軟件缺陷以及軟件結構等也起到了重要的作用。軟件修復即維護者通過依據缺陷分派進行有效的評估并改善缺陷程序進而確定修復級別或者維護者可以選擇缺陷修復方式,無論哪種方式最終目的都是進行軟件修復來保證數據挖掘的高效性。缺陷分派即將缺陷轉化為文本類型,采取有效措施來進行修復。但是,這樣的方式它的實際準確率并不高,因而需要利用強化檢測來完善缺陷報告技術。
4.3 注重高性能數據挖掘技術開發工作
數據挖掘技術體現在軟件開發工作中的創新性不可或缺,在實際的工作過程中,目前的軟件工程數據挖掘更加重視兩個工作:(1)規則分析方式;(2)項目檢索工作。總而言之,想要高效快速地尋找病毒,并對其進行全方位分析和評估得到準確的病毒數據需要高性能數據挖掘技術。只有提升數據分析的可行性,提升軟件開發安全性能,才能更好地實現軟件工程的良好發展。
5 總結
綜上所述,數據挖掘技術的應用非常廣泛,比如說分析代碼、軟件故障檢測以及軟件項目管理等三個方面應用較多。值得關注的是,當前對于數據挖掘技術的研究還不夠成熟。因此,研究者需要對軟件工程數據挖掘技術進行深入的研究,從而能夠促進軟件更好地開發和管理。相信在不久的將來,我們一定可以在數據挖掘方面取得非常好的優化效果。
參考文獻:
[1] 江義晟.軟件工程數據挖掘研究進展[J].電子技術與軟件工程,2016(22).
[2] 胡金萍.探析軟件工程數據挖掘研究進展[J].電腦知識與技術,2017(34).
[3] 馬保平.關于對軟件工程中的數據挖掘技術的探討[J].電子技術與軟件工程,2015(19).
[4] 徐琳,王寧.數據挖掘技術在軟件工程中的應用分析[J].數字通信世界,2015(8).
軟件工程師論文,您或許還想了解《信息通信技術工程師論文投稿》