時(shí)間:2022年05月11日 分類:科學(xué)技術(shù)論文 次數(shù):
摘要:本文在分析了國內(nèi)外學(xué)者水質(zhì)研究現(xiàn)狀的基礎(chǔ)上,明確了中小型企業(yè)排放廢水特征,對(duì)排放廢水歷史水質(zhì)數(shù)據(jù)進(jìn)行分類和關(guān)聯(lián)分析,分析容易監(jiān)測的水質(zhì)指標(biāo)與水質(zhì)等級(jí)之間的關(guān)系,提出了基于水質(zhì)等級(jí)分類的中小型企業(yè)排放廢水水質(zhì)監(jiān)測模型。利用決策樹算法構(gòu)建水質(zhì)等級(jí)分類模型,可以有效替代傳統(tǒng)采購價(jià)高、運(yùn)行成本高的設(shè)備,為企業(yè)、政府等相關(guān)部門提供方便、科學(xué)的排放廢水監(jiān)測體系。以某市河道水質(zhì)數(shù)據(jù)進(jìn)行模型驗(yàn)證,準(zhǔn)確率可達(dá) 78.56%,證明該方法的可行性,為中小型企業(yè)排放廢水提供全天候在線監(jiān)測,為分布廣、比重大、監(jiān)管難的中小企業(yè)排放廢水提供可推廣的監(jiān)測體系。
關(guān)鍵詞:水質(zhì)等級(jí)分類;決策樹算法;中小型企業(yè);廢水排放水質(zhì)監(jiān)測
隨著中國社會(huì)生產(chǎn)力、科學(xué)技術(shù)的發(fā)展以及產(chǎn)業(yè)結(jié)構(gòu)向工業(yè)等領(lǐng)域調(diào)整,中國城鎮(zhèn)化步伐不斷加快,但一系列的環(huán)境問題也隨之而來,其中水污染問題尤其突出。針對(duì)水資源保護(hù)問題,中國采取了一系列科學(xué)的法律手段,先后出臺(tái)了多項(xiàng)規(guī)范和排污標(biāo)準(zhǔn),包括《中華人民共和國水法》《中華人民共和國水污染防治法》《中華人民共和國環(huán)境保護(hù)法》等,以規(guī)范化和法制化手段合理利用水資源,不斷完善中國水資源法律制度體系。水污染會(huì)影響各類環(huán)境資源、破壞生態(tài)平衡,還會(huì)降低工業(yè)和農(nóng)業(yè)生產(chǎn)質(zhì)量,甚至危害人類生活和身體健康?v觀近年來的水污染現(xiàn)象,突發(fā)水污染事件占比較大,其中絕大多數(shù)是由于企業(yè)違規(guī)排放廢水或工廠事故泄露所引起,而一些環(huán)保設(shè)備差、裝備水平低的中小型工業(yè)企業(yè)最容易出現(xiàn)事故。
因此,在國務(wù)院于 2015 年印發(fā)的《水污染防治行動(dòng)計(jì)劃》中,第一點(diǎn)就強(qiáng)調(diào)了對(duì)工業(yè)污染的防治工作,尤其是對(duì)小型工業(yè)企業(yè)的排查,對(duì)小型企業(yè)的污水治理工作提出了更高的要求。但是污水監(jiān)測的全套設(shè)備包括其運(yùn)行維護(hù)費(fèi)用每年高達(dá) 50~60 萬,導(dǎo)致很多小型企業(yè)因無法承擔(dān)該項(xiàng)費(fèi)用而排放不達(dá)標(biāo)廢水,對(duì)人類安全造成極大的威脅。因此,尋找適合中小型企業(yè)污水水質(zhì)等級(jí)監(jiān)測的方法已刻不容緩。本文基于某市河道水質(zhì)數(shù)據(jù),分析容易監(jiān)測的水質(zhì)指標(biāo)與水質(zhì)等級(jí)之間的關(guān)系,以決策樹算法構(gòu)建的水質(zhì)等級(jí)監(jiān)測模型對(duì)企業(yè)污水排放進(jìn)行監(jiān)控,有效替代傳統(tǒng)采購價(jià)高、運(yùn)行成本高的設(shè)備,減少費(fèi)用壓力,可以為企業(yè)、政府等相關(guān)部門提供方便、科學(xué)的排放廢水監(jiān)測體系,為中小型企業(yè)污水排放前的監(jiān)測提供理論參考。
1 研究現(xiàn)狀
1.1 水質(zhì)等級(jí)監(jiān)測研究現(xiàn)狀
在水質(zhì)等級(jí)監(jiān)測研究中,主要以多種算法為基礎(chǔ),構(gòu)建水質(zhì)評(píng)價(jià)模型,并根據(jù)實(shí)踐中的突出問題加以改進(jìn)。張穎等[1]以流域的三大監(jiān)測斷面點(diǎn)為研究對(duì)象,采用灰色模型對(duì)水質(zhì)的各個(gè)參考值進(jìn)行預(yù)測,利用模糊神經(jīng)網(wǎng)絡(luò)方法構(gòu)建水質(zhì)預(yù)測模型,綜合把握水質(zhì)變化,達(dá)到了預(yù)警效果。
高學(xué)平等[2]關(guān)注季節(jié)變化對(duì)水質(zhì)指標(biāo)權(quán)重的影響,以層次分析法創(chuàng)造性地提出時(shí)域權(quán)重矩陣,并將此與實(shí)測權(quán)重相結(jié)合,得到綜合評(píng)價(jià)權(quán)重,設(shè)計(jì)改進(jìn)的模糊綜合評(píng)價(jià)法提高水質(zhì)評(píng)價(jià)的準(zhǔn)確度。肖金球等[3]針對(duì)水質(zhì)監(jiān)測系統(tǒng)在太湖應(yīng)用中存在的數(shù)據(jù)和等級(jí)評(píng)價(jià)不準(zhǔn)確的問題,提出一種改進(jìn)型 GA-BP 的神經(jīng)網(wǎng)絡(luò),基于此可以辨識(shí)復(fù)雜的水質(zhì)模型,以此消除干擾因素帶來的誤差。
閆佰忠等[4]以地下水水質(zhì)評(píng)價(jià)為對(duì)象,基于安陽市 8 個(gè)監(jiān)測點(diǎn)的數(shù)據(jù),以隨機(jī)森林設(shè)計(jì)水質(zhì)評(píng)價(jià)模型,并與神經(jīng)網(wǎng)絡(luò)模型相比較,結(jié)果顯示該方法的準(zhǔn)確性與穩(wěn)定性更高。張瑩等[5]在大數(shù)據(jù)背景下聚焦于海洋水質(zhì)評(píng)價(jià),以機(jī)器學(xué)習(xí)算法為基礎(chǔ),以40萬站點(diǎn)和 13個(gè)水質(zhì)指標(biāo)信息為樣本,構(gòu)建海洋多水質(zhì)指標(biāo)信息的綜合評(píng)價(jià)模型。1.2 水污染溯源研究現(xiàn)狀隨著中國城鎮(zhèn)化不斷發(fā)展,水污染現(xiàn)象逐年增加,水污染溯源研究被廣大學(xué)者所重視,尤其是針對(duì)企業(yè)污水溯源的研究。Boano 等[6]針對(duì)任意分布源的水污染溯源和多個(gè)獨(dú)立點(diǎn)源的水污染溯源,采用地質(zhì)統(tǒng)計(jì)法對(duì)水污染事件進(jìn)行回溯。Wei 等[7]利用AM 算法和正向模型的不確定性特征對(duì)水污染事件過程進(jìn)行反演,針對(duì)水中污染物特征判斷整個(gè)污染過程,在反演過程中尋求最終結(jié)果。
李欣欣等[8]利用改進(jìn)的 AFSA 算法對(duì)構(gòu)建的污染物時(shí)空溯源模型和排放總量模型進(jìn)行求解,確定污染物排放量、排放位置和時(shí)間 3個(gè)參數(shù),借助 GIS技術(shù)進(jìn)行污染源企業(yè)排查清單的確定。王忠慧等[9]利用耦合的概率密度分析方法優(yōu)化水力學(xué)模型,并采用 BAS 算法進(jìn)行求解,實(shí)現(xiàn)污染物源項(xiàng)信息的確定,有效減少計(jì)算量并提高了精準(zhǔn)度。孫策等[10]利用貝葉斯和蒙特卡洛相結(jié)合的方法,基于已知污染源信息,利用函數(shù)求得污染源的概率密度,將溯源問題轉(zhuǎn)化為求概率密度的抽樣問題,使結(jié)果更有效快速地接近目標(biāo)。呂清等[11]以南方某市 S 河的一次水質(zhì)異常事件為例,對(duì)水紋識(shí)別技術(shù)在水污染溯源中的實(shí)際應(yīng)用進(jìn)行驗(yàn)證,根據(jù)水紋峰變化推斷入侵過程,比對(duì)水體水紋與污染源水紋,最終實(shí)現(xiàn)溯源。
1.3 決策樹算法應(yīng)用研究現(xiàn)狀決策樹算法以其速度快,精確度高等特點(diǎn),已被學(xué)者們應(yīng)用到各行各業(yè)的研究中。Chandra[12]將決策樹創(chuàng)造性應(yīng)用于地質(zhì)學(xué)領(lǐng)域,用以確定發(fā)生滑坡的概率,選用地質(zhì)構(gòu)造,坡度等 9個(gè)主要因素進(jìn)行分析,生成滑坡敏感性圖,結(jié)果表明該圖可以用于中等規(guī)模和區(qū)域的規(guī)劃中。Arlita等[13]在運(yùn)輸領(lǐng)域,采用決策樹方法開發(fā)選擇模型,以確定最佳貨物運(yùn)輸方案,為公司業(yè)務(wù)發(fā)展提供合理計(jì)劃。楊泉[14]將決策樹算法應(yīng)用到漢語短語關(guān)系分類上,建立 7 個(gè)分類特征,在自建庫中生成決策樹,以投票給出最終結(jié)果 ,并 采 用 1020 條 數(shù) 據(jù) 進(jìn) 行 測 試 ,正 確 率 高 達(dá)94.8%。
劉曉娜等[15]主要將其應(yīng)用到解決橡膠林地的遙感識(shí)別,以 Landsat MSS/TM/ETM 數(shù)據(jù)和 MO⁃DIS-NDVI 數(shù)據(jù)為基礎(chǔ),利用決策樹方法構(gòu)建簡單快捷的橡膠林地分類方式,提取所需地區(qū)的橡膠林地,有助于生態(tài)保護(hù)和土地合理開發(fā)利用。程華等[16]利用 C4.5 決策樹方法解決港航班延誤預(yù)測問題,構(gòu)建預(yù)測模型,并以中國某大型機(jī)場數(shù)據(jù)為例,進(jìn)行大量實(shí)驗(yàn)驗(yàn)證其正確率。王焱[17]在對(duì)國內(nèi)外行人檢測的研究現(xiàn)狀進(jìn)行分析后,創(chuàng)造性的提出將梯度提升決策樹算法應(yīng)用于行人檢測中,并與區(qū)域建議網(wǎng)絡(luò)相結(jié)合,設(shè)計(jì)出可以用于檢測不同尺度行人的檢測算法。
2 數(shù)據(jù)來源及研究方法
2.1 數(shù)據(jù)來源
本文水質(zhì)數(shù)據(jù)來源為某市 20 條河流的監(jiān)測數(shù)據(jù),時(shí)間跨度為 2018年 1月至 2020年 8月,數(shù)據(jù)中包含了緯度、地區(qū)、水質(zhì)等級(jí)、高錳酸鹽指數(shù)、氨氮、總磷、PH值、水溫、溶解氧、濁度、電導(dǎo)率、總氮、數(shù)據(jù)時(shí)間等屬性。對(duì)排放廢水歷史水質(zhì)數(shù)據(jù)進(jìn)行分類和關(guān)聯(lián)分析,探究其中容易監(jiān)測的水質(zhì)指標(biāo)與水質(zhì)等級(jí)之間的關(guān)系,經(jīng)過篩選后,選擇特征屬性以構(gòu)建水質(zhì)等級(jí)分類模型。
2.2 研究方法
在構(gòu)建水質(zhì)等級(jí)分類模型時(shí)主要采用決策樹算法對(duì)水質(zhì)進(jìn)行分類。決策樹算法是為了解決 ID3算法忽略對(duì)葉子數(shù)目的研究而提出的一種改進(jìn)算法,是通過一系列規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類的方法,其基本原理是通過歸納學(xué)習(xí)訓(xùn)練集的規(guī)律生成相應(yīng)的決策樹,用所生成的決策樹規(guī)律對(duì)新的數(shù)據(jù)進(jìn)行分類。該算法具有速度快、準(zhǔn)確性高、可處理連續(xù)字段和種類字段等優(yōu)點(diǎn)[18]。決策樹主要表現(xiàn)為樹形結(jié)構(gòu),包括一個(gè)根節(jié)點(diǎn)、若干個(gè)內(nèi)部節(jié)點(diǎn)和若干個(gè)葉子節(jié)點(diǎn),其中每個(gè)內(nèi)部節(jié)點(diǎn)代表一種屬性測試,每個(gè)葉子節(jié)點(diǎn)代表一種決策結(jié)果。節(jié)點(diǎn)之間通過分支進(jìn)行聯(lián)系,每個(gè)分支代表一種測試輸出。
同時(shí)決策樹也代表了對(duì)象值與其屬性之間的映射關(guān)系,其中對(duì)象用節(jié)點(diǎn)表示,每一個(gè)從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)之間所有的路徑代表對(duì)象值,而每一個(gè)分支則代表可能的屬性值。一棵決策樹生成的過程也就是決策樹的學(xué)習(xí)過程。主要分為特征選擇,決策樹生成和決策樹剪枝3 個(gè)步驟,首先進(jìn)行特征選擇,從訓(xùn)練數(shù)據(jù)樣本中選擇特征作為節(jié)點(diǎn)分叉標(biāo)準(zhǔn),其中特征的選擇具有不同的選擇標(biāo)準(zhǔn),評(píng)估標(biāo)準(zhǔn)不同最終的決策樹算法也不同,接著進(jìn)行決策樹的生成,根據(jù)之前選擇的特征標(biāo)準(zhǔn),對(duì)訓(xùn)練數(shù)據(jù)采用從上至下的遞歸法生成子節(jié)點(diǎn),直至分叉結(jié)束,最后是決策樹修剪過程,由于決策樹易因過擬合現(xiàn)象而導(dǎo)致分類有誤,因此在決策樹生成后要進(jìn)行樹枝的修剪過程,通過減小樹的結(jié)構(gòu)達(dá)到解決過擬合的問題。
3 基于決策樹算法的水質(zhì)等級(jí)分類模型構(gòu)建
3.1 水質(zhì)等級(jí)監(jiān)測模型的屬性
選擇決策樹中含有多個(gè)特征屬性,但只有一些特征屬性對(duì)分類可以起到關(guān)鍵作用,影響水質(zhì)類別的所有特征對(duì)其分類具有不同的敏感程度,特征的選擇對(duì)模型的準(zhǔn)確度和效率具有直接影響。傳統(tǒng)的水質(zhì)等級(jí)評(píng)價(jià)會(huì)選擇 pH,溶解氧,高錳酸鹽指數(shù),氨氮等30 多種評(píng)價(jià)指標(biāo)作為特征屬性,但很多中小型企業(yè)由于資金原因無法承擔(dān)全套的水質(zhì)評(píng)價(jià)儀器,致使工廠排放的廢水未經(jīng)過等級(jí)評(píng)價(jià)便排放到河道中,導(dǎo)致污染物超標(biāo),劣Ⅴ類水增加。因此,在對(duì)水質(zhì)等級(jí)與各因素之間的影響程度以及各種組合結(jié)果的對(duì)比后,最終選擇溫度和總磷作為最終的特征屬性。其中總磷是指水中所有形態(tài)磷的總量,是反映水體質(zhì)量和污染程度的重要指標(biāo)。
在水體中,磷一般為磷酸鹽和有機(jī)磷的形式存在,絕大多數(shù)來源于企業(yè)污水中磷的使用。磷是水中最主要的影響元素,是促進(jìn)水中生物和微生物生長的關(guān)鍵因素,若磷過于富集,則會(huì)導(dǎo)致水體質(zhì)量下降。對(duì)中小型企業(yè)排放廢水中的總磷的監(jiān)測和分析,可以辨別水質(zhì)的污染程度,了解水質(zhì)的富營養(yǎng)化狀況,因此總磷是水質(zhì)分析中的必測項(xiàng)目,是評(píng)價(jià)水質(zhì)的重要因素,選擇磷作為特征屬性具有一定的理論和實(shí)際支撐。測定總磷含量的國家標(biāo)準(zhǔn)是鉬酸分光光度法。該方法的主要原理是,首先在保持中性的水環(huán)境下,用過硫酸鉀或者硫酸—高氯酸對(duì)水樣進(jìn)行消解操作,使水樣中的所有形態(tài)的磷轉(zhuǎn)化為正磷酸鹽,接著在酸性介質(zhì)中,將消解的正硝酸鹽與鉬酸銨發(fā)生反應(yīng),從而保持在銻鹽存在的條件下將生成的磷鉬雜多酸立即用抗壞血酸還原生成藍(lán)色的絡(luò)合物,最后在 700 nm條件下進(jìn)行吸光度測定。
3.2 水質(zhì)等級(jí)監(jiān)測
模型的建立水質(zhì)等級(jí)的分類模型是指從已知的水質(zhì)數(shù)據(jù)中利用決策樹分類算法,將水質(zhì)類別分類中的規(guī)律提取出來的過程,其中已知類別的數(shù)據(jù)稱為樣本數(shù)據(jù),可以分為訓(xùn)練集和測試集兩部分。在建立水質(zhì)等級(jí)分類模型過程中,首先根據(jù)需求和數(shù)據(jù)特點(diǎn)選擇決策樹算法作為分類模型;接著將訓(xùn)練集數(shù)據(jù)作為算法輸入值,總結(jié)歸納分類標(biāo)準(zhǔn)后輸出相應(yīng)的分類模型;最后利用測試集數(shù)據(jù)驗(yàn)證分類模型的準(zhǔn)確性和有效性,使用構(gòu)建的分類模型將測試數(shù)據(jù)進(jìn)行分類,完成后與實(shí)際分類情況比對(duì),統(tǒng)計(jì)最終的準(zhǔn)確率,若準(zhǔn)確率達(dá)到要求的標(biāo)準(zhǔn),則認(rèn)為該模型可作為水質(zhì)分類模型,否則需要重新構(gòu)建。
4 面向中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型
構(gòu)建面向中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型是基于水質(zhì)等級(jí)分類模型建立的。對(duì)企業(yè)而言,定期對(duì)廢水進(jìn)行取樣,測定廢水的溫度以及其中的總磷含量,將數(shù)據(jù)輸入構(gòu)建的基于決策樹算法的水質(zhì)等級(jí)分類模型中,輸出相應(yīng)的水質(zhì)類別,判斷是否符合排放標(biāo)準(zhǔn),若符合記錄數(shù)據(jù)后可以要求進(jìn)行排放程序,若不符合則需要進(jìn)行再次處理,重復(fù)過程直至廢水達(dá)到排放標(biāo)準(zhǔn)。而對(duì)政府相關(guān)部門而言,在進(jìn)行廢水排放水質(zhì)抽查時(shí),首先將監(jiān)測到的數(shù)據(jù)輸入基于水質(zhì)等級(jí)分類的模型中,判斷企業(yè)排放的廢水是否符合標(biāo)準(zhǔn),是否對(duì)水體造成了污染,若初步監(jiān)測符合標(biāo)準(zhǔn)則記錄在冊(cè),若結(jié)果不符合,水質(zhì)的類別低于Ⅲ類水質(zhì)或者當(dāng)?shù)貥?biāo)準(zhǔn),則將樣水送至相關(guān)機(jī)構(gòu),采用專業(yè)設(shè)備進(jìn)行監(jiān)測后,再次判斷是否符合標(biāo)準(zhǔn),一旦發(fā)現(xiàn)不符合則根據(jù)相關(guān)政策對(duì)企業(yè)進(jìn)行罰款、教育和政治工作。該模型有效降低了中小型企業(yè)和政府對(duì)廢水排放水質(zhì)的監(jiān)測費(fèi)用,有效防止企業(yè)偷排超標(biāo)廢水的行為,減少水體污染現(xiàn)象。在構(gòu)建決策樹的過程中,需要找出最佳節(jié)點(diǎn)和最佳分枝方法,衡量這個(gè)“最佳”的指標(biāo)叫做“不純度”。通常來說,“不純度”越低,決策樹的擬合效果越好。參數(shù) Criterion 是用來決定“不純度”的計(jì)算方法。
在 sklearn 庫中提供了 entropy(信息熵)和 GiniImpurity(基尼系數(shù))2 種計(jì)算方法。使用的決策樹算法在分枝方法上的核心大多是圍繞在對(duì)某個(gè)“不純度”相關(guān)指標(biāo)的最優(yōu)化上。“不純度”是基于節(jié)點(diǎn)來計(jì)算的,樹中的每個(gè)節(jié)點(diǎn)都會(huì)有一個(gè)“不純度”。信息熵相較于對(duì)“不純度”的處理更加敏感,當(dāng)使用信息熵作為指標(biāo)時(shí),決策樹的生長會(huì)更加“精細(xì)”,對(duì)于高維數(shù)據(jù)、噪音很多的數(shù)據(jù),信息熵容易發(fā)生過擬合現(xiàn)象,而基尼系數(shù)在這種情況下的效果要優(yōu)于信息熵。本文選擇基尼系數(shù)計(jì)算“不純度”。在構(gòu)建模型時(shí)可以對(duì)特征標(biāo)簽重要性進(jìn)行可視化,結(jié)果發(fā)現(xiàn)總磷的重要性為 0.960 2,水溫的重要性為 0.039 78,可見總磷相較于溫度,對(duì)水質(zhì)等級(jí)的影響更大,也更加直接。同時(shí)為了方便構(gòu)建決策樹模型,將 I 類、II 類、III 類、IV 類、V 類、劣 V 類 6 個(gè)水質(zhì)等級(jí)分別用數(shù)字 1、2、3、4、5、6進(jìn)行替代。
5 應(yīng)用測試與分析
對(duì)決策樹進(jìn)行評(píng)估時(shí)最常用的標(biāo)準(zhǔn)是預(yù)測正確率。訓(xùn)練集共有 50 206 條數(shù)據(jù),使用決策樹對(duì)水質(zhì)等級(jí)進(jìn)行預(yù)測,預(yù)測正確數(shù)據(jù)為 39 443條,正確率為78.56%;模型的訓(xùn)練集得分低于測試集,為 72.87%。在計(jì)算評(píng)估指標(biāo)時(shí),樣本被分為 4類,分別為 TP(True Positives)、FP(False Positives)、FN(False Nega⁃tives)、TN(True Negatives)。TP 是指將正類判定為正類,F(xiàn)P 是指將負(fù)類判定為正類,F(xiàn)N 是指將正類判定為負(fù)類,TN 是指將負(fù)類判定為負(fù)類。其中精確度的計(jì)算公式為 TP/(TP+FP),召回率的計(jì)算公式為TP/(TP+FN),加權(quán)調(diào)和平均值的計(jì)算公式為 2TP/(2TP+FP+FN)。以 III類水為例,正類數(shù)據(jù)指的則是III類的數(shù)據(jù),負(fù)類數(shù)據(jù)指的則是除 III類之外的其他等級(jí)的數(shù)據(jù)。
當(dāng)水質(zhì)等級(jí)預(yù)測全部正確時(shí),III類水對(duì)應(yīng)的樣本數(shù)量應(yīng)為 17 149。在實(shí)際使用決策樹模型進(jìn)行預(yù)測時(shí),預(yù)測出的屬于 III 類水的數(shù)據(jù)共19 458條,其中的正確判定為15 022條,則TP為15 022條,F(xiàn)P則為 4 436條,F(xiàn)N為 2 127條,TN為 30 748條,精確度為 15 022(/ 15 022+4 436),即 77.20%;召回率為 15 022(/ 15 022+2 127),即 87.59%;加權(quán)調(diào)和平均值 2×15 022(/ 2×15 022+4 436+2 127),即 82.07%。
6 小結(jié)
隨著中國城鎮(zhèn)化步伐不斷加快以及環(huán)境保護(hù)和水污染防治行動(dòng)的不斷深入,大型企業(yè)已經(jīng)建成完善的監(jiān)測和處理廢水體系,而由于廢水監(jiān)測設(shè)備昂貴、運(yùn)行成本高,是中小企業(yè)完善廢水監(jiān)測體系面臨的主要問題。因此,構(gòu)建符合中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型顯得尤為重要和緊迫。針對(duì)這種現(xiàn)象,本文采用決策樹算法,將水質(zhì)數(shù)據(jù)劃分為訓(xùn)練集與測試集,通過構(gòu)建水質(zhì)等級(jí)分類模型來預(yù)測水質(zhì)等級(jí),測試集驗(yàn)證的水質(zhì)等級(jí)正確率為 78.56%,證明了該方法的可行性,可用于對(duì)中小型企業(yè)的廢水水質(zhì)進(jìn)行初步分級(jí),減少監(jiān)測費(fèi)用,同時(shí)對(duì)水質(zhì)進(jìn)行監(jiān)控,以便在水質(zhì)異常時(shí)采集水樣進(jìn)行深入監(jiān)測,并及時(shí)采取治理措施,形成針對(duì)中小型企業(yè)的廢水監(jiān)測體系,減少水污染現(xiàn)象。
參考文獻(xiàn):
[1]張 穎,高倩倩 .基于灰色模型和模糊神經(jīng)網(wǎng)絡(luò)的綜合水質(zhì)預(yù)測模型研究[J].環(huán)境工程學(xué)報(bào),2015,9(2):537-545.
[2]高學(xué)平,孫博聞,訾天亮,等 .基于時(shí)域權(quán)重矩陣的模糊綜合水質(zhì)評(píng)價(jià)法及其應(yīng)用[J].環(huán)境工程學(xué)報(bào),2017,11(2):970-976.
[3]肖金球,周 翔,潘 楊,等 .GA-BP 優(yōu)化 TS 模糊神經(jīng)網(wǎng)絡(luò)水質(zhì)監(jiān)測與評(píng)價(jià)系統(tǒng)預(yù)測模型的應(yīng)用——以太湖為例[J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,41(12):110-119.
[4]張 瑩,謝仕義,鄧偉彬,等 .基于機(jī)器學(xué)習(xí)理論的海洋水質(zhì)評(píng)價(jià)模型[J].物探化探計(jì)算技術(shù),2019,41(6):819-825.
[5]閆佰忠,孫 劍,安 娜 .基于隨機(jī)森林模型的地下水水質(zhì)評(píng)價(jià)方法[J].水電能源科學(xué),2019,37(11):66-69.
[6]BOANO F,REVELLI R,RIDOLFI L. Source identification in riverpollution problems:A geostatistical approach[J]. Water resourcesresearch,2005,41(7):1-13.
[7]WEI G,CHI Z,YU L,et al. Source identification of sudden contami⁃nation based on the parameter uncertainty analysis[J].Journal of hy⁃droinformatics,2016,18(6):919-927.
[8]李欣欣,王 寧,姜秋俚 . 基于改進(jìn) AFSA 算法的河流突發(fā)水污染溯源[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2020,29(7):139-144.
[9]王忠慧,貢 力,康春濤,等 .基于 BAS算法的河渠突發(fā)水污染溯源[J].水資源保護(hù),2020,36(5):87-92.
[10]呂 清,徐詩琴,顧俊強(qiáng),等 .基于水紋識(shí)別的水體污染溯源案例研究[J].光譜學(xué)與光譜分析,2016,36(8):2590-2595.
[11]孫 策,李傳奇,白 冰,等 .基于貝葉斯方法的突發(fā)水污染事件溯源研究[J].中國農(nóng)村水利水電,2020(8):71-75,81.
[12]CHANDRA P P. Landslide susceptibility analysis using decisiontree method,Phidim,eastern Nepal[J].Bulletin of the departmentof geology,2013(15):69-76.
作者:俞 武1,薛夢瑤2,3 ,何 斌2,3,馬金萍1,杜子龍4
Take the first step of our cooperation邁出我們合作第一步