控制數(shù)據(jù)庫的備份
在線恢復(fù)備份
1 在根目錄下創(chuàng)建備份文件夾Cponlinebk
2 拷貝 opt/fox/下 ciocfg 文件到備份文件夾
3 拷貝 opt/fox/下 csa 文件到備份文件夾
4 拷貝 usr/fox/sp/files/下 DB* BB* 文件到備份文件夾
5 鍵入恢復(fù)命令
離線恢復(fù)備份
1 創(chuàng)建備份文件夾 Cpofflinebk
2 在 Cpofflinebk 文件夾下手動創(chuàng)建 CP2001CP2002 CP2023子文件 不包括CP004 CP2005
3 打開 API 文件 執(zhí)行保存程序
4 鍵入恢復(fù)命令
DCS 故障原因分析及防范措施
DCS 死機(jī)故障情況
T09 00 1 號機(jī)所有操作員站工程師站無法操作 CRT 畫面雖有數(shù)據(jù)顯示 但不變化ATS 網(wǎng)絡(luò)通信負(fù)荷為 560 包/s 認(rèn)定為 DCS 死機(jī) 1min 左右 系統(tǒng)自動恢復(fù)正常 重新啟動操作員站后 ATS 網(wǎng)絡(luò)通信負(fù)荷降至 220 包/s 10 00 左右DCS 再次網(wǎng)絡(luò)中斷 死機(jī) 1 min 左右 系統(tǒng)自動恢復(fù) 11 09 DCS 出現(xiàn)與之前相同的故障 ATS 網(wǎng)絡(luò)通信負(fù)荷降到 250 包/s 死機(jī) 3 min 左右 系統(tǒng)自動恢復(fù)正常
原因分析
調(diào)用 NFD 日志文件檢查 顯示多條相似的錯(cuò)誤信 息 STATE CHANGE 0 CBL 0 0 S CP10094000 4000 D WP1002 4077 4000 M AW1003 40004000 表明 CP 與操作員站有通信中斷的現(xiàn)象 該現(xiàn)象易使通信負(fù)荷逐漸增大 達(dá)到某種程度時(shí)將會引發(fā)網(wǎng)絡(luò)通信擁堵 致使操作員站瞬間死機(jī) 因此確定故障是由 DCS 2 臺交換機(jī)瞬間死機(jī)引起的。
防范措施
1 在操作員站 工程師站上增加檢測 CPU 負(fù)荷及網(wǎng)絡(luò)負(fù)荷的程序 并記錄到日志文件中 觀察設(shè)備正常后再停止程序
2 加強(qiáng)對 DCS 的定期檢查 要求每天檢查 1次系統(tǒng)網(wǎng)絡(luò)負(fù)荷 并做好相關(guān)記錄 當(dāng)網(wǎng)絡(luò)通信負(fù)荷達(dá) 450 包/s 時(shí) 必須采取相應(yīng)的措施
3 每周需重啟 1 次操作員站4 更換 1 號機(jī) DCS 的 2 臺交換機(jī)
大屏幕畫面數(shù)據(jù)藍(lán)點(diǎn)故障故障情況
2 號機(jī)大屏幕 WP2007 畫面中部分?jǐn)?shù)據(jù)顯示藍(lán)點(diǎn) 畫面翻動及操作正常 經(jīng)查詢發(fā)現(xiàn)顯示藍(lán)點(diǎn)的全部為 CP2010 的數(shù)據(jù) 初始判斷該現(xiàn)象可能是 WP2007 本身和整個(gè)網(wǎng)絡(luò)通信存在問題造成的 斷開該處網(wǎng)絡(luò) 重啟機(jī)后恢復(fù)通信線 WP2007數(shù)據(jù)藍(lán)點(diǎn)故障消失 但之后工程師站 AW2005 數(shù)據(jù)又顯示藍(lán)點(diǎn) 重啟 AW2005 后 AW2005 顯示正常但將會有另 1 臺操作員站或工程師站出現(xiàn)上述相同的問題
原因分析
經(jīng)分析 CP 接收和發(fā)送數(shù)據(jù)有一定的限制發(fā)送的數(shù)據(jù)站最多為 20 個(gè) 接收的數(shù)據(jù)站最多為 30個(gè) 而 CP2010 的接收和發(fā)送數(shù)據(jù)站達(dá) 41 個(gè) 該值達(dá) 38 則已處于危險(xiǎn)狀態(tài) 已超過上限 原因是操作員站所監(jiān)視的畫面下方有 1 個(gè)數(shù)據(jù)條 在數(shù)據(jù)條中有 2 個(gè)數(shù)據(jù)是 CP2010 中的點(diǎn) 相當(dāng)于 CP2010 一直在發(fā)送數(shù)據(jù)站 而系統(tǒng)改造后新增了AW2005 若再
調(diào)用的畫面中 CP2010 數(shù)據(jù)較多 將可能達(dá)到CP2010 發(fā)送數(shù)據(jù)站的上限 導(dǎo)致 CP2010 對某臺機(jī)不發(fā)送數(shù)據(jù) 畫面數(shù)據(jù)顯示藍(lán)點(diǎn)3.2.3 防范措施
1 畫面優(yōu)化 改變畫面下方數(shù)據(jù)條中 CP2010點(diǎn)的連接屬性 即在 CP2008 中創(chuàng)建中轉(zhuǎn)塊 由于原CP2008 和 CP2010 有跨 CP 通信點(diǎn) 新增中轉(zhuǎn)塊后將不增加 CP2010 發(fā)送數(shù)據(jù)站的數(shù)量 畫面下方數(shù)據(jù)條將從 CP2008 中調(diào)用 直接降低 CP2010 發(fā)送數(shù)據(jù)站的個(gè)數(shù)
2 組態(tài)優(yōu)化 對與 CP2010 有跨 CP 點(diǎn)通信的進(jìn)行優(yōu)化 如空冷邏輯有 4 個(gè)函數(shù)只引用了 CP2010的機(jī)組負(fù)荷點(diǎn) 把該負(fù)荷點(diǎn)引用端改成 DEH 邏輯經(jīng)修改后 CP2010 發(fā)送數(shù)據(jù)包個(gè)數(shù)有明顯下降
3 重啟操作員站及工程師站 重啟前 將每臺機(jī)界面調(diào)至初始畫面 即釋放所有的數(shù)據(jù)鏈接
DCS 操作員站故障故障情況
T09 25 2 號機(jī)操作員站畫面不能翻動 無法操作 約 1 min 后 系統(tǒng)自動恢復(fù) 09 32左右 故障再次發(fā)生
原因分析
由于 2 號機(jī)的時(shí)間均自動與 AW2001 對時(shí) 發(fā)生故障時(shí) AW2001 的時(shí)間比標(biāo)準(zhǔn)時(shí)間快 30 min 這樣其他設(shè)備在與 AW2001 自動對時(shí)期間易卡死 導(dǎo)致數(shù)據(jù)掃描停止而無法操作 故障發(fā)生后 其他設(shè)備重啟恢復(fù)正常 而 AW2001 重啟失敗 采用備用機(jī)箱試驗(yàn) 確定故障是由 AW2001 主機(jī)硬盤損壞導(dǎo)致時(shí)間誤差引起的
防范措施
1 加強(qiáng)對 DCS 的學(xué)習(xí)培訓(xùn) 以便發(fā)現(xiàn)故障及時(shí)處理 并做好日常 DCS 設(shè)備點(diǎn)檢工作
2 做好 DCS 專用備件的材料計(jì)劃 保證備品全不影響機(jī)組穩(wěn)定運(yùn)行
ATS 網(wǎng)絡(luò)通信負(fù)荷偏高
1 號機(jī)改造后 由于新 舊網(wǎng)絡(luò)通信還存在問題 導(dǎo)致 MESH 與 NODEBUS 的網(wǎng)絡(luò)通信負(fù)荷長時(shí)間偏高 當(dāng)負(fù)荷達(dá) 600 包/s 左右時(shí) 仍有可能導(dǎo)致通信擁堵 造成操作員站死機(jī)經(jīng)試驗(yàn) 排除 ATS 硬件 圖形 FOXVIEW 版本操作員站系統(tǒng)版本等問題 判定是因操作人員頻繁雙擊FOXVIEW 造成的 FOXVIEW 有時(shí)無法最大化 操作人員直接點(diǎn)擊 QUIT 非法啟動 導(dǎo)致操作員站畫面數(shù)據(jù)連接無法正常釋放 造成通信負(fù)荷越來越高 為了防止 FOXVIEW 無法全屏 在各操作員站設(shè)置了重啟 DM 鍵 徹底解決了上述問題通過對京隆公司近期發(fā)生的幾起較為典型的DCS 故障案例的分析可以看出 DCS 的可靠性關(guān)系到電廠的安全穩(wěn)定運(yùn)行 必須引起熱工專業(yè)人員的高度重視要防止各類故障的發(fā)生 必須從 DCS 軟件組態(tài)和硬件生產(chǎn)抓起 將國內(nèi)應(yīng)用的各種類型的 DCS 發(fā)生的故障情況反饋到有關(guān)部門及 DCS 生產(chǎn)廠家 由
相關(guān)部門召集專家進(jìn)行分析研究 制定出相應(yīng)的標(biāo)準(zhǔn) 制度和反措 有助于降低 DCS 故障的發(fā)生概率提高機(jī)組的安全運(yùn)行水平。