2009年3月5日 星期四

第一回 外商 Exchange Server 當機

本來想弄個圖文並茂的,無奈blogger 的工具對於上傳圖片設定一直有問題,所以只能文字敘述了。

這家外商的這台 Exchange 是 VIP 專用的,上面使用兩張光纖通道卡連接 EMC Storage ,一張光纖通道卡連接 IBM TS3310 Tape Library 。

之前就不知為什麼,這台主機設定 Zoning 之後,Tape Driver 認到的結果都很怪,最後是不知為什麼接 Tape 的那張卡可以透過別台主機的 Zoning 認到不屬於他的 Tape Driver 。

後來解決方式是將該主機的 Zoning 拿掉後就正常了,但是陸陸續續的又發生了一些問題,像有一次磁帶機忽然又消失無蹤,結果只好排一次停機日,去將所有 Tape 的驅動程式移除,再重新加回去,然後重開機。

好不容易磁帶機回來的,可是 NBU 仍然不能使用,後來又發現是有名的防毒軟體(賣咖啡)的企業版裏定義的某個 Policy 去阻擋 NBU 的程式存取磁帶機設備,將該 Policy 拿掉就好了。

而這一次呢,又莫明奇妙的當機,而且設備重開機後一直開不起來,一直到使用者將連接磁帶機的那張光纖通道卡的線拔掉後,設備就開的起來,重開後的 Windows Event Log 沒有任何線索可查,後來我推測是光纖通道卡認磁帶機那張不知為什麼又認不到設備了,而我觀察的結果,San Switch 的 Zoning 裏有一筆其他的共用的磁帶機,目前己經沒有在使用。

尤於之前接續時,這個磁帶機就存在了,而且之前就一直有問題,問過使用者後,確認該設備沒在使用,就先將該 Zoning 設定移除。

移除之後再重新接續設備時,IBM 的 TS3310 就很正常順利的認到,而且沒有重新開機(理論上動態將光纖通道的設備加入,本來就不需要重開),NBU 運作設備掃瞄的狀況看起來也正常。

接下來就看 User 端何時備份,當機的狀況會不會再發生。