其實這個問題滿多人遇到的,也滿多人問過小弟我…剛好前幾天看到神人在FB PO了這個連結,所以就想說,那稍微做個整理後,給大家當個參考,有興趣的朋友,可以去底下的參考資料看原文喔!!~
Azure VM為什麼會重新啟動,大家想想看自己電腦上,甚麼時候一定會重新啟動!?…是的,當然就是更新後重新開機了QQ;Windows Azure當然也不例外,不可能上雲端的電腦就不用更新吧,又不是惡魔鋼彈會自我再生,自我進化QQ… ( 請參考動漫 機動武鬥傳G.. )
而根據內文所述,大約2~3個月,Windows Azure上的VM,就會因為要更新而重新啟動…所以,通常2~3個月就會遇到一次重新啟動的問題…那大家第一個一定會抱怨,掯!!放到雲端上,還給我重新啟動,那我幹啥丟到Azure…Azure怎麼那麼ooxx!!
也先不要急嘛,我們繼續看下去。
另外,也提醒大家一點,關於這部分的更新與重新啟動…Microsoft是不會通知的!! ( 不會通知的…不會通知的…不會通知的……… )
所以沒收到mail的通知,是很正常的…
最重要最重要的是,目前是沒有任何選項,提供我們將自動更新的功能關閉的!!
好,以上是一部分會自動重新開機,而不會通知…
那另外一部分,當然就是Windows Azure偵測到目前的環境有問題,而進行轉移的動作,這個動作中,有可能會連線中斷,而且根據內文所敘述,也會在Windows Server的事件log紀錄有重新開機的事件。
好,講了那麼多,那大家第一個疑惑,所謂的SLA 99.95呢!!?,所謂的高可用性呢!?,所謂的雲勒!!?
其實在每次的Azure場次,都一定可以聽到大師們講SLA 99.95,而這些大師們都會苦口婆心的和大家說,SLA 99.95是要建構於兩台VM之上。
是的,重點就是兩台VM之上,所以如果要達到高可用性,請使用兩台VM。
無論是Microsoft的更新機制,或是偵測到故障轉移的情況下,Microsoft都有預設的機制(故障域和更新域)可以讓這兩台Server不會同時的更新與轉移,也因此,當一台在更新重新開機的時候,還有另外一台撐著;也因此,才有辦法達到SLA 99.95的高可用性。
所以別忘了,如果只有一台,是有停機的可能性的,而只有兩台以上,才會達到SLA 99.95…
最後,文章後面也提到,目前的確還是沒有更新通知的計畫,但如果大家覺得這很重要 ( 因該沒人覺得不重要吧…Orz… ),也可以反饋給Microsoft…搞不好,未來就會有通知的功能了喔!!揪咪!!